ჩინურმა კომპანია Alibaba-მ გამოაცხადა Qwen 3-ის გამოშვების შესახებ, რაც მათი ხელოვნური ინტელექტის მოდელების ახალი ოჯახია, რომელიც ღია ლიცენზიით ვრცელდება. გავრცელებული ინფორმაციით, ფლაგმანი მოდელი Qwen3-235B-A22B შედარებადია DeepSeek-R1, o1, o3-mini, Grok-3 და Gemini-2.5-Pro-სთან.

Qwen 3-ის ოჯახი პრობლემების გადაჭრის ჰიბრიდულ მიდგომას წარმოადგენს. ისინი მხარს უჭერენ ორ რეჟიმს:

აზროვნების რეჟიმი, რომლის დროსაც ნეირონული ქსელი დროს უთმობს ეტაპობრივად ფიქრს საბოლოო პასუხის გაცემამდე. ეს შესაფერისია რთული ამოცანებისთვის, რომლებიც უფრო ღრმა აზროვნებას საჭიროებს.
„უფიქრო“ რეჟიმი: ამ შემთხვევაში მოდელი იძლევა სწრაფ, „თითქმის მყისიერ პასუხებს“, რაც გამოსადეგია მარტივი კითხვებისთვის, სადაც პასუხების გაცემის სიჩქარე უფრო მნიშვნელოვანია, ვიდრე მათი სიღრმე.
ოჯახის ზოგიერთი მოდელი აგებულია შერეული ექსპერტების (MoE) არქიტექტურაზე. MoE ზრდის გამოთვლით ეფექტურობას ამოცანების ნაწილებად დაყოფისა და სპეციალიზებულ ქვედანაყოფებზე გადაცემის ხარჯზე.

აი, ამ ტექსტის ქართული თარგმანი:

Qwen 3-ის მოდელების უმეტესობა უკვე ხელმისაწვდომია ან მალე ხელმისაწვდომი გახდება ჩამოსატვირთად ღია ლიცენზიით Hugging Face-სა და GitHub-ის პლატფორმებზე. მათი ზომა 600 მილიონიდან 235 მილიარდ პარამეტრამდე მერყეობს.

Qwen 3-ის ხელოვნური ინტელექტის მოდელების გამოყენება ასევე შესაძლებელია ვებ-ვერსიაში ან ახალ, ამავე სახელწოდების აპლიკაციებში შესაბამის მობილურ პლატფორმებზე.

წინა სტატიაNothing-მა CMF Phone 2 Pro წარმოადგინა

პასუხის გაცემა

შეიყვანეტ კომენტარის ტექსტი
შეიყვანეთ თქვენი სახელი