Alibaba-მ ახალი ხელოვნური მოდელები Qwen 3 გამოუშვა

ჩინურმა კომპანია Alibaba-მ გამოაცხადა Qwen 3-ის გამოშვების შესახებ, რაც მათი ხელოვნური ინტელექტის მოდელების ახალი ოჯახია, რომელიც ღია ლიცენზიით ვრცელდება. გავრცელებული ინფორმაციით, ფლაგმანი მოდელი Qwen3-235B-A22B შედარებადია DeepSeek-R1, o1, o3-mini, Grok-3 და Gemini-2.5-Pro-სთან.

Qwen 3-ის ოჯახი პრობლემების გადაჭრის ჰიბრიდულ მიდგომას წარმოადგენს. ისინი მხარს უჭერენ ორ რეჟიმს:

აზროვნების რეჟიმი, რომლის დროსაც ნეირონული ქსელი დროს უთმობს ეტაპობრივად ფიქრს საბოლოო პასუხის გაცემამდე. ეს შესაფერისია რთული ამოცანებისთვის, რომლებიც უფრო ღრმა აზროვნებას საჭიროებს.
„უფიქრო“ რეჟიმი: ამ შემთხვევაში მოდელი იძლევა სწრაფ, „თითქმის მყისიერ პასუხებს“, რაც გამოსადეგია მარტივი კითხვებისთვის, სადაც პასუხების გაცემის სიჩქარე უფრო მნიშვნელოვანია, ვიდრე მათი სიღრმე.
ოჯახის ზოგიერთი მოდელი აგებულია შერეული ექსპერტების (MoE) არქიტექტურაზე. MoE ზრდის გამოთვლით ეფექტურობას ამოცანების ნაწილებად დაყოფისა და სპეციალიზებულ ქვედანაყოფებზე გადაცემის ხარჯზე.

აი, ამ ტექსტის ქართული თარგმანი:

Qwen 3-ის მოდელების უმეტესობა უკვე ხელმისაწვდომია ან მალე ხელმისაწვდომი გახდება ჩამოსატვირთად ღია ლიცენზიით Hugging Face-სა და GitHub-ის პლატფორმებზე. მათი ზომა 600 მილიონიდან 235 მილიარდ პარამეტრამდე მერყეობს.

Qwen 3-ის ხელოვნური ინტელექტის მოდელების გამოყენება ასევე შესაძლებელია ვებ-ვერსიაში ან ახალ, ამავე სახელწოდების აპლიკაციებში შესაბამის მობილურ პლატფორმებზე.

Alibaba-მ ახალი ხელოვნური მოდელები Qwen 3 გამოუშვა

გაზიარება:

Tags:

დაკავშირებული პოსტები

CERN-ში მონაცემთა მასივების გასაფილტრად ჩიპებში ინტეგრირებულ სპეციალურ AI-მოდელებს იყენებენ

Anthropic: DeepSeek-ი, Moonshot-ი და MiniMax-ი ფარულად წვრთნიდნენ თავიანთ მოდელებს Claude-ის პასუხებზე

Google თავის საუკეთესო პროდუქტიულობის ინსტრუმენტებს ფასიანს ხდის

სტარტაპმა Taalas-მა ნეიროქსელი ჩიპში ჩააშენა და რეკორდული 17 000 ტოკენი წამში მიიღო

Alibaba Qwen 3.5: ღია კოდის AI, რომელიც დახურულ მოდელებს იწვევს

კომენტარები

ახალი კომენტარის დაწერა