Google წარმოგიდგენთ მსჯელობის მოდელების ახალ თაობას Gemini 2.5

Google-მა წარმოადგინა Gemini 2.5 — ხელოვნური ინტელექტის საფუძველზე მსჯელობის მოდელების ახალი ოჯახი, რომლებიც ჩერდებიან, რათა „იფიქრონ“ კითხვაზე პასუხის გაცემამდე. მოდელების ახალი ოჯახის გასაშვებად, Google იწყებს Gemini 2.5 Pro Experimental-ს, მულტიმოდალურ, მსჯელ მოდელს AI-ს, რომელსაც კომპანია დღემდე ყველაზე ინტელექტუალურ მოდელს უწოდებს.

ეს მოდელი ხელმისაწვდომი იქნება სამშაბათს Google AI Studio-ს დეველოპერის პლატფორმაზე, ისევე როგორც Gemini-ის აპლიკაციაში Gemini Advanced-ის ხელმომწერებისთვის თვეში 20 დოლარად.

მომავალში Google აცხადებს, რომ მისი ხელოვნური ინტელექტის ყველა ახალ მოდელს ექნება მსჯელობის შესაძლებლობები.

მას შემდეგ, რაც OpenAI-მ 2024 წლის სექტემბერში გამოუშვა მსჯელობის პირველი მოდელი AI, o1, ტექნოლოგიური ინდუსტრია წინ მიიწევდა, რათა გაეთანაბრებინა ამ მოდელის შესაძლებლობები ან გადააჭარბა მათ საკუთარი. დღეს Anthropic-ს, DeepSeek-ს, Google-სა და xAI-ს აქვთ მსჯელობის AI მოდელები, რომლებიც იყენებენ დამატებით გამოთვლით ძალასა და დროს ფაქტების გადასამოწმებლად და პასუხის გაცემამდე პრობლემებზე მსჯელობისთვის.

მსჯელობის მეთოდებმა AI მოდელებს მათემატიკისა და კოდირების ამოცანებში ახალი სიმაღლეების მიღწევაში დაეხმარა. ტექნოლოგიების სამყაროში ბევრი თვლის, რომ მსჯელობის მოდელები გახდება AI აგენტების საკვანძო კომპონენტი, ავტონომიური სისტემები, რომლებსაც შეუძლიათ ამოცანების შესრულება მნიშვნელოვნად ადამიანის ჩარევის გარეშე. თუმცა, ეს მოდელები ასევე უფრო ძვირია.

Google-მა უკვე ჩაატარა ექსპერიმენტი მსჯელობის AI მოდელებთან, დეკემბერში გამოუშვა Gemini-ის „მოაზროვნე“ ვერსია. მაგრამ Gemini 2.5 წარმოადგენს კომპანიის ყველაზე სერიოზულ მცდელობას, გადააჭარბოს OpenAI o მოდელების სერიას.

Google ამტკიცებს, რომ Gemini 2.5 Pro აღემატება თავის წინა მოწინავე AI მოდელებს და ზოგიერთ წამყვან კონკურენტ AI მოდელს რამდენიმე მეტრიკით. კერძოდ, Google აცხადებს, რომ შეიმუშავა Gemini 2.5, რათა წარმატებით შეექმნა ვიზუალურად მიმზიდველი ვებ აპლიკაციები და აგენტის კოდირების აპლიკაციები.

Google-ის თანახმად, კოდის რედაქტირების შეფასების დროს, სახელწოდებით Aider Polyglot Gemini 2.5 Pro-მ 68,6% დააგროვა, რაც აღემატება OpenAI-ს, Anthropic-სა და ჩინური AI DeepSeek ლაბორატორიის წამყვან AI მოდელებს.

თუმცა, სხვა ტესტში, რომელიც ზომავს პროგრამული უზრუნველყოფის განვითარების შესაძლებლობებს, SWE-bench Verified, Gemini 2.5 Pro-მ 63,8% დააგროვა, რაც აღემატება OpenAI o3-mini-სა და DeepSeek R1-ს, მაგრამ ჩამორჩება Anthropic-ის Claude 3.7 Sonnet-ს, რომელმაც 70,3% დააგროვა.

Google-ის თანახმად, კაცობრიობის ბოლო გამოცდაზე, მულტიმოდალურ ტესტში, რომელიც შედგება ათასობით კითხვისგან, რომლებსაც სვამენ კრაუდსორსინგით და ეხება მათემატიკას, ჰუმანიტარულ და საბუნებისმეტყველო მეცნიერებებს, Gemini 2.5 Pro-მ 18,8% დააგროვა, რაც უფრო მაღალია, ვიდრე კონკურენტების ფლაგმანი მოდელების უმეტესობა.

დასაწყისისთვის, Google აცხადებს, რომ Gemini 2.5 Pro მოყვება 1 მილიონი ტოკენის კონტექსტური ფანჯარა, რაც იმას ნიშნავს, რომ AI მოდელს შეუძლია ერთდროულად დაახლოებით 750000 სიტყვის აღქმა. ეს უფრო მეტია, ვიდრე ბეჭდების მბრძანებლის მთელი სერია. და მალე Gemini 2.5 Pro მხარს დაუჭერს ორმაგ შეყვანის სიგრძეს (2 მილიონი ტოკენი).

Google-ს არ გამოუქვეყნებია Gemini 2.5 Pro-ს API-ს ფასები. კომპანია აცხადებს, რომ უფრო დეტალურ ინფორმაციას უახლოეს კვირებში გააზიარებს.

Google წარმოგიდგენთ მსჯელობის მოდელების ახალ თაობას Gemini 2.5

გაზიარება:

Tags:

დაკავშირებული პოსტები

ათეისტი ევოლუციონისტი მეცნიერი Anthropic-ის Claude-ს 72 საათის განმავლობაში ესაუბრა და ახლა სჯერა, რომ ის ცნობიერია

სემ ალტმანის პროექტი World ვერიფიკაციის ტექნოლოგიას გაცნობის აპლიკაციებში ნერგავს

YouTube-მა სმარტ ტელევიზორებზე 90-წამიანი გამოუტოვებელი რეკლამების ჩვენება დაიწყო

CERN-ში მონაცემთა მასივების გასაფილტრად ჩიპებში ინტეგრირებულ სპეციალურ AI-მოდელებს იყენებენ

Google-მა Maps-ის ყველაზე მასშტაბური განახლება წარადგინა

კომენტარები

ახალი კომენტარის დაწერა