გამოვიდა GPT-4

OpenAI-მ გამოაქვეყნა ახალი გამოსახულების და ტექსტის ინტერპრეტაციის AI მოდელი, GPT-4, რომელსაც კომპანია უწოდებს „ახალ ეტაპს ღრმა დასსწავლის განვითარებაში“.

დეველოპერების თქმით, GPT-4-ს შეუძლია მიიღოს სურათები და ტექსტი შეყვანად – GPT-3.5 მუშაობს მხოლოდ ტექსტით – და ასრულებს “ადამიანურ დონეზე” სხვადასხვა პროფესიულ და აკადემიურ ტესტებში, დეველოპერების თქმით. ასე რომ, ერთიან ადვოკატთა გამოცდაზე, LSAT, SAT მათემატიკის და SAT მტკიცებულებებზე დაფუძნებული კითხვა და წერა გამოცდებში, GPT-4-მა მიიღო 88% ან მეტი ქულა.

Announcing GPT-4, a large multimodal model, with our best-ever results on capabilities and alignment: https://t.co/TwLFssyALF pic.twitter.com/lYWwPjZbSg
— OpenAI (@OpenAI) March 14, 2023

OpenAI-მ ექვსი თვე გაატარა GPT-4-ის შესწორებაზე საპირისპირო ტესტირების პროგრამების, ასევე ChatGPT-ის გამოყენებით, რის შედეგადაც გაუმჯობესდა შედეგები გაცემასა და მართვაში. მოდელი 82%-ით ნაკლებია ალბათობით უპასუხებს მოთხოვნებს აკრძალულ კონტენტზე და 40%-ით უფრო მეტად გამოიმუშავებს სწორ პასუხებს.

ნორმალურ საუბარში, განსხვავება GPT-3.5-სა და GPT-4-ს შორის შეიძლება ოდნავ შესამჩნევი იყოს, განმარტავს OpenAI. „განსხვავება აშკარა ხდება მაშინ, როდესაც ამოცანის სირთულე აღწევს საკმარის ზღვარს – GPT-4 არის უფრო საიმედო, კრეატიული და შეუძლია ბევრად უფრო დახვეწილი ინსტრუქციების დამუშავება, ვიდრე GPT-3.5“, აღნიშნავს კომპანია.

GPT-4-ს შეუძლია მოაწეროს ხელი და ინტერპრეტაციაც კი მოახდინოს შედარებით რთულ სურათებზე, როგორიცაა Lightning კაბელის ადაპტერის იდენტიფიცირება დაკავშირებული iPhone-ის სურათიდან და ა.შ.

გამოსახულების ამოცნობა ჯერ არ არის ხელმისაწვდომი ყველა OpenAI კლიენტისთვის – OpenAI ცდის მას Be My Eyes-ით. GPT-4-ზე დაფუძნებული კომპანიის ახალ ფუნქციას “ვირტუალური მოხალისე” შეუძლია უპასუხოს კითხვებს მათთვის გაგზავნილ სურათებთან დაკავშირებით. მაგალითად, თუ მომხმარებელი აგზავნის მაცივრის ფოტოს შიგნიდან, ვირტუალურ მოხალისეს შეუძლია არა მხოლოდ სწორად განსაზღვროს რა არის მასში, არამედ გააანალიზოს რა შეიძლება მომზადდეს ამ ინგრედიენტებისგან. ინსტრუმენტი ასევე შემოგთავაზებთ რეცეპტების მთელ რიგს და გამოგიგზავნით ნაბიჯ-ნაბიჯ სამზარეულოს სახელმძღვანელოს.

პოტენციურად უფრო მნიშვნელოვანი გაუმჯობესება არის მართვის ინსტრუმენტარიუმის ნაკრები. GPT-4-ით OpenAI შემოაქვს API-ის ახალ ფუნქციას, „სისტემის“ შეტყობინებებს, რომელიც დეველოპერებს საშუალებას აძლევს დააყენონ სტილი და მიზნები კონკრეტული მიმართულებების აღწერით. სისტემური შეტყობინებები არსებითად არის ინსტრუქციები, რომლებიც ადგენენ ტონს და ადგენენ საზღვრებს AI-სთან მომდევნო ურთიერთქმედებისთვის.

მაგალითად, სისტემური შეტყობინება შეიძლება ასე გამოიყურებოდეს: „თქვენ ხართ მენტორი, რომელიც ყოველთვის პასუხობს სოკრატული სტილით. თქვენ არასოდეს აძლევთ სტუდენტს პასუხს, მაგრამ ყოველთვის ცდილობთ დაუსვათ სწორი შეკითხვა, რათა დაეხმაროთ მას ისწავლოს საკუთარი თავის აზროვნება. ყოველთვის უნდა შეესაბამებოდეს თქვენი შეკითხვა სტუდენტის ინტერესებსა და ცოდნას, დაყავით პრობლემა უფრო მარტივ ნაწილებად, სანამ არ მიაღწევთ სწორ დონეს.

თუმცა, ახლაც OpenAI აღიარებს, რომ GPT-4 არ არის სრულყოფილი. ის ჯერ კიდევ „ჰალუცინებს“ და ცდება განსჯაში. ერთ მაგალითში, ჩატბოტმა ელვის პრესლის უწოდა “მსახიობის შვილი” – ეს აშკარა შეცდომაა.

დეველოპერები აღნიშნავენ, რომ “GPT-4 ზოგადად არ იცის მოვლენების შესახებ, რომლებიც მოხდა 2021 წლის სექტემბრის შემდეგ.” ზოგჯერ ჩეთბოტს შეუძლია დაუშვას მარტივი ლოგიკური შეცდომები ან იყოს ზედმეტად გულგრილი, შეცდომით შეასრულოს მომხმარებლის აშკარა ცრუ განცხადებები სიმართლეში. ასევე, AI არ არის სრულყოფილი რთული პრობლემების გადაჭრაში.

GPT-4 ხელმისაწვდომია OpenAI Waitlist API-ით, ისევე როგორც ChatGPT Plus, Premium OpenAI გეგმის ChatGPT-ისთვის. Microsoft-მა ადრე დაადასტურა, რომ მისი Bing chatbot მუშაობს GPT-4-ზე. მოდელი უკვე იყენებს Stripe-ს ბიზნეს ვებსაიტების მოსაძიებლად და რეზიუმეების გაგზავნისთვის მომხმარებელთა მხარდაჭერის პერსონალისთვის, ასევე Duolingo-სთვის, რომელმაც ის ჩააშენა ენის შესწავლის ახალ სააბონენტო დონეზე.

მანამდე OpenAI-ის აღმასრულებელმა დირექტორმა სემ ალტმანმა განაცხადა, რომ GPT-4 არ იქნება ყველაზე დიდი ენობრივი მოდელი. ალტმანმა ასევე აღიარა, რომ კაცობრიობა ჯერ კიდევ შორს არის სრულყოფილი ხელოვნური ინტელექტის შემუშავებისგან.