OpenAI-მ გამოუშვა GPT-5 — ხელოვნური ინტელექტის უახლესი სისტემა, რომელიც დაფუძნებულია o1 და o3 მოდელების საუკეთესო „თვისებებზე“. GPT-5-ში გაერთიანებულია ყველა წინა შემუშავება ერთიან ადაპტაციურ არქიტექტურაში.
კომპანიის წარმომადგენლების თქმით, ასეთი კონსტრუქცია სისტემას საშუალებას აძლევს, მოახდინოს „აზროვნებითი ძალისხმევის“ ადაპტირება ყოველი ამოცანის სირთულესთან, რათა მიიღოს უფრო სანდო და ზუსტი პასუხები.
დღეს GPT-5 ხელმისაწვდომი ხდება ყველა Plus, Pro, Team მომხმარებლისთვის და მათთვისაც კი, ვინც უფასო ვერსიას იყენებს. Enterprise და Edu კლიენტებისთვის წვდომა მომავალ კვირას გაიხსნება.
ერთიანი სისტემა ადაპტური ანალიზით
OpenAI აცხადებს, რომ GPT-5 უბრალოდ მოდელი კი არა, მთელი სისტემაა. მოთხოვნების უმეტესობისთვის გამოიყენება სწრაფი და ეფექტური gpt-5-main. უფრო რთულ ამოცანებს წყვეტს gpt-5-thinking. სპეციალური ალგორითმი რეალურ დროში ირჩევს, რომელი მოდელი გამოიყენოს, კითხვის სირთულის, საუბრის კონტექსტის ან თუნდაც მომხმარებლის მკაფიო მინიშნებების მიხედვით, მაგალითად, „კარგად დაფიქრდი ამაზე“. ეს ალგორითმი მუდმივად უმჯობესდება მომხმარებლების უკუკავშირის წყალობით.
Pro მომხმარებლებს ასევე მიუწვდებათ ხელი GPT-5 Pro-ზე — ვერსიაზე, რომელიც კიდევ უფრო მეტ დროს ხარჯავს რთული საკითხების გააზრებაზე. OpenAI-ის მიერ მოხსენიებულ ტესტებში, გარე ექსპერტებმა რთული შემთხვევების 67,8%-ში უპირატესობა მიანიჭეს GPT-5 Pro-ს და არა GPT-5 thinking-ს.
უფრო მაღალი პროდუქტიულობა ტესტებში და რეალურ ამოცანებში
OpenAI აცხადებს, რომ GPT-5 ადგენს ახალ სტანდარტებს პროგრამირებაში, ჯანდაცვასა და წერით ხელოვნებაში. პროგრამირებაში მოდელი შესანიშნავად უნდა ართმევდეს თავს რთული ინტერფეისების შექმნასა და დიდი კოდების ბაზების გამართვას. კომპანიის მონაცემებით, GPT-5 აღწევს 74,9%-ს SWE-bench Verified-ზე და 88%-ს Aider Polyglot-ზე, ამცირებს შეცდომების რაოდენობას 2/3-ით o3-თან შედარებით.
მოდელი ასევე მიზნად ისახავს ჯანმრთელობასთან დაკავშირებულ კითხვებზე უფრო ზუსტი პასუხების გაცემას, მოქმედებს როგორც „აქტიური თანამოსაუბრე“, რომელიც სვამს დამაზუსტებელ შეკითხვებს. რთულ HealthBench Hard ტესტში GPT-5 მოდელმა 46,2% დააგროვა, მაშინ როცა o3-მა 31,6%. თუმცა, OpenAI ხაზს უსვამს, რომ GPT-5 არ ჩაანაცვლებს ექიმს. სხვა ტესტები მსგავს შედეგებს აჩვენებს, მათ შორის 94,6% AIME 2025-ზე (მათემატიკა, ხელსაწყოების გარეშე) და 84,2% MMMU-ზე (მულტიმოდალური გაგება). გავრცელებული ინფორმაციით, GPT-5 Pro აგროვებს 88,4%-ს GPQA ტესტზე, სადაც ძალიან რთულ სამეცნიერო კითხვებზე უნდა გაიცეს პასუხი.
ნაკლები ჰალუცინაციები, მეტი გამჭვირვალობა
ჰალუცინაციების რაოდენობის შემცირება GPT-5-ის ერთ-ერთი მთავარი დაპირებაა. OpenAI-ის თქმით, ვებ-ძიების ჩართვისას, მოდელში ფაქტობრივი შეცდომების ალბათობა დაახლოებით 45%-ით დაბალია, ვიდრე GPT-4o-ში. „thinking“ რეჟიმში შეცდომების რაოდენობა 80%-ით მცირდება o3-თან შედარებით. ღია, ფაქტებზე დაფუძნებულ ტესტებში, როგორიცაა LongFact და FActScore, GPT-5 დაახლოებით 6-ჯერ ნაკლებ ჰალუცინაციას იძლევა, ვიდრე o3.

ვებ-ძიების გარეშეც კი, გაუმჯობესებები აშკარაა. LongFact-Concepts, LongFact-Objects და FActScore ტესტებში GPT-5-ის (thinking) ჰალუცინაციების დონე საშუალოდ 0,8-დან 1,4%-მდეა, ხოლო o3-ის შემთხვევაში — 24-დან 38%-მდე. ეს ნიშნავს, რომ GPT-5 5-ჯერ მეტად ნაკლებ ფაქტობრივ შეცდომას უშვებს, ვიდრე o3, ვებ-მონაცემებზე წვდომის გარეშეც კი.
მოდელი ისეა შემუშავებული, რომ პატიოსნად აღიაროს თავისი შეზღუდვები. ერთ-ერთი ტესტის დროს მოდელებს უსვამდნენ კითხვებს CharXiv ბენჩმარკიდან არარსებული სურათების შესახებ. OpenAI-ის მონაცემებით, o3 შემთხვევების 86,7%-ში იძლეოდა დამაჯერებელ, გამოგონილ პასუხებს, ხოლო GPT-5 ამას მხოლოდ 9%-ში აკეთებდა. საერთო ჯამში, ცრუ პასუხების წილი წარმომადგენლობით დიალოგებში შემცირდა o3-ის 4,8%-დან GPT-5-ის 2,1%-მდე.
„Safe Completions“: ახალი მიდგომა ხელოვნური ინტელექტის უსაფრთხოების უზრუნველსაყოფად
GPT-5-ში გამოჩნდა უსაფრთხოების ახალი სისტემა — “Safe Completions”. ამის შესახებ დეტალურად არის მოთხრობილი კვლევით სტატიაში. ის ცვლის „მკაცრი უარის“ ძველ მეთოდს, რომელიც OpenAI-ს ზედმეტად კატეგორიულად მიაჩნდა, განსაკუთრებით რთულ და ორაზროვან თემებში. რადგან ასეთი თემებიდან მიღებული ინფორმაცია შეიძლება გამოყენებულ იქნას როგორც ზიანისთვის, ასევე სარგებლობისთვის.
მოთხოვნების სრულად დაბლოკვის ნაცვლად, GPT-5 კონცენტრირდება გამოტანის უსაფრთხოების უზრუნველყოფაზე. მოდელი ცდილობს გასცეს მაქსიმალურად სასარგებლო პასუხი უსაფრთხოების წესების ფარგლებში, რაც შეიძლება ნიშნავდეს მაღალი დონის, ნაწილობრივ ან ალტერნატიულ პასუხს. OpenAI-ის მონაცემებით, ადამიანმა ექსპერტებმა ეს მიდგომა უფრო უსაფრთხოდ, სასარგებლოდ და დაბალანსებულად მიიჩნიეს. ამის შესაბამისად, GPT-5-thinking მოდელმა მიიღო „მაღალი პროდუქტიულობის“ შეფასება ბიოლოგიასა და ქიმიაში OpenAI-ის ტესტირების შედეგად. ექსპერტებმა, მათ შორის CAISI-ის (აშშ) და UK AISI-ის სპეციალისტებმა, 5000 საათზე მეტი იმუშავეს მისი შესაძლებლობების შესაფასებლად.
ახალი ხელსაწყოები და მეტი შესაძლებლობა დეველოპერებისთვის
GPT-5 API-ში ამატებს რამდენიმე ახალ ფუნქციას. ახლა დეველოპერებს შეუძლიათ დააყენონ მოდელის მსჯელობის სირთულე და სიტყვიერება. „Custom Tools“-ის გამოძახება შესაძლებელია ჩვეულებრივი ტექსტით და არა მკაცრი JSON-ით, რაც შეამცირებს შეცდომების რაოდენობას რთულ შეყვანის მონაცემებთან მუშაობისას. კონტექსტური ფანჯარა გაფართოვდა 272 000 შეყვანის ტოკენამდე და 128 000 გამომავალი ტოკენამდე.
API გთავაზობთ მოდელების სამ ზომას: gpt-5, gpt-5-mini და gpt-5-nano. OpenAI აცხადებს, რომ gpt-5 არის „აზროვნების“ ყველაზე მძლავრი ვარიანტი, რომლის ღირებულება იწყება 1,25 დოლარიდან მილიონ შეყვანის ტოკენზე და 10 დოლარიდან მილიონ გამომავალ ტოკენზე.

თავად ChatGPT გარკვეულ ცვლილებებს განიცდის. ახალი მოდელი გაცილებით ნაკლებად „მაამებელი“ გახდა — OpenAI-ის მონაცემებით, ტესტირებისას ასეთი ქცევა 14,5%-დან 6%-ზე ნაკლებამდე შემცირდა. მომხმარებლებს ასევე შეეძლებათ თავიანთი ჩატების ვიზუალური იერსახის მორგება და, წინასწარი ვერსიის სახით, ოთხი წინასწარ დაყენებული კომუნიკაციის სტილიდან ერთ-ერთის არჩევა, როგორიცაა „ცინიკოსი“ ან „ბოტანიკოსი“.
ცადეთ: https://chatgpt.com/