Anthropic ავრცელებს Opus 4.5-ს Chrome-ისა და Excel-ის ახალი ინტეგრაციებით

ორშაბათს, Anthropic-მა გამოაცხადა Opus 4.5, მისი ფლაგმანი მოდელის უახლესი ვერსია. ეს არის Anthropic-ის 4.5 სერიის მოდელების ბოლო გამოშვება, მას შემდეგ რაც Sonnet 4.5 სექტემბერში და Haiku 4.5 ოქტომბერში გამოვიდა.

როგორც მოსალოდნელი იყო, Opus-ის ახალ ვერსიას აქვს უახლესი შესრულება სხვადასხვა ბენჩმარკზე, მათ შორის კოდირების ბენჩმარკებზე (SWE-Bench და Terminal-bench), ხელსაწყოების გამოყენებაზე (tau2-bench და MCP Atlas) და ზოგად პრობლემების გადაწყვეტაზე (ARC-AGI 2, GPQA Diamond).

აღსანიშნავია, რომ Opus 4.5 არის პირველი მოდელი, რომელმაც 80%-ზე მეტი ქულა მიიღო SWE-Bench verified-ზე, პატივცემულ კოდირების ბენჩმარკზე.

Anthropic-მა ასევე ხაზი გაუსვა Opus-ის კომპიუტერული გამოყენებისა და ცხრილების შესაძლებლობებს და გამოუშვა არაერთი პარალელური პროდუქტი, რათა წარმოეჩინა, თუ როგორ მუშაობს მოდელი ამ პირობებში. Opus 4.5-თან ერთად, Anthropic უფრო ფართოდ გახდის ხელმისაწვდომს თავის Claude for Chrome და Claude for Excel პროდუქტებს — რომლებიც ადრე საპილოტე რეჟიმში იყო. Chrome-ის გაფართოება ხელმისაწვდომი იქნება ყველა Max მომხმარებლისთვის, ხოლო Excel-ზე ორიენტირებული მოდელი ხელმისაწვდომი იქნება Max, Team და Enterprise მომხმარებლებისთვის.

Opus 4.5 ასევე მოყვება მეხსიერების გაუმჯობესებებს გრძელვადიანი კონტექსტური ოპერაციებისთვის, რამაც მნიშვნელოვანი ცვლილებები მოითხოვა იმაში, თუ როგორ მართავს მოდელი თავის მეხსიერებას.

„არსებობს გაუმჯობესებები, რომლებიც ჩვენ განვახორციელეთ ზოგადი გრძელი კონტექსტის ხარისხის თვალსაზრისით Opus 4.5-თან ერთად ვარჯიშისას, მაგრამ კონტექსტური ფანჯრები თავისთავად საკმარისი არ იქნება“, — განუცხადა TechCrunch-ს დაიან ნა პენმა, Anthropic-ის პროდუქტის მენეჯმენტის ხელმძღვანელმა კვლევის მიმართულებით. „სწორი დეტალების დამახსოვრება ნამდვილად მნიშვნელოვანია, როგორც დამატება უბრალოდ უფრო გრძელი კონტექსტური ფანჯრის ქონისა.“

ამ ცვლილებებმა ასევე შესაძლებელი გახადა დიდი ხნის მოთხოვნილი „უსასრულო ჩატის“ ფუნქცია ფასიანი Claude მომხმარებლებისთვის, რაც ჩატებს საშუალებას მისცემს გაგრძელდეს შეფერხების გარეშე, როდესაც მოდელი მიაღწევს თავის კონტექსტურ ფანჯარას. ამის ნაცვლად, მოდელი შეკუმშავს თავის კონტექსტურ მეხსიერებას მომხმარებლის გაფრთხილების გარეშე.

მრავალი განახლება განხორციელებულია აგენტური გამოყენების შემთხვევების გათვალისწინებით, განსაკუთრებით სცენარებში, სადაც Opus მოქმედებს როგორც მთავარი აგენტი, რომელიც მართავს Haiku-ზე მომუშავე სუბ-აგენტების ჯგუფს. ამ ამოცანების მართვა მოითხოვს სამუშაო მეხსიერების ძლიერ კონტროლს, სადაც პენის მიერ აღწერილი მეხსიერების გაუმჯობესებები ნამდვილად ავლენს მათ ღირებულებას.

„ეს არის ადგილი, სადაც ისეთი საფუძვლები, როგორიცაა მეხსიერება, ნამდვილად მნიშვნელოვანი ხდება“, — ამბობს პენი, „რადგან კლოდს უნდა შეეძლოს კოდების ბაზებისა და დიდი დოკუმენტების შესწავლა, ასევე იცოდეს, როდის უნდა დაბრუნდეს უკან და ხელახლა შეამოწმოს რაიმე.“

Opus 4.5-ს სერიოზული კონკურენცია ელის სხვა ახლად გამოშვებული სასაზღვრო მოდელებისგან, განსაკუთრებით OpenAI-ის GPT 5.1-ისგან (გამოვიდა 12 ნოემბერს) და Google-ის Gemini 3-ისგან (გამოვიდა 18 ნოემბერს).

კომენტარის დატოვება

თქვენი ელფოსტის მისამართი გამოქვეყნებული არ იყო. აუცილებელი ველები მონიშნულია *