Anthropic: DeepSeek-ი, Moonshot-ი და MiniMax-ი ფარულად წვრთნიდნენ თავიანთ მოდელებს Claude-ის პასუხებზე

Anthropic: DeepSeek-ი, Moonshot-ი და MiniMax-ი ფარულად წვრთნიდნენ თავიანთ მოდელებს Claude-ის პასუხებზე

Anthropic-ის განცხადებით, მათ აღმოაჩინეს, რომ სამი ჩინური AI-ლაბორატორია — DeepSeek-ი, Moonshot-ი და MiniMax-ი — მასობრივად მოიპოვებდა Claude-ის პასუხებს, რათა მათზე საკუთარი მოდელები გაეწვრთნათ. ჯამში მათ 16 მილიონზე მეტი მოთხოვნა დააგენერირეს დაახლოებით 24 000 ყალბი ანგარიშის მეშვეობით.

ამ მეთოდს დისტილაცია ეწოდება: იღებთ ძლიერ მოდელს, აწვდით ათასობით პრომპტს, აგროვებთ პასუხებს და იყენებთ მათ, როგორც სასწავლო მონაცემებს თქვენი მოდელისთვის. თავისთავად ეს მეთოდი ლეგალური და გავრცელებულია, თუმცა მოცემულ შემთხვევაში ლაბორატორიებმა დაარღვიეს გამოყენების პირობები და გვერდი აუარეს რეგიონალურ შეზღუდვებს პროქსი-სერვისების გამოყენებით.

მასშტაბები ყველასთვის განსხვავებულია. DeepSeek — 150 000 მოთხოვნა, ამასთან მათ შორის იყო ამოცანები, სადაც Claude-ს სთხოვდნენ წარმოედგინა და ნაბიჯ-ნაბიჯ აღეწერა საკუთარი მსჯელობის ჯაჭვი. ფაქტობრივად, ასე იქმნება მზა მონაცემები მსჯელობის (reasoning) მოდელის გასაწვრთნელად. ასევე DeepSeek-ი იყენებდა Claude-ს „უსაფრთხო“ პასუხების შესაქმნელად პოლიტიკურად სენსიტიურ კითხვებზე — სავარაუდოდ, რათა ესწავლებინა თავისი მოდელისთვის ცენზურის ქვეშ მოქცეული თემებისთვის გვერდის ავლა. Moonshot — 3,4 მილიონი მოთხოვნა აგენტურ ქცევაზე, ინსტრუმენტებთან მუშაობასა და კოდზე ფოკუსირებით. MiniMax — რეკორდული 13 მილიონი, ასევე კოდი და ინსტრუმენტები. როდესაც Anthropic-მა ახალი მოდელი გამოუშვა, MiniMax-მა 24 საათში ტრაფიკის ნახევარი მისკენ გადაამისამართა.

Anthropic-მა შეტევები კონკრეტულ ლაბორატორიებს IP-მისამართების, მოთხოვნების მეტამონაცემებისა და ინფრასტრუქტურული მარკერების მიხედვით მიაკუთვნა. DeepSeek-ის შემთხვევაში მოხერხდა ანგარიშების მიკვლევა კონკრეტულ მკვლევარებამდე. Moonshot-ის შემთხვევაში მეტამონაცემები დაემთხვა უფროსი თანამშრომლების საჯარო პროფილებს.

წვდომა ხორციელდებოდა პროქსი-სერვისების მეშვეობით, რომლებიც მსხვილი მოდელების API-ებს გადაყიდიან. ერთი ასეთი ქსელი ერთდროულად 20 000-ზე მეტ ყალბ ანგარიშს მართავდა, რითაც დისტილაციის ტრაფიკს ჩვეულებრივი კლიენტების მოთხოვნებში ურევდა.

Anthropic ხაზს უსვამს, რომ დისტილირებული მოდელები კარგავენ დამცავ მექანიზმებს — ფილტრებს ბიოიარაღის შექმნაზე, მავნე კოდზე და ა.შ. ასევე, ასეთი შეტევები ძირს უთხრის ექსპორტის კონტროლის არსს: გარედან ისე ჩანს, თითქოს ჩინური ლაბორატორიები თავად ვითარდებიან სწრაფად, როცა სინამდვილეში შესაძლებლობების ნაწილი უბრალოდ ამოღებულია ამერიკული მოდელებიდან.

გაზიარება:

დაკავშირებული პოსტები

ათეისტი ევოლუციონისტი მეცნიერი Anthropic-ის Claude-ს 72 საათის განმავლობაში ესაუბრა და ახლა სჯერა, რომ ის ცნობიერია
AI

ათეისტი ევოლუციონისტი მეცნიერი Anthropic-ის Claude-ს 72 საათის განმავლობაში ესაუბრა და ახლა სჯერა, რომ ის ცნობიერია

სემ ალტმანის პროექტი World ვერიფიკაციის ტექნოლოგიას გაცნობის აპლიკაციებში ნერგავს
AI

სემ ალტმანის პროექტი World ვერიფიკაციის ტექნოლოგიას გაცნობის აპლიკაციებში ნერგავს

Telegram-მა მესამე მხარის კლიენტების მომხმარებლების მონიშვნა დაიწყო. ასევე, მესენჯერმა მიიღო ხელოვნური ინტელექტის რედაქტორი და ბოტების ფაბრიკა
AI

Telegram-მა მესამე მხარის კლიენტების მომხმარებლების მონიშვნა დაიწყო. ასევე, მესენჯერმა მიიღო ხელოვნური ინტელექტის რედაქტორი და ბოტების ფაბრიკა

CERN-ში მონაცემთა მასივების გასაფილტრად ჩიპებში ინტეგრირებულ სპეციალურ AI-მოდელებს იყენებენ
AI

CERN-ში მონაცემთა მასივების გასაფილტრად ჩიპებში ინტეგრირებულ სპეციალურ AI-მოდელებს იყენებენ

Google თავის საუკეთესო პროდუქტიულობის ინსტრუმენტებს ფასიანს ხდის
AI

Google თავის საუკეთესო პროდუქტიულობის ინსტრუმენტებს ფასიანს ხდის

სტარტაპმა Taalas-მა ნეიროქსელი ჩიპში ჩააშენა და რეკორდული 17 000 ტოკენი წამში მიიღო
AI

სტარტაპმა Taalas-მა ნეიროქსელი ჩიპში ჩააშენა და რეკორდული 17 000 ტოკენი წამში მიიღო

კომენტარები

ახალი კომენტარის დაწერა