კანადური სტარტაპი Taalas გამოვიდა „ფარული-რეჟიმიდან“ და წარმოადგინა პირველი პროდუქტი — სპეციალიზებული ჩიპი HC1 „ჩაშენებული“ (hardcoded) Llama 3.1 8B-ით. მოდელი არ იტვირთება მეხსიერებაში, არამედ პირდაპირ კრემნიუმშია ჩაწნეხილი: წონები ტრანზისტორებშია ჩაპროგრამებული წარმოების ეტაპზე. შედეგი — 17 000 ტოკენი წამში ერთ მომხმარებელზე, რაც თითქმის 10-ჯერ სწრაფია არსებულ GPU გადაწყვეტილებებზე, წარმოების ღირებულების 20-ჯერ შემცირებისა და ენერგიის 10-ჯერ დაზოგვის პირობებში.
Taalas დააარსა ლუბიშა ბაიჩმა — კიდევ ერთი ჩიპმეიკერის, Tenstorrent-ის დამფუძნებელმა და AMD-ს ინტეგრირებული სქემების პროექტირების ყოფილმა დირექტორმა. მასთან ერთად კომპანია მისმა მეუღლემ, ლეილა ბაიჩმა (ექს-AMD, ექს-ATI) და დრაგო იგნიატოვიჩმა (ექს-AMD, ექს-Tenstorrent) ჩამოაყალიბეს. მას შემდეგ, რაც Tenstorrent-ში ლეგენდარული ჩიპ-დიზაინერი ჯიმ კელერი მოვიდა და CEO-ს პოსტი დაიკავა, ბაიჩი წავიდა — და ნახევარ წელიწადში დაიწყო Taalas-ის მშენებლობა რადიკალურად განსხვავებული იდეით.
მიდგომის არსი — ტოტალური სპეციალიზაციაა. იმის ნაცვლად, რომ მოდელები უნივერსალურ GPU-ებზე გაუშვან, Taalas თითოეული მოდელისთვის ცალკე ჩიპს აწარმოებს. მიკროსქემის 100-ზე მეტი ფენიდან მხოლოდ ორი ზედა ლითონის ფენა იცვლება — მათში მონტაჟდება ე.წ. mask ROM recall fabric, სადაც წონები ინახება. ეს საშუალებას აძლევს TSMC-ს, მზა ჩიპი გამოუშვას ორ თვეში, ნაცვლად ექვსისა, რაც ტიპურია ჩვეულებრივი AI პროცესორისთვის. არქიტექტურა აერთიანებს მეხსიერებასა და გამოთვლებს ერთ კრისტალზე, რაც გამორიცხავს HBM-ის, რთული შეფუთვის, 3D-სტეკირებისა და თხევადი გაგრილების საჭიროებას.
ჯერჯერობით „ჩაშენებული“ Llama შორს არის წამყვანი (frontier) მოდელისგან, ხოლო აგრესიული კვანტიზაცია 3 და 6 ბიტამდე შესამჩნევად ამცირებს ხარისხს GPU ბენჩმარკებთან შედარებით. Taalas ამას აღიარებს და პროდუქტს პოზიციონირებს როგორც ბეტა-სერვისს დეველოპერებისთვის, რომლებსაც სურთ ექსპერიმენტები ჩაატარონ ინფერენსზე სუბმილიწამიანი დაყოვნებით. ჩიპი მხარს უჭერს კონტექსტური ფანჯრის მორგებასა და დამატებით სწავლებას LoRA-ადაპტერების მეშვეობით, ასე რომ მინიმალური მოქნილობა შენარჩუნებულია.
კომპანიამ 200 მილიონ დოლარზე მეტი მოზიდა (ბოლო რაუნდი — $169 მლნ Quiet Capital-ისგან, Fidelity-სა და ნახევარგამტარების ვეტერან პიერ ლამონდისგან), თუმცა ჯერჯერობით მხოლოდ $30 მილიონი დახარჯა — 24 თანამშრომლის ხელფასებსა და შემუშავებაზე. შემდეგი ჩიპი HC1 პლატფორმაზე იქნება საშუალო ზომის ლოგიკური მსჯელობის მოდელი (მოსალოდნელია გაზაფხულზე), ხოლო ზამთრისთვის მეორე თაობის HC2 პლატფორმაზე მოწინავე LLM-ის გაშვებას გვპირდებიან. თუ Taalas შეძლებს ამ მიდგომის მასშტაბირებას დიდ მოდელებზე, Nvidia-ს და ისეთ კონკურენტებს, როგორიცაა Cerebras და Groq, შეიძლება მოულოდნელი მეტოქე გამოუჩნდეთ — მათგან, ვინც სთავაზობს არა ძველი პარადიგმის აჩქარებას, არამედ მის გაუქმებას.