Nvidia საფრთხეშია? SemiAnalysis-მა Google-ის TPU-ების ეფექტურობა შეაფასა

SemiAnalysis-ის უახლესი ანალიზი აჩვენებს, რომ Nvidia-ს მონოპოლიას სერიოზული მოწინააღმდეგე გამოუჩნდა. Google-მა თავისი TPU ხაზი მეშვიდე თაობის Ironwood-მდე მიიყვანა — ეს ჩიპები უკვე გამოიყენება ფლაგმანი მოდელების, როგორიცაა Gemini 3 და Claude 4.5 Opus, წვრთნისთვის, არანაკლები ეფექტურობით, ვიდრე კონკურენტის შემთხვევაში.

ამავდროულად, კომპანია TPU-ებს ხელოვნური ინტელექტის გამოთვლების გლობალურ ბაზარზე შემოაქვს. პირველი მაგალითია Google-ისა და Anthropic-ის მილიონი TPU v7 ჩიპის გარიგება. დაახლოებით 400 ათასი Ironwood, 10 მილიარდი დოლარის ღირებულების, Broadcom-მა Anthropic-ს პირდაპირ მზა თაროების სახით მიაწოდა, ხოლო ინფრასტრუქტურასა და მომსახურებას Fluidstack-ის ნეო-ღრუბელი და ყოფილი მაინერების, TeraWulf-ისა და Cipher Mining-ის, მონაცემთა ცენტრები აიღებენ თავის თავზე. დარჩენილ დაახლოებით 600 ათას TPU-ს Anthropic Google Cloud-ის საშუალებით იქირავებს, რასაც SemiAnalysis 42 მილიარდ დოლარად აფასებს. TPU-ების პარკის სწრაფად გაფართოებისთვის Google ეყრდნობა არა მხოლოდ საკუთარ მონაცემთა ცენტრებს, არამედ მცირე ღრუბლოვან ოპერატორებსაც. ასეთი „ნეო-ღრუბლები“ იღებენ გრძელვადიან იჯარას სხვა კომპანიების პლატფორმებს (მათ შორის ყოფილ კრიპტო-ფერმებს იაფი ელექტროენერგიით) და ავსებენ მათ TPU-ის თაროებით. ფინანსურ გარანტიებს ამასთანავე Google უზრუნველყოფს.

„ქაღალდის“ მახასიათებლებით TPU v7 ოდნავ ჩამორჩება Nvidia-ს უახლეს სერვერებს: Ironwood ოდნავ უთმობს GB200-ს პიკური გამოთვლითი სიმძლავრით და მეხსიერების გამტარუნარიანობით, და საგრძნობლად ჩამორჩება GB300-ს HBM-მეხსიერების მოცულობით (192 გბ 288 გბ-ის წინააღმდეგ). მაგრამ საკუთრების სრულ ღირებულებაში (TCO, total cost of ownership) სურათი საპირისპიროა. SemiAnalysis-მა გამოთვალა, რომ საკუთარი საჭიროებისთვის შეძენისას საკუთრების ღირებულება დაახლოებით 44%-ით დაბალია, ვიდრე GB200-ზე დაფუძნებული გადაწყვეტის შემთხვევაში, ხოლო გარე კლიენტებისთვის, უკვე Google-ის დანამატის გათვალისწინებით, TPU v7 მაინც 30%-მდე იაფია, ვიდრე GB200. ეს არ არის ოფიციალური მონაცემები, მაგრამ მათი დადასტურება შეიძლება იყოს ინფორმაცია, რომ Nvidia-მ OpenAI-ს 30%-იანი ფასდაკლება მისცა მას შემდეგ, რაც ეს უკანასკნელი TPU-ზე გადასვლას განიხილავდა.

სხვა მნიშვნელოვანი ფაქტორია არა პიკური წარმადობა ტერაფლოპსებში, არამედ ოპერაციების გამოყენების ეფექტურობა — FLOP-ის გამოყენების კოეფიციენტი (MFU, Model FLOP Utilization). Nvidia-სა და AMD-ს უყვართ პიკური FLOP-ების გადაჭარბება, ხანმოკლე მუშაობის რეჟიმებსა და ხელოვნურ ტესტებზე დაყრდნობით, მაშინ როდესაც მსხვილი მოდელების წვრთნისას რეალური დატვირთვა იშვიათად აღემატება პიკის 30%-ს. TPU-ის სპეციფიკაციები, პირიქით, უფრო „პატიოსნად“ ითვლება — FLOP-ის გამოყენების კოეფიციენტი მინიმუმ 40%-ად არის შეფასებული.

SemiAnalysis-ის გამოთვლებით, ეს ყველაფერი იმაზე მიუთითებს, რომ Anthropic-ისთვის, Google-ის მარჟისა და TPU-ის საათში დაახლოებით 1,60 დოლარის ტარიფის გათვალისწინებითაც კი, ეფექტური PFLOP-ის საკუთრების სრული ღირებულება GB300-თან შედარებით დაახლოებით 52%-ით ნაკლებია. სწორედ ეს გახდა ერთ-ერთი მიზეზი, რის გამოც კომპანიამ შეძლო ახალი Opus 4.5-ის API-ში გამოყენების ფასი ერთბაშად სამჯერ შეემცირებინა — ანალიტიკოსები კი ვარაუდობენ, რომ ამასთანავე Anthropic-ის შემოსავალი გაიზარდა კიდეც.

SemiAnalysis აღნიშნავს, რომ Nvidia ჯერ კიდევ ინარჩუნებს დიდ უპირატესობას ეკოსისტემაში CUDA-ს, PyTorch-ისა და უამრავი მზა ბიბლიოთეკის გამოყენების წყალობით. TPU-ები ბოლო დრომდე Google-ის შიდა ინსტრუმენტებზე იყო მორგებული, ხოლო გარე კლიენტები უფრო რთულ გამართვასა და ნაკლებად პროგნოზირებად წარმადობას აწყდებოდნენ. Google ახლა ცდილობს ამის სწრაფად გამოსწორებას, მაგრამ კომპანიას კიდევ დასჭირდება დრო. თუმცა, SemiAnalysis-ის აზრით, Nvidia-ს დომინანტური პოზიცია საფრთხის ქვეშ აღმოჩნდა და კომპანიას, სულ მცირე, მოუწევს იმ რეკორდული დანამატების შემცირება, რომლებსაც ის ამჟამად ამაჩქარებლებზე ინარჩუნებს.

კომენტარის დატოვება

თქვენი ელფოსტის მისამართი გამოქვეყნებული არ იყო. აუცილებელი ველები მონიშნულია *