Za nekoliko meseci Googleovi AI čipovi postali su jedna od najtraženijih roba u tehnološkom sektoru. Vodeći developeri veštačke inteligencije, uključujući neke od najvećih rivala kompanije, masovno ih nabavljaju.
Sada kompanija u vlasništvu Alphabet Inc. želi da dodatno iskoristi taj zamah verovatnim uvođenjem novih čipova namenjenih inferenciji, odnosno pokretanju AI modela nakon što su trenirani. Google je tim potezom spreman da dodatno izazove tržišnog lidera Nvidia Corp. u brzorastućoj kategoriji poluprovodnika, podstaknutoj naglim usvajanjem AI softvera.
Kako raste potražnja za brzim procesiranjem AI upita, "sada ima smisla specijalizovati čipove više za trening ili više za inferencijske zadatke", rekao je glavni naučnik Googlea Jeff Dean u intervjuu. "Razmatramo čitav niz različitih stvari", dodao je, uključujući brzinu AI rezultata koju žele da omoguće.
Kompanija planira da najavi novu generaciju sopstveno dizajniranih čipova, poznatih kao tensor processing units (TPU), na konferenciji Google Cloud Next u Las Vegasu ove nedelje. Amin Vahdat, koji nadgleda Googleovu AI infrastrukturu i rad na čipovima, odbio je da komentariše planove za čip za inferenciju koji može ubrzati AI rezultate, ali je rekao da će više informacija verovatno biti podeljeno "u relativno bliskoj budućnosti".
Amin Vahdat, glavni tehnološki direktor i viši potpredsednik za veštačku inteligenciju i infrastrukturu u kompaniji Google. Fotograf: Bryan Banducci/Bloomberg
Nvidijini grafički procesori, odnosno GPU-ovi, i dalje su zlatni standard za AI, posebno za treniranje naprednijih modela. Međutim, sve veći broj novih igrača pokušava da preuzme deo tržišta u inferenciji, uključujući čipove dizajnirane da smanje vreme odziva za četbotove i AI agente. Nvidia je prošlog meseca počela da prodaje čip namenjen bržoj inferenciji zasnovan na tehnologiji koju je preuzela od kompanije Groq u okviru ugovora o licenciranju vrednog oko 20 milijardi dolara.
Google donosi jedinstvene prednosti u to konkurentsko okruženje, uključujući deceniju iskustva u dizajnu čipova, ogromne resurse iz prihoda od internet pretrage i direktan uvid u AI modele. Među vodećim AI developerima, samo Google proizvodi sopstvene čipove u značajnom obimu, što mu omogućava da razmenjuje ključne povratne informacije između timova kako bi bolje prilagodio hardver. (OpenAI tek sada počinje da dizajnira sopstvene.)
U nedavnom podkastu, Jensen Huang iz Nvidije istakao je prednosti čipova svoje kompanije, rekavši da oni mogu da izvrše "čitav niz aplikacija" koje "ne možete da radite sa TPU-ovima". Google se, sa svoje strane, oslanja na kombinaciju TPU-ova i GPU-ova za sopstveni rad. "Mnogo ljudi bi želelo da koristi oba", rekao je Demis Hassabis, izvršni direktor Google DeepMinda. Interesovanje za TPU-ove je posebno veliko među vodećim AI laboratorijama, dodao je.
Google je ranije isticao inferencijske sposobnosti svojih čipova. Takođe je razmatrao izdavanje odvojenih čipova za trening i inferenciju u ranoj fazi, prema Parthi Ranganathanu, potpredsedniku i inženjerskom saradniku u Googleu, ali se do sada opirao tom pristupu. To bi uskoro moglo da se promeni kako se AI potrošnja pomera sa treninga na inferenciju.
"Bojno polje se pomera ka inferenciji", rekao je Chirag Dekate, analitičar iz Gartnera, koji navodi da je, prema njegovom iskustvu, Googleov model Gemini najbrži u odgovaranju na kompleksne zadatke rezonovanja. "Na tom bojnom polju, Google ima infrastrukturnu prednost."
Regali za testiranje najnovijih Google TPU čipova, zajedno sa kablovima za umrežavanje, hlađenje i napajanje u njihovoj laboratoriji u okviru kampusa. Fotograf: Bryan Banducci/Bloomberg
Uspeh preko noći koji je trajao deceniju
Googleovi dugogodišnji napori u razvoju čipova dobili su novu pažnju u oktobru kada je Anthropic PBC objavio prošireni ugovor za pristup do milion TPU-ova. Google je narednog meseca predstavio napredniji model Gemini 3, treniran i pokrenut na TPU-ovima, uz odlične reakcije.
Najnovija verzija Google TPU čipa. Fotograf: Bryan Banducci/Bloomberg
Potražnja za Googleovim čipovima od rada samo raste među velikim kompanijama. Meta Platforms Inc. potpisala je višemilijardski ugovor za korišćenje TPU-ova putem Google Clouda tokom više godina. Kompanija je tek dobila pristup prvim značajnijim količinama i testira ih kako bi videla za koje su zadatke najpogodniji, rekao je Santosh Janardhan. "Izgleda da bi moglo da postoji prednosti u inferenciji", dodao je.
Anthropic je takođe potpisao ugovor sa Broadcom Inc., partnerom Googlea za TPU-ove, za čipove koji će omogućiti pristup oko 3,5 gigavata računarske snage od 2027. godine. Citadel Securities planira da predstavi na Google konferenciji kako TPU-ovi omogućavaju brže treniranje modela u odnosu na raniji rad sa GPU-ovima.
Google već preduzima nove korake da se prilagodi korisnicima. Kompanija testira mogućnost da kompanije poput Anthropica pokreću deo TPU-ova u sopstvenim data centrima, umesto u Googleovim. Takođe je omogućila korisnicima TPU-ova da koriste spoljne alate poput PyTorcha, kao i drugi softver za raspoređivanje zadataka.
Te promene pomažu da se promeni percepcija čipova koji su prvobitno nastali iz Googleovih računarskih ograničenja i dugo su smatrani prvenstveno alatima za interne potrebe.
Kada je Jeff Dean počeo da razvija raniji AI sistem za prevođenje jezika i prepoznavanje glasa, shvatio je da čak ni Google ne može da priušti da ga pokrene koristeći dostupne čipove. Istovremeno, CPU-ovi koje je Google koristio napredovali su sporije.
Kompanija je odlučila da napravi akcelerator fokusiran na uži skup zadataka koji generišu najveće troškove u AI-ju. Ključna ideja TPU-a je da "rešava mali broj problema, ali zahteva ogromnu količinu računanja", rekao je Vahdat.
Tokom godina, TPU-ovi su se razvijali zajedno sa AI radom Googlea. Istraživački rad iz 2017. godine podstakao je fokus na čipove za treniranje većih modela. Kasnije su timovi primetili da TPU-ovi često stoje neiskorišćeni, pa su optimizovali mrežnu povezanost kako bi ubrzali protok podataka.
Ta dinamika traje i danas, dok Google odlučuje koliko čipova da poveže i kako da optimizuje preciznost radi smanjenja troškova. "Mnoge od tih odluka zavise od eksperimenata sa modelima", rekao je Hassabis.
U budućnosti, žele da razviju akceleratore bliže korisnicima, kako bi smanjili kašnjenje.
Pogađanje budućnosti
Uprkos ekspertizi, Google se suočava sa istim problemom kao i drugi proizvođači čipova: razvoj traje oko tri godine, dok se AI modeli razvijaju mnogo brže.
"Ako neko tvrdi da zna kako će Gemini 10 izgledati, rekao bih – dajte mi to što pušite", rekao je Ranganathan.
Barham upozorava da bliska saradnja između timova može ograničiti inovacije. "Postoji ciklus koji vas zarobljava u onome što trenutno funkcioniše", rekao je.
Gradient Canopy, zgrada u kojoj se Googleovi stručnjaci za veštačku inteligenciju i dizajneri čipova često sastaju kako bi razmenjivali ideje, na Googleovom kampusu u Mauntin Vjuu. Fotograf: Bryan Banducci/Bloomberg
Kako popularnost raste, Google se suočava sa ograničenjima u snabdevanju, slično kao Nvidia. Jedan startap naveo je da je pristup TPU-ovima ograničen jer su prioritet dobili najveći klijenti poput Anthropica.
"Favorizujemo timove koji mogu najviše da iskoriste TPU-ove", rekao je Hassabis.
Google će morati da odluči kako da raspodeli čipove između sopstvenih AI servisa i eksternih klijenata.
"Postoje prednosti da TPU-ovi budu samo za Google, ali i veliki nedostaci", rekao je Vahdat. "Na kraju završite na tehnološkom ostrvu. Možda je lepo, ali ograničeno."