Google lanserar ny generations AI chip
Generativ AI omvandlar hur vi interagerar med teknik och öppnar samtidigt stora effektiviseringsmöjligheter för företag. Men dessa framsteg kräver allt större beräkningskraft, minne och kommunikation för att träna och finjustera de mest kapabla modellerna och för att kunna leverera dem interaktivt till en global användarpopulation. I över ett decennium har Google utvecklat skräddarsydd hårdvara specifikt för AI, Tensor Processing Units (TPUs), för att driva fram gränsen för vad som är möjligt i skala och effektivitet.
Trillium: Nästa generationens TPU
Google har nyligen tillkännagett Trillium, den sjätte generationens TPU, som är den mest kraftfulla och energieffektiva TPU hittills. Trillium TPUs uppnår en imponerande 4,7x ökning i beräkningskapacitet per chip jämfört med föregångaren TPU v5e. Minneskapaciteten och bandbredden har fördubblats, liksom Interchip Interconnect (ICI) bandbredden. Dessutom är Trillium utrustad med tredje generationens SparseCore, en specialiserad accelerator för bearbetning av ultra-stora embeddingar som är vanliga i avancerade ranknings- och rekommendationsarbetslaster.
Effektivare och mer hållbar
Trillium TPUs gör det möjligt att träna nästa våg av grundmodeller snabbare och leverera dessa modeller med minskad latens och lägre kostnad. De är också de mest hållbara TPU:erna hittills, med över 67% högre energieffektivitet jämfört med TPU v5e. Trillium kan skalas upp till 256 TPU:er i en enda högbandbredds, låg-latenspodd. Med multislice-teknologi och Titanium Intelligence Processing Units (IPUs) kan Trillium TPUs skalas till hundratals poddar och ansluta tiotusentals chip i en byggnadsskala superdator som är sammankopplad via ett datacenter-nätverk med flera petabit per sekund.
Fortsatt innovation inom AI
Google började arbetet med världens första specialbyggda AI-accelerator, TPU v1, redan 2013, följt av den första Cloud TPU 2017. Utan TPU:er skulle många av Googles mest populära tjänster, såsom realtidsröstökning, fotobjektsigenkänning och interaktiv språköversättning, inte vara möjliga. Trillium TPUs kommer att driva nästa våg av AI-modeller och agenter, och Google ser fram emot att hjälpa sina kunder att dra nytta av dessa avancerade kapaciteter.
Teknisk utveckling och partnerskap
Trillium TPUs är en del av Google Cloud’s AI Hypercomputer, en banbrytande superdatorarkitektur designad specifikt för avancerade AI-arbetslaster. Den integrerar prestandaoptimerad infrastruktur (inklusive Trillium TPUs), öppen källkod programvaruramverk och flexibla konsumtionsmodeller. Google’s partnerskap med Hugging Face och andra aktörer understryker det gemensamma engagemanget för att påskynda AI-utvecklingen.
Kundberättelser och framtidsperspektiv
Kunder som Essential AI, Nuro, Deep Genomics och Deloitte använder redan Cloud TPUs för att förnya och förbättra sina verksamheter. Google DeepMind kommer att använda Trillium TPUs för att träna och leverera framtida generationer av Gemini-modeller snabbare och mer effektivt än någonsin tidigare.
Lär dig mer om Trillium
Google Cloud TPUs är i framkant av AI-acceleration, skräddarsydda och optimerade för att möjliggöra storskaliga AI-modeller. Sjätte generationens Trillium TPUs, resultatet av över ett decennium av forskning och innovation, kommer att finnas tillgängliga senare i år. För att lära dig mer om Trillium TPUs och AI Hypercomputer, besök Googles webbplats
Kommentera: