
Tülu 3 – öppen AI-modell som slår DeepSeek v3 och utmanar GPT-4o
Den öppna AI-marknaden tar ett nytt kliv framåt när Allen Institute for AI (Ai2) lanserar Tülu 3 405B, en öppen språkmodell med 405 miljarder parametrar. Modellen presterar på samma nivå som OpenAIs GPT-4o och överträffar DeepSeek v3 i flera viktiga tester.
Ai2 har tidigare gjort anspråk på att utmana marknadens ledande modeller, och redan i november 2024 lanserade företaget de första versionerna av Tülu 3 i 8- och 70-miljardersstorlek. Den senaste uppdateringen tar dock modellen till en helt ny nivå.
Banbrytande post-träning förbättrar AI-prestanda
Tülu 3 405B:s främsta innovation ligger i dess avancerade post-träningsteknik, där modellen genomgår en unik kombination av:
Supervised fine-tuning (övervakad finjustering)
Preference learning (preferensinlärning)
Reinforcement learning from verifiable rewards (RLVR)
Den sistnämnda metoden är särskilt banbrytande och gör det möjligt för modellen att justeras baserat på verifierbara resultat, exempelvis matematiska problem med objektivt rätt svar. Detta ger en AI med både högre noggrannhet och bättre säkerhetsegenskaper.
RLVR – revolutionerar AI-träning
Ai2:s RLVR-system särskiljer sig genom att använda verifierbara belöningar för att styra modellens inlärning, till skillnad från traditionella metoder som enbart bygger på mänskliga preferenser. Kombinationen av RLVR och optimerad beräkningsinfrastruktur har möjliggjort:
Effektiv parallell bearbetning över 256 GPU:er
Synkronisering av vikter för optimerad prestanda
Balanserad arbetsfördelning över 32 noder
Integrerad vLLM-distribution med 16-vägs tensorparallellism
RLVR-systemet har visat sig vara särskilt effektivt i större modeller, vilket tyder på att metoden kan ge ännu bättre resultat i framtida, ännu mer omfattande AI-modeller.
Prestandajämförelse: Tülu 3 405B vs GPT-4o och DeepSeek v3
Tülu 3 405B har testats mot tio ledande AI-benchmark-tester, inklusive säkerhetsutvärderingar. Modellen presterade bättre än DeepSeek v3, men ligger något under GPT-4o:
Tülu 3 405B RLVR: 80,7 poäng
DeepSeek v3: 75,9 poäng
GPT-4o: 81,6 poäng
Även om GPT-4o fortfarande har en liten ledning, visar resultaten att Tülu 3 405B är en av de mest konkurrenskraftiga öppna modellerna på marknaden idag.
Öppen källkod på riktigt – Ai2:s unika strategi
En av de största skillnaderna mellan Tülu 3 och andra öppna modeller som DeepSeek och Metas Llama 3.1 är graden av transparens.
Medan DeepSeek och Llama 3.1 endast delar vissa delar av sin kod och viktdata, erbjuder Ai2 en helt öppen lösning:
Fullständiga träningsdata
All kod och infrastruktur
Möjlighet till anpassad träning och finjustering
”Vi använder inga stängda dataset”, säger Hannaneh Hajishirzi, senior director för NLP Research på Ai2.
För den som vill testa modellen finns den tillgänglig via Ai2:s Tülu 3-plattform, där både träningsdata och kod är fritt åtkomliga.
En ny era för öppen AI
Lanseringen av Tülu 3 405B markerar ett viktigt steg i utvecklingen av öppna AI-modeller. Genom att kombinera transparens, innovativa träningsmetoder och hög prestanda har Ai2 etablerat en av de starkaste utmanarna till de stora, slutna AI-modellerna från OpenAI och DeepSeek.
Frågan är nu – hur kommer techjättarna att svara på den öppna AI-revolutionen?