Microsofts nya AI-modell Phi-3.5 överträffar konkurrenterna
Microsoft har släppt den senaste versionen av sin kompakta språkmodell, Phi-3.5, som visar sig vara ett betydande steg framåt jämfört med tidigare generationer. Phi-3.5 slår mindre modeller från branschledare som Google, OpenAI, Mistral och Meta på flera viktiga områden, vilket gör den till en framstående aktör inom AI-teknologin.
Tre varianter med olika parametrar
Phi-3.5 finns i tre olika storlekar: 3,8 miljarder, 4,15 miljarder och 41,9 miljarder parametrar. Samtliga versioner är tillgängliga för nedladdning och kan köras lokalt med verktyg som Ollama. Modellen har särskilt utmärkt sig inom resonemang, där den endast överträffades av GPT-4o-mini bland de ledande små modellerna. Dessutom presterade den starkt i matematiska tester, där den överträffade både Llama och Gemini.
Förbättrad modell med bildförståelse
En av de stora nyheterna med Phi-3.5 är att den nu även kommer i en vision-modellversion som kan förstå bilder, inte bara text. Modellen använder sig av en så kallad ”mixture of experts” (MoE), vilket innebär att inlärningsuppgifter fördelas mellan olika delnätverk för mer effektiv bearbetning. Denna metod visade sig vara överlägsen Gemini Flash 1.5, som används i den kostnadsfria versionen av Gemini-chatboten, på flera benchmarks. Trots att Phi-3.5 är mindre än Gemini, matchar den både ChatGPT och Claude i prestanda.
Potential för inbyggd AI i IoT-enheter
En av de största fördelarna med små modeller som Phi-3.5 är deras potential att integreras i applikationer eller installeras på IoT-enheter, till exempel smarta dörrklockor. Detta skulle möjliggöra funktioner som ansiktsigenkänning utan att behöva skicka data till molnet, vilket ökar både effektiviteten och säkerheten.
Prestanda och användarupplevelse
Trots lovande benchmarks visade sig den mindre 3,8-miljardersmodellen av Phi-3.5 vara något mindre imponerande i praktiken. Vid användning på en laptop upplevdes svaren ofta som överdrivet långa och klumpigt formulerade. Modellen hade även svårt att klara vissa enkla tester, som att skriva en mening där första bokstaven i varje ord är samma som sista bokstaven i föregående ord. Det större expertmodellsystemet, som ännu inte testats av skribenten, förväntas dock lösa många av dessa problem och leverera resultat av liknande kvalitet som OpenAIs GPT-4o-mini.
Phi-3.5arkitektur gör den särskilt effektiv inom STEM-ämnen och samhällsvetenskaper, där den bibehåller hög prestanda samtidigt som den hanterar komplexa AI-uppgifter på flera språk.
Kommentera: