Metas nya Llama 3.2 revolutionerar bildhantering

AI ModellerMetas nya Llama 3.2 revolutionerar bildhantering

Metas nya Llama 3.2 revolutionerar bildhantering

Efter den framgångsrika lanseringen av Llama 3.1 och dess kraftfulla 405B-modell introduceras nu Llama 3.2. Den nya versionen inkluderar mindre och medelstora visionmodeller på 11B och 90B, samt lättviktsmodeller på 1B och 3B, som är anpassade för att köras på edge- och mobila enheter. Med dessa nya modeller blir det möjligt för fler utvecklare att använda Llama utan omfattande datorkapacitet eller expertis. Modellerna finns tillgängliga för nedladdning på llama.com och Hugging Face.

Fördelar med lokala modeller

De nya lättviktsmodellerna ger två stora fördelar: snabbare svarstider då bearbetning sker lokalt, och ökad integritet eftersom data inte skickas till molnet. Exempelvis kan en applikation på en mobil enhet summera de senaste 10 meddelandena och skapa kalenderinbjudningar utan att någon information lämnar enheten. Detta gör det möjligt att bygga personliga applikationer med hög integritet.

Utvärderingar och prestanda

Llama 3.2-modellerna har testats mot ledande AI-modeller som Claude 3 Haiku och GPT4o-mini och har visat konkurrenskraftig prestanda inom bildigenkänning och visuell förståelse. Modellerna har även presterat bättre än Gemma 2 och Phi 3.5-mini på textgenerering och verktygsanrop.

Ny arkitektur för bildförståelse

Visionmodellerna på 11B och 90B har en ny arkitektur som integrerar en bildencoder med språkmodellen, vilket möjliggör komplex bildresonemang. Under träningen har modellen anpassats för att kombinera text- och bilddata, vilket ger utvecklare en kraftfull verktygslåda för att bygga applikationer som kan förstå och beskriva bilder på ett sofistikerat sätt.

Lättviktsmodeller för mobila enheter

Genom pruning och kunskapsdistillation har 1B- och 3B-modellerna optimerats för att köras effektivt på mobila enheter. Detta gör det möjligt för utvecklare att bygga avancerade applikationer utan att kompromissa med prestanda.

Llama Stack: Standardiserad plattform för utveckling

För att underlätta utvecklingen av agentapplikationer med Llama har Llama Stack introducerats. Den erbjuder en standardiserad API-plattform för finjustering, syntetisk datagenerering och verktygsanvändning. Detta ger en enhetlig utvecklingsmiljö som kan användas i molnet, on-prem, och på enheter.

Systemnivå säkerhet

För att säkerställa säker och ansvarsfull användning har Llama Guard 3 introducerats, en lösning som filtrerar text- och bildinmatningar samt utdata. Modellen har optimerats för att kunna användas i mer begränsade miljöer, exempelvis på mobila enheter.

Tillgänglig för utvecklare idag

Llama 3.2 erbjuder utvecklare fler möjligheter än någonsin att bygga innovativa applikationer på ett ansvarsfullt sätt. Modellerna och verktygen finns tillgängliga för nedladdning och användning, och Meta uppmuntrar till fortsatt dialog med open source-gemenskapen för att driva innovation framåt.

Kommentera:

Kommentar

Type at least 1 character to search
Kontakta oss:
Hitta oss i sociala medier: