Alibaba lanserar Marco-o1 för att utmana OpenAI:s avancerade AI-modeller

AI ModellerAlibaba lanserar Marco-o1 för att utmana OpenAI:s avancerade AI-modeller

Alibaba lanserar Marco-o1 för att utmana OpenAI:s avancerade AI-modeller

MarcoPolo Team, en del av Alibaba International Digital Commerce, har introducerat Marco-o1, en avancerad stor språkmodell (LLM) utformad för att hantera komplexa resonemangsuppgifter och öppna problemlösningar.

Denna modell utnyttjar tekniker som Chain-of-Thought (CoT) finjustering, Monte Carlo Tree Search (MCTS) och nya resonemangsstrategier. Marco-o1 är särskilt designad för att ta itu med utmanande verklighetsbaserade problem där traditionella AI-modeller ofta kommer till korta.

Öppen tillgång till Marco-o1

Marco-o1 finns nu tillgänglig för forskare och utvecklare på GitHub och Hugging Face. Modellen bygger på Qwen2-7B-Instruct-arkitekturen och har finjusterats med hjälp av dataset som inkluderar både öppna CoT-data och proprietära syntetiska data.

Nyckelfunktionerna inkluderar:

Monte Carlo Tree Search (MCTS): Ger modellen möjlighet att utforska flera resonemangsvägar baserade på förtroendepoäng.

Resonerande åtgärdsstrategier: Förbättrar problemlösningsförmågan genom att använda olika nivåer av granularitet i åtgärder.

Förbättrade resultat och språköversättning

Marco-o1 har redan demonstrerat sina styrkor i tester. Modellen visar en förbättring med 6,17 % i noggrannhet på den engelska MGSM-dataseten och 5,60 % på den kinesiska versionen. Dessutom utmärker sig Marco-o1 inom maskinöversättning, där den klarar av att korrekt tolka komplexa fraser och slanguttryck. Ett exempel är översättningen av “这个鞋拥有踩屎感” till “This shoe has a comfortable sole”.

Stark konkurrens inom AI-marknaden

Lanseringen av Marco-o1 kommer kort efter att det kinesiska AI-forskningslabbet DeepSeek, med stöd av High-Flyer Capital Management, introducerade sin egen resonemangsmodell, DeepSeek-R1-Lite-Preview. Både Marco-o1 och DeepSeek-R1 är utmanare till OpenAI:s senaste modeller, och prestandatester visar att de ligger på samma nivå som OpenAI:s o1-preview när det gäller logiska och matematiska resonemang.

Kommentera:

Kommentar

Type at least 1 character to search
Kontakta oss:
Hitta oss i sociala medier: