Auraflow: Open source som utmanar Stable Diffusion 3
En ny aktör har klivit in på arenan för AI-baserade bildgeneratorer med öppen källkod: Auraflow. Lanserad förra veckan av det generativa mediebolaget Fal AI, har Auraflow snabbt fångat intresse med sin Apache 2.0-licens, som är betydligt mer öppen än den restriktiva licens som Stability AI använde för att släppa Stable Diffusion 3 (SD3).
Öppen källkod snabbar upp utvecklingen
Förespråkare av öppen källkod menar att sådana projekt kan accelerera utvecklingscykler i konkurrensutsatta branscher, eftersom utvecklare befrias från licens- och juridiska begränsningar. Utan licensavgifter bildas ofta engagerade communitys runt kompetenta öppen källkodsprojekt, där utvecklare kan anpassa, modifiera, träna och till och med tjäna pengar på sitt arbete.
Fal AI, som grundades 2021 av ingenjörerna Burkay Gur och Gorkem Yurtseven—med bakgrund på Coinbase respektive Amazon—understryker att öppen källkod inom AI är hotad. ”Några har till och med djärvt påstått att öppen källkod inom AI är död,” säger de. ”Inte så snabbt!”
Prestanda och användning
Auraflow genomgick fyra veckors intensiv träning med bilder i olika storlekar och upplösningar. Resultatet? En GenEval-poäng på 0,64, som ökade till 0,703 med hjälp av en prompt-förbättringsprocess liknande den i DALL-E 3. Detta innebär att modellen presterar bra i syntetiska tester, men Auraflow är fortfarande i betastadiet, version 0.1, snarare än en stabil version.
Modellen är dock krävande vad gäller hårdvara och kräver ett grafikkort med cirka 12 GB VRAM för att köra fp16-versionen—till skillnad från SD3 som klarar sig med 6 GB VRAM. Fal AI arbetar på en mer hanterbar version för konsumenter med mindre kraftfulla grafikkort.
Auraflow kan laddas ner från Huggingface och köras i ComfyUI med en anpassad nod som också finns tillgänglig i ComfyUI Manager.
Jämförelse med SD3
Auraflow står sig som ett starkt alternativ till SD3, men är det tillräckligt bra för att överträffa det? Vi har jämfört de två basmodellerna och testat deras prestanda över olika konststilar och uppmaningar.
Konststilar och kreativitet: Auraflow hanterar impressionistiska stilar med kraftiga penseldrag och levande färger, medan SD3 är mer detaljerad och strukturerad. Båda modellerna har sina styrkor och svagheter i olika sammanhang.
Realism: SD3 Medium erbjuder en mer detaljerad och hyperrealistisk bild, vilket gör det bättre för denna typ av uppmaning.
Illustration: SD3 Medium ger en mer skrämmande och detaljerad illustration, vilket gör den bättre för skräckscenarion.
Uppmaningar: Auraflow följer uppmaningen bättre i en surrealistisk scen, vilket gör den till den bättre modellen för fantasielement.
Rumslig medvetenhet: Båda modellerna visar en god förståelse för rumslig komposition, men det är en jämn matchning.
Anime och manga: SD3 Medium erbjuder en mer detaljerad och dynamisk avbildning, vilket gör den bättre för denna genre.
Vår slutsats
Auraflow briljerar i att fånga impressionistiska och fantasifulla stilar, medan SD3 Medium är bättre på detaljerade och hyperrealistiska scener. Auraflows öppna Apache 2.0-licens ger den en strategisk fördel, särskilt för finjusteringar, men dess höga VRAM-krav är ett hinder. SD3 Medium, med sina lägre hårdvarukrav, är för närvarande den bättre modellen i denna jämförelse.
Med tiden kan Auraflow dock bli en allvarlig utmanare, särskilt om en mindre och mer effektiv version utvecklas som minskar dess hårdvarukrav.
Kommentera: