NotebookLlama för AI-genererade poddar
Meta har släppt NotebookLlama, ett nytt verktyg för att generera AI-baserade podcaster i stil med Googles virala funktion i NotebookLM. NotebookLlama använder sig av Metas egna Llama-modeller för att skapa ett innehåll som ska likna en naturlig dialog mellan två parter. Genom att analysera textfiler, exempelvis PDF-filer med nyhetsartiklar eller blogginlägg, skapar systemet ett manus som sedan förvandlas till ljud med öppen text-till-tal-teknik.
Genererar podcasts men ljudkvaliteten är begränsad
NotebookLlama fungerar genom att först omvandla textfiler till ett transkriberat manus. Därefter lägger verktyget till inslag av dramatik och avbrott för att skapa en dynamisk känsla. Slutresultatet förs sedan till text-till-tal-modeller för att generera ljud. Trots att verktyget har potential uppvisar det ännu en tydlig robotisk ljudkvalitet, där röster ibland pratar i mun på varandra.
Forskarna bakom NotebookLlama menar att den nuvarande tekniken för text-till-tal är en begränsning som kan övervinnas i framtiden genom förbättrade modeller. Enligt projektets GitHub-sida överväger Meta att framöver utveckla en modell där två AI-agenter debatterar ämnet för att skapa ett mer engagerande och flytande innehåll.
AI-genererade podcasts och utmaningen med hallucinationer
NotebookLlama är inte det första försöket att replikera Googles podcastgenerator, och resultaten varierar stort bland liknande projekt. En av de största utmaningarna för samtliga är så kallade hallucinationer, vilket innebär att AI-systemen ibland skapar innehåll som inte har någon verklighetsgrund. Inget system, inklusive Googles eget NotebookLM, har lyckats helt eliminera detta problem, vilket gör AI-genererade poddar osäkra när det gäller faktainnehåll.

Kommentera: