AI upptäcker alfabet i valars läten

TillämpningsområdenAI upptäcker alfabet i valars läten

AI upptäcker alfabet i valars läten

Forskare har avslöjat en ny nivå av komplexitet i valars kommunikation genom att analysera tusentals inspelade sekvenser av kaskelotvalars klickljud med hjälp av artificiell intelligens.

Valarnas ljudlandskap

Variationer i tempo, rytm och längd på valarnas klicksekvenser, kallade kodor, skapar en rik akustisk väv. Dessa variabler antyder att valar kan kombinera klickmönster på flera sätt, mixa och matcha fraser för att förmedla en bred mängd information till varandra.

Vad kaskelotvalar säger med sina klickljud är fortfarande ett mysterium för mänskliga öron. Men att avslöja omfattningen av valarnas vokala utbyten är ett viktigt steg mot att koppla valars läten till specifika meddelanden eller sociala beteenden, rapporterade forskarna den 7 maj i tidskriften Nature Communications.

Djupare förståelse av valarnas koder

”Detta arbete bygger på mycket tidigare forskning som fokuserat på att förstå kaskelotvalars läten. Dock är detta första gången som man har börjat studera deras läten i en bredare kommunikativ kontext och i utbyten mellan valar, vilket har möjliggjort vissa av fynden,” sa studiens medförfattare Dr. Daniela Rus, chef för Computer Science and Artificial Intelligence Laboratory (CSAIL) vid MIT.

Att förstå vilka aspekter av deras kodor de kan kontrollera och variera hjälper oss att förstå hur de kan koda information i sina läten, förklarade Rus.

Forskarna jämförde sitt katalog av ljudkombinationer med ett ”fonetiskt alfabet” för kaskelotvalar, där variationer i valarnas klicksekvenser jämfördes med produktionen av olika fonetiska ljud i mänskligt tal.

Skepsis mot ”fonetiskt alfabet”

Trots de intressanta fynden menar Dr. Luke Rendell, en forskare vid University of St. Andrews i Storbritannien, att termen ”fonetiskt alfabet” kan vara missvisande när det gäller valarnas vokala interaktioner.

”Sättet som tempovariation används är helt annorlunda än hur vi använder element av ett alfabet för att konstruera språkliga uttryck,” sa Rendell. ”Det finns ingen evidens för detta, och det är inte en särskilt hjälpsam tolkning eftersom det tvingar allt in i en begränsad och något översåld syn på om det är likt mänskligt språk eller inte, när det finns ett mycket bredare spektrum av tolkningar tillgängliga.”

Upptäcka mönster med AI

Kaskelotvalar producerar sina klick genom att tvinga luft genom ett organ i huvudet kallat spermaceti, och dessa ljud kan vara så höga som 230 decibel — högre än en raketuppskjutning och kapabel att spränga mänskliga trumhinnor, rapporterade ett annat forskarlag tidigare i tidskriften Scientific Reports.

För den nya studien använde forskarna maskininlärning för att upptäcka mönster i ljuddata insamlade av The Dominica Sperm Whale Project. Maskininlärning, en gren av AI, möjliggjorde analysen av stora mängder komplexa ljuddata, vilket skulle ha varit mycket tidskrävande och svårt för människor att utföra manuellt. Inspelningarna representerade rösterna från cirka 60 kaskelotvalar, en del av en grupp på cirka 400 valar känd som den östra karibiska klanen, och vokaliseringarna spelades in mellan 2005 och 2018.

Forskarna undersökte tidpunkten och frekvensen av 8 719 kodasekvenser — i enskilda valars yttranden, i körer och i samtal och svar mellan valar. När de visualiserades med artificiell intelligens framträdde tidigare osedda kodamönster.

Komplexitet i valarnas kommunikation

Studiens författare definierade fyra egenskaper hos kodor: rytm, tempo, rubato och ornamentering. Rytm beskriver sekvensen av intervaller mellan klick. Tempo är längden på hela kodan. Rubato refererar till variationer i längd över intilliggande kodor med samma rytm och tempo. Och ornamentering är ett ”extra klick” som läggs till i slutet av en kod i en grupp av kortare kodor, förklarade Rus.

Dessa så kallade ornamentklick ”förekommer mer mot början och slutet av turer” under vokala utbyten mellan valar, ”och beter sig som diskursmarkörer,” sa Rus.

Upptäckten att valar kunde synkronisera variationer i kodatempo var ”en väldigt intressant observation,” sa Rendell.

”Jag är mindre övertygad om ’ornamenteringen’,” tillade han. ”Den förekommer mycket sällan, och jag tror att vi behöver mer bevis för att de inte bara är produktionsglitchar,” eller utfyllnadsljud, ”som när vi säger ’um’ eller ’err.'”

Potentiella tillämpningar

Programmet identifierade totalt 18 typer av rytm, fem typer av tempo, tre typer av rubato och två typer av ornamentering. Dessa kodafunktioner kunde alla mixas och matchas för att skapa en ”enorm repertoar” av fraser, rapporterade studiens författare. Dessutom kunde betydelsen justeras ytterligare beroende på placeringen av en koda — efterföljande eller överlappande andra kodor — inom ett utbyte eller kör med två eller flera valar.

Interaktiv experimentering med valar, tillsammans med observationer av valarnas beteende, kan vara en viktig del av att avkoda syntaxen i kaskelotvalars klicksekvenser, skrev författarna i studien. Deras maskininlärningsmetod kan också visa sig användbar för att studera andra typer av djurvokaliseringar, tillade Dr. Brenda McCowan, professor vid University of California Davis School of Veterinary Medicine.

”Tempo, rytm, rubato och ornamentering kommer sannolikt att hittas i andra arter av valar,” sa McCowan. ”Vi vet redan att detta är sant för knölvalsång. Men det finns också bevis för denna typ av mönster i andra akvatiska, terrestra och arboreala arter till vilka denna metod kan tillämpas.”

Men även om denna teknik är hjälpsam för att identifiera vissa aspekter av kommunikation, är det ingen Rosettasten, varnade Rendell.

”Maskininlärning är bra för att hitta mönster i stora datamängder,” sa han, ”men det skapar inte mening.”

Kommentera:

Kommentar

Type at least 1 character to search
Kontakta oss:
Hitta oss i sociala medier: