CoSound – forskere vil identificere lydegenskaber

CoSound – forskere vil identificere lydegenskaber
IVA deltager i evalueringsfasen på et stort internationalt forskningsprojekt om interaktiv berigelse af lyd.


Det Strategiske Forskningsråds Programkomite for Strategiske Vækstteknologier har netop offentliggjort, at de i 2011uddeler 17,5 mio.kr. til projektetCoSound - Kognitive systemer til interaktiv berigelse af lyd, hvor forskere fra IVA har ansvaret for evalueringsdelen. Projektet inddrager både forskningsinstitutioner og virksomheder. Det er lektor Birger Larsen og lektor Haakon Lund fra IVA, der kommer til at arbejde aktivt med lydprojektet:

"CoSound handler om, hvordan vi automatisk kan udtrække data fra lydfiler og hvilke typer software og programmer, der er bedst egnet til at identificere egenskaber ved lyd," forklarer Birger Larsen. "Hvis vi for eksempel har et interview med fem forskellige deltagere, så vil teknologien kunne hjælpe os til at identificere de enkeltes stemmer, så vi bliver i stand til trække en enkelt deltager ud - et såkaldt 'fingerprint' af den enkeltes stemme. Teknologien vil også kunne hjælpe os til at identificere hvor i en udsendelse, der bliver brugt tale, og hvornår der bliver brugt musik. Det kan få stor betydning i copyright sammenhænge, hvor man kan forestille sig, at udsendelser vil kunne gengives med musikken sorteret fra og en speak om, hvilke numre der blev spillet. Endnu et eksempel handler om statistik. Ved hjælp af teknologien vil man eksempelvis kunne udfærdige en statistik på hele P3s musiksendeflade og på det grundlag diskutere, om P3 er populistisk eller har en tilstrækkelig bred sendeflade. Det vil også på sigt forhåbentligt blive muligt at lave direkte udskrifter fra tale til skrift på de udvalgte dele af en lydfil, som man har brug for. Vores indsats her fra IVA vil bestå i at evaluere de resultater, som vores samarbejdspartnere kommer frem til. Bevillingen indebærer, at både Haakon og jeg i en periode vil blive frikøbt til projektet, og at vi får mulighed for at opslå et helt nyt ph.d.-stipendium. Stipendiet opslås i samarbejde med Institut for Kunst- og Kulturvidenskab på Københavns Universitet med indskrivning på IVA."

Projektet hænger derfor sammen med, at forretningsmodeller inden for musik- og lydsektorerne er udfordret. Online tilgængelighed af medier og sociale adfærdsdata skaber et stort potentiale for strategisk forskning, som kan lede til nye produkter og services, kan man læse i projektbeskrivelsen fra Styrelsen for Forskning og Innovation:

"Vores produktivitet og velfærd afhænger af levering af medieinformation gennem forskellige platforme, såsom TV, sociale og mobile medier. I forhold til billeder og tekst udgør audiodata en særlig udfordring, da de sanses og opfattes som en abstrakt, følelsesmæssig strøm. På trods af at kognitive repræsentationer af lyd er veludviklede, så er de vanskelige at italesætte, beskrive og dele blandt ikke-eksperter. Det fulde potentiale inden for audio er således endnu ikke fuldt realiseret m.h.t. at berige menneskelig kommunikation, underholdning og vores kulturarv. Den stærke danske position inden lydteknologi samt de innovative løsninger i dette projekt kan frigøre potentialet. CoSound er et multifagligt strategisk forskningsprojekt ledet af DTU med deltagelse af forskningsinstitutioner, kommercielle partnere og slutbrugere. Visionen er at udvikle en fleksibel platform, der kombinerer brugergenereret indhold og automatiseret analyse af audiodata og skaber beriget information, hvilket giver brugere mulighed for at fortolke, organisere, dele og skabe. Vi vil demonstrere mulighed for nye lydteknologiske produkter og tjenesteydelser til den kommercielle sektor, public-service og formidlingssektoren samt i uddannelse og kulturel forskning."