Lektor Birger Larsen er en travl forsker, der er involveret i en række større forskningsprojekter, der strækker sig over flere år – i øjeblikket med særligt fokus på den del af kulturarven, vi har som lydfiler. Her får vi en hurtig status.
Forskerne skriver wiki om byens lyde og jingler
Det drejer sig først og fremmest om LARM, et
infrastrukturprojekt om radioens kulturarv, og hvor formålet er at
opbygge en ny forskningsinfrastruktur, så forskerne får lettere
adgang til de materialer, de har brug for.
"Der findes i dag over en million timers radio fra DR og andre
danske stationer men med meget få metadata," fortæller Birger
Larsen. "Faktisk har de fleste kun titel og sendetidspunkt. I LARM-projektet opbygger vi
en national bibliografi med mulighed for at annotere, søge og
formidle udsendelserne. En farbar metode har været at se nærmere på
de trykte programmer, der har været indsendt til aviser og blade,
for her finder vi en gang imellem en lille beskrivelse af
udsendelserne. Dét, vi så gør, er at koble de få ord, vi har fra
programmerne på lydfilerne. Men desværre er det først fra 1989, man
begyndte at opbevare hele sendefladen," fortæller Birger Larsen.
"Før det er der gemt sporadiske programmer i DRs arkiver, der dog
stadig omfatter mange hundrede tusinde spolebånd."
Helt konkret arbejder IVAs forskere på at evaluere
informationsarkitekturen. De er ret langt fremme med arkivet og
arbejder i øjeblikket på at analysere humanistiske forskernes
informationsbehov i forhold til at arbejde med lyd.
Torben Sangild fra Institut for Kunst- og Kulturvidenskab,
Københavns Universitet studerer jingler, andre arbejder med lyde i
byens rum, og genudsendelser er også et fokusområde. Læs bl.a.
hans webblog.
"Dét, vi har gjort, er at bede forskerne beskrive og analysere
deres behov i en wiki, skrive hvilke materialer de har brug for og
hvilke annoteringer, der er mest nyttige for dem," forklarer Birger
Larsen. "Udfordringen er, at de har så forskellige behov, at det
ikke giver mening at udarbejde en fælles løsning. Så det, vi sigter
mod, er en løsning, hvor alle kan opdatere deres eget skema med
egne behov. Efterfølgende vil vi så etablere en slags 'repository',
hvor vi lægger alle skemaer og lister op, og så er det vores håb,
at andre forskere vil kunne genbruge dem, så vi lægger stor vægt
på, at alle meget præcist anfører, hvad den pågældende liste skal
bruges til, så andre kan genbruge den. Det handler med andre ord
meget om at annotere lyd. Helt konkret arbejder vi med tabeller,
der indeholder standardiserede termer, emneordslister, lister med
personer, genrer mv. Vi får meget nyttig software fra DR, og de får
viden fra os."
Fra lyd til tekst
CoSound er et helt nyt forskningsprojekt, der har DTU som
ankermand og en række partnere, herunder IVA, Statsbiblioteket, DR
samt en række engelske interessenter. Projektet har et samlet
budget på 26 mio. kr. og er støttet af det Strategiske
Forskningsråd.
"IVAs direkte involvering i projektet består i ansættelse af en
ph.d.-studerende, der vil virke fra IVA i København og bidrage til
projektet. Overordnet kan man sige, at hvor vi i LARM-projektet
arbejder med forbedret adgang til indhold, så har CoSound fokus på
det teknologiske, altså på, hvordan vi kan levere den optimale
teknologi, der giver os adgang til både musik og tale," fortæller
Birger Larsen.
"Projektet er for eksempel også interessant for B&O i forhold
til udvikling af bedre bilradioer, hvor man som bruger har
begrænset mulighed for at betjene systemet, mens man kører. Dét,
der arbejdes meget på i projektet, er genreopfattelse. Er der
sammenhæng mellem en genre set fra en personlig opfattelse og den
måde, vi kan lave genreidentifikation på ved hjælp af
algoritmer?"
Fingerprints af stemmer
"Vi har endnu ikke på dansk udviklet gode systemer for
tale-til-tekst genkendelse, men det har man på engelsk, så et spin
off fra projektet i Danmarks kunne være en nogenlunde
talegenkendelse, så vi eksempelvis vil kunne søge i indhold. Det
handler altså om, at vi får lavet radiolyd om til tekst - for så at
kunne søge i den. En af udfordringerne er vores dialekter, og det
at talt dansk har udviklet sig utrolig meget hen over den periode,
som samlingen dækker (fra 1930'erne og frem). En anden ambition er
at kunne lave en slags fingerprint af en stemme, f.eks. Anders Fogh
og automatisk kunne finde, hvor han taler på tværs af samlingen men
selvfølgelig også at kunne skelne mellem tale og musik."
Af Bodil
Christensen