Erwin Verbruggen werkt bij de afdeling Research & Development van het instituut Beeld en Geluid in Hilversum. Beeld en Geluid beheert het audiovisuele archief van de omroep, en maakt dat toegankelijk voor vele doelgroepen. Geen wonder dus dat zij graag willen weten hoe je content het best kunt ontsluiten.

Metadateren is daarbij cruciaal. Maar wat zijn goede woorden? De woorden van de professional zijn vaak niet dezelfde als het grote publiek.
Samen met de Vrije Universiteit Amsterdam onderzoekt Beeld en Geluid het fenomeen social tagging. Hiervoor hebben zij het spel Woordentikkertje gemaakt, waarbij bezoekers van de site helpen met het toekennen van termen aan Man bijt hond-fragmenten, metadateren door de massa dus.
Wisdom of the crowds
Wat conclusies over het sociale taggen: mensen benoemen vaak hun gevoel bij een bepaald fragment, en niet wat er te zien is. Scenes of gebeurtenissen als geheel beschrijven ze niet. De taggers houden wel van dingen: 57% van de woorden beschrijven objecten, slechts 31% van de woorden beschrijven personen en 7% locaties. En dan is er nog een groot gat tussen de termen van de gewone man en de termen van de ‘professional’. Erwin vertelde dat slechts 8% van de toegekende termen gebruikt wordt door de professionals. ‘De vraag is of die 8% bewijs is voor de wisdom of the crowds’ , twitterde een bezoeker dan ook.
De uitdagingen: als je niet-professionals fragmenten laat beschrijven krijg je tikfouten (Hye Park), termen die niet uniek genoeg zijn (Bernhard) en woorden waar geen synoniem voor is (beefeater [het woord dat gebruikt voor de wachten van de London Tower, zichtbaar in onderstaand fragment -IJ]. Niet zomaar te gebruiken dus, de termen van de massa. Je kunt het stroomlijnen door hoofdcategorieën aan te bieden, zoals in een prototype hieronder te zien is. Het onderzoek loopt nog, maar de eerste conclusies zijn te lezen in een paper van Michiel Hildebrand (VU). Updates over de volgende fase van het project, het beoordelen van de tags, vind je op het blog van Waisda.

Naast Woordentikkertje ging Erwin uitgebreid in op de andere projecten van Beeld en Geluid en liet ons kennismaken met de Digital Content Life Cycle. Dol als wij contentmensen zijn op cirkeldiagrammen ging dat erin als koek. Bekijk zijn presentatie op Slideshare: