Tagarchief: Open Beelden

Open Beelden op Lowlands!

Voor het derde jaar op rij worden films van Open Beelden op Lowlands vertoond! De meest unieke, leuke en interessante beelden uit de omvangrijke Polygoon-collectie schitteren tijdens het festival van de Tower of Love over het festivalterrein.
Het Lowlandspubliek maakt bijvoorbeeld kennis met de ruim veertig jaar slecht bewaard gebleven anti-slipgeheimen van R. Slotemaker.

En het aftellen naar 5 december wordt compleet overbodig gemaakt met 60 Sinterklazen die zo onschijnheilig mogelijk een maaltijd trachten te verorberen tijdens een Sinterklaas-wedstrijd in het Vondelpark.

Daarbij wordt zwart op wit het bewegende bewijs geleverd dat Nederlanders niet enkel met hun voeten een aardig balletje trappen, maar ook al zittend in hun auto, op de motor of te paard de bal in het netje weten te krijgen.

Een ander hoogtepunt van de filmvertoningen op Lowlands is de met een Oscar genomineerde film Sky over Holland (John Fernhout). Beeld en Geluid poetste dit meesterwerk uit 1967 vorig jaar op, waarmee de vertoning een gegarandeerd kleuren-walhalla wordt.

En voor de thuisblijvende muziekliefhebbers die wat verdieping zoeken naast de festivalregistraties: je kunt je hart ophalen op Muziekencyclopedie.nl, de grootste online catalogus over Nederlandse muziek. Ook een tip voor de festivalgangers die hun vrienden graag de loef afsteken met hun encyclopedische kennis, trouwens.

Online geschiedenismagazine Historiek put uit Open Beelden

Het populaire online geschiedenismagazine Historiek, dat geschiedenis en actualiteit op een frisse manier verbindt, maakt sinds kort gebruik van de content op Open Beelden.

Aangezien Historiek volledig onafhankelijk wil werken hebben zij besloten geen subsidies aan te vragen, ze houden de website enkel van donaties en advertentie-inkomsten draaiende. Open Beelden is dus een welkome bron van audiovisueel materiaal dat binnen deze doelstelling past.

“We proberen geschiedenis zoveel mogelijk op een aantrekkelijke manier te verbinden met de actualiteit. Het is geweldig dat we daarbij ook gebruik kunnen van de content op Open Beelden. Beeldmateriaal doet het altijd goed, of het nu fotomateriaal is of bewegend beeld. Het is geweldig dat we onze artikelen nu ook kunnen opluisteren met de content van Open Beelden. Er is daar een schat aan relevant beeldmateriaal te vinden. We zullen er veelvuldig gebruik van maken!”
(Yuri Visser, Historiek).

Historiek Tour de France

Zo voorzag het Polygoonjournaal over de Tour de France in 1954 historisch relevante beelden bij een artikel over deze Tour, waarbij het startschot toen voor het eerst in Nederland (Amsterdam) werd afgevuurd. De Tour de France 2015 zal eveneens in Nederland (Utrecht) beginnen, waarmee de geschiedenis en de actualiteit samen vallen.

Het Polygoonjournaal over de naoorlogse woningnood wordt gebruikt bij de uiteenzetting van belangrijke gebeurtenissen in de jaren ‘50 van de vorige eeuw. Voor een artikel over de geschiedenis en traditie van de Sint-Maartenviering op 11 november is eveneens dankbaar gebruik gemaakt van Open Beelden.

Met de 900.000 unieke bezoekers per jaar op Historiek bereikt onze content dus een nog groter publiek. Bovendien plaatst de manier waarop Historiek Open Beelden hergebruikt het materiaal in een relevante historische context.

Open Omroep Hackaton – Grasduinen met ‘Open Beelden TV’

Afgelopen zaterdag vond bij het Nederlands Instituut voor Beeld en Geluid de Open Omroep Hackathon plaats. Deze dag werd georganiseerd door Hack de Overheid en mede mogelijk gemaakt door NPO, STER en Beeld en Geluid. Bijna honderd programmeurs gingen aan de slag met de verschillende datasets die voor deze dag beschikbaar waren gemaakt, van Willem Wever vragen tot ondertitels van de KRO, en van alle reclamespotjes uit 2012 tot een gigantische berg aan data over televisie-uitzendingen. Open Beelden was ook beschikbaar, met ‘Open Beelden TV’ als resultaat!

Grasduinen door Open Beelden
Ontwikkelaar Frank Sträter koos ervoor iets met Open Beelden te doen, omdat hij graag gemakkelijk door de meer dan 3.500 beschikbare video’s wilde zappen:
‘Ik grasduin zelf graag door Open Beelden, maar merkte dat ik het miste om direct naar een andere video te springen. Ik heb deze app dus eigenlijk vooral voor mezelf gemaakt.’

Het resultaat: een rustige, intuïtieve interface waarmee je eenvoudig op je smartphone, tablet en computer het Open Beelden archief kunt ontdekken. Er zijn vier elementen in de interface: Informatie, Overzicht, Kanaal en Afspelen:
Open Beelden TV
Onder Kanaal kun je kiezen door welke van de verschillende collecties op Open Beelden je heen wilt zappen.
Blog_kanaal
Als je meer wilt weten over de video die je kijkt, kun je op Informatie klikken om de de beschrijving lezen.
Open Beelden TV
Onder Overzicht staan de titels van andere video’s die binnen het geselecteerde kanaal vallen. Ten slotte kun je een video afspelen of op pauze zetten, en voor- of achteruit zappen. Als je de knoppen wilt verbergen terwijl je aan het kijken bent, kun je dit doen door ergens in het beeld klikken.
Open Beelden TV
Voor de volledige films van de screenshots, klik op: raven, wondermobielen, oude man en cameraman.

Ontwikkelaar aan het woord
Frank Sträter: ‘Tijdens de hackathon besloot ik me in mijn eentje te concentreren op de gebruikerservaring (UX, user experience) bij het bekijken van filmpjes op Open Beelden. Ik zocht naar een manier om het overzicht van de media en de weergave op volledig scherm op een natuurlijke wijze met elkaar te integreren.’

‘Mijn voorbereiding bestond uit het parsen van de, overigens uitstekend werkende en gedocumenteerde API feed van Open Beelden. Middels een PHP-script beschikte ik over de data, zodat ik de user interface (UI) kon gaan bouwen in HTML5, CSS en Javascipt.’

‘Uiteindelijk denk ik dat ik wel geslaagd ben in mijn opzet om een gebruiksvriendelijke web-applicatie te maken, die zich aanpast aan elke schermgrootte. Voor moderne browsers op grote schermen heb ik noodgedwongen een subtiele transparante filter over het beeld aangebracht, om te compenseren voor het kwaliteitsverlies waarbij het scherm meer dan twee keer zo groot is als de afmetingen van de film. De applicatie komt echter het beste tot zijn recht op de kleinere mobiele browsers op de smartphone of tablet.’
Open Beelden TV op smartphone
Via Responsinator zie je het volledige overzicht van hoe Open Beelden TV er uit ziet in een smartphone of tablet.

‘Wellicht ga ik een later stadium nog extra functionaliteiten toevoegen. De applicatie geeft niet de volledige dataset weer en een mogelijkheid tot zoeken zou wenselijk zijn. De positieve reacties die ik heb ontvangen stimuleren me echter wel om er verder aan te werken.’

Beeld en Geluid is ontzettend blij met de applicatie van Frank Sträter. Open Beelden is opgezet met als doel hergebruik van onze collectie te stimuleren en deze applicatie maakt de toegang tot onze content nog gebruiksvriendelijker. Met Open Beelden TV wordt eens te meer aangetoond wat het belang is van het openstellen van je collecties.

Voor een compleet overzicht van alle 22 (!) apps die tijdens de hackathon zijn gemaakt, zie de website van Hack de Overheid, waaronder de Super Spreekbeurt Machine van het Beeld en Geluid hackteam, dat is gemaakt op basis van vragen van Willem Wever, KRO ondertitels en de Beeld en Geluid catalogus.

3000 video’s op Open Beelden!

Met de video ‘School voor dierentemmers’ is de 3000ste video op Open Beelden een feit! Deze 3000 video’s komen niet alleen uit de Polygooncollectie van het Nederlands Instituut voor Beeld en Geluid. Sinds de lancering in 2009 zijn er ook verschillende andere collecties op Open Beelden beschikbaar gemaakt voor hergebruik. Sommige van deze collecties hebben een eigen portal binnen Open Beelden. Een aantal daarvan zullen we hieronder uitlichten.

Zo is er een portal met Nederlandse dans- en theatervoorstellingen. Deze portal wordt beheerd door de opleiding Theaterwetenschap van de Universiteit van Amsterdam en bevat een selectie van registraties van theater- en dansvoorstellingen van 1990 tot 2010. In de portal zijn bijvoorbeeld fragmenten uit de theatervoorstelling ‘Liefhebber’ van Toneelgroep Amsterdam uit 1992 te vinden.

EUscreen gebruikt Open Beelden om een gevarieerde selectie video’s uit de Europese televisiegeschiedenis beschikbaar te maken. Denk aan een item over TV Teddy Bear, een programma dat werd uitgezonden tussen 1963 en 1982 op de Hongaarse televisie. In het programma beleefde een teddybeer dagelijks allerlei avonturen.

Ook een uitzending van de Belgische schooltelevisie over het 150-jarig bestaan van België maakt onderdeel uit van de portal.

De collectie met natuurbeelden van Stichting Natuurbeelden heeft ook een eigen portal op Open Beelden. Daarin zijn mooie opnames uit de natuur te vinden, zoals beelden van een velduil op Texel.

Ook interessant is een video van een lynx die in een Duits bos met een konijn in zijn bek rondzwerft.

Imagine IC stelt op Open Beelden video’s beschikbaar met verhalen over het dagelijks leven in de samenleving van nu. In de portal is bijvoorbeeld een serie video’s te vinden over mensen met verschillende opvattingen over het leven. Bijvoorbeeld moslim Dennis, een Nederlandse jongen die vrij is opgevoed door een ‘darwinistische’ vader en Nederlands-hervormde moeder. Hij legt uit waarom de islam volgens hem antwoord kan geven op fundamentele levensvragen.

Het inmiddels wegbezuinigde Nederlands Instituut voor Mediakunst heeft ook video’s bijgedragen aan Open Beelden. Deze portal bevat opnames van verschillende mediakunstwerken, zoals van de installatie ‘Disco for N/one’ van Mark Bain uit 2001.

In de toekomst zullen we het aantal portals en collecties verder gaan uitbreiden. Daarnaast wordt de collectie video’s uit het archief van Beeld en Geluid ook steeds groter, binnenkort wordt de 2500ste video toegevoegd. Uiteraard zullen dan een aantal mooie video’s uit de collectie van Beeld en Geluid worden uitgelicht!

Zomergast 1 september: Daan Roosegaarde

Zondag 1 september was kunstenaar en ontwerper Daan Roosegaarde te gast bij Zomergasten. Roosegaarde gebruikt vaak een combinatie van technologie, design en interactie in zijn kunstwerken. Met tentoonstellingen in Tate Modern, The National Museum (Tokyo), het Victoria and Albert Museum (Londen) en de oprichting van zijn tweede Studio Roosegaarde in Shanghai is Roosegaarde inmiddels een internationaal fenomeen. Op Open Beelden zijn video’s van een aantal van zijn prachtige interactieve kunstwerken te zien.

Historische beelden op Lowlands

Het Nederlands Instituut voor Beeld en Geluid heeft speciaal voor het Lowlands festival een programma met opmerkelijke historische beelden samengesteld. De fragmenten worden opgenomen in de programmering van LowlandsTelevisie (LTV). De 55.000 bezoekers van het driedaagse popfestival voor alternatieve muziek, videokunst en amusement kunnen op verschillende festival-locaties kennismaken met deze bijzondere beelden.

Curatoren van Beeld en Geluid hebben een selectie van beelden gemaakt uit de historische Polygoon bioscoopjournaals. In de uitzendingen werd tussen de jaren ‘20 en jaren ‘80 wekelijks verslag gedaan van het grote en minder grote nieuws. Een aantal opmerkelijke items zijn dit jaar te zien op LTV. Denk aan zomerse beelden van Nederland uit de vorige eeuw, maar ook aan curieuze evenementen zoals een auto-voetbalwedstrijd, een hond met hoelahoep aspiraties of een wedstrijd struisvogelrennen.

De unieke collectie is niet alleen te bekijken tijdens het festival. Ook op deze website en op het open media platform Open Beelden kan het materiaal worden bekeken. Op Open Beelden, een samenwerking tussen Beeld en Geluid en Kennisland, is het materiaal ook als download beschikbaar gemaakt. Voor Beeld en Geluid past de samenwerking met Lowlands in een bredere trend. Adjunct directeur Hans Westerhof: “Beeld en Geluid is altijd op zoek naar het bereiken van nieuwe doelgroepen. Niet alleen binnen de muren van het Beeld en Geluid gebouw in Hilversum, maar nadrukkelijk ook daarbuiten. Via online platforms, via de samenwerking met omroepen, en dus ook via festivals.’’

LTV is het televisiestation van het Lowlands festival. Al 13 jaar maakt LTV op uitnodiging van de Lowlands-organisatie sfeerbeelden tijdens het festival. Daarnaast biedt LTV een podium aan makers van film en animatie die aansluiten bij de sfeer van Lowlands. De films zullen gedurende drie dagen met regelmaat op verschillende schermen op het festivalterrein verschijnen. Het project is een samenwerking tussen het Nederlands Instituut voor Beeld en Geluid en LTV. De collectie is gedigitaliseerd in de context van het nationale digitaliseringsproject Beelden voor de Toekomst. LTV wordt gecoördineerd door Captain Video, een productiestudio voor bewegend beeld in Amsterdam.

Lancering European Digital Museum for Science & Technology

Op donderdag 18 april lanceerde de Eindhovense wethouder Innovatie, Design, Cultuur en Openbare Ruimte, Mary-Ann Schreurs, het European Digital Museum for Science and Technology. Dit digitale museum is een innovatieve stap in het overdragen van kennis over technologie en richt zich in de eerste plaats op het (hoger) onderwijs.

Het project is een unieke samenwerking tussen techniekhistorici en de toonaangevende Europese wetenschaps- en techniekmusea. Objecten uit verschillende nationale museumcollecties worden virtueel aan elkaar gekoppeld en in een Europese context geplaatst. Op deze wijze wordt zichtbaar hoe het fundament van Europa is gevormd door techniek via bedrijven, consumenten en internationale organisaties. De afgelopen maanden werd in zeven landen succesvol geëxperimenteerd met het gebruik van het digitale museum in het onderwijs.

In verschillende van de tentoonstellingen worden objecten gebruikt die afkomstig zijn van Beeld en Geluid. Bijvoorbeeld deze video over coöperatieve vriezers in de Alblasserwaard bij een verhaal over de komst van koelkasten in het Europese huishouden. Deze video’s zijn via Open Beelden beschikbaar gemaakt voor hergebruik.

Momenteel worden de mogelijkheden verkend om op basis van de gekozen aanpak te komen tot een meer interactief Eindhovens Digitaal Wetenschap- en Technologiemuseum. Dit museum maakt de natuurlijke band tussen de Brainport-regio met techniek en innovatie zichtbaar, voelbaar en tastbaar. In de verkenning wordt ook een fysieke locatie voorzien. De Gemeente Eindhoven, de Technische Universiteit Eindhoven en de Stichting Historie der Techniek ondersteunen dit nieuwe initiatief. Op dit moment wordt nog overlegd met andere partijen in de regio over de opzet.

Van stoomtrein naar elektrische trein

Op Open Beelden zijn recentelijk 50 video’s toegevoegd met in de hoofdrol het spoorwegennet van Nederland. In 65 jaar Polygoonjournaal zijn de spoorwegen een regelmatig terugkerend nieuwsonderwerp. Dan gaat het nog niet continue over problemen die vertragingen en storingen veroorzaken, maar vooral over de ontwikkelingen en groei die de spoorwegen in Nederland doormaken. Langzaamaan wordt een steeds groter gedeelte van het spoorwegnet geëlektrificeerd. Stoomtreinen worden vervangen door elektrische treinen. Tot deze stoom spuwende gevaartes niet meer in het Nederlandse landschap voorkomen. Daarnaast worden er steden en verbindingen aan het spoorwegennet toegevoegd. Zo kan de treinreiziger steeds meer plekjes in Nederland bezoeken.

De elektrificatie van het Nederlandse spoorwegennet krijgt in 1938 al aardig vorm. Op verschillende verbindingen rijden dan elektrische treinen en op bepaalde trajecten worden er dieseltreinen ingezet. Met de jaren verdwijnt de stoomtrein langzaam van de Nederlandse sporen. In dit Polygoonjournaal is te zien hoe de elektrificatie van de spoorwegen in 1938 vordert:

Natuurlijk gaat er, ook in vroegere tijden, wel een iets mis op de spoorwegen. Zo ontspoort er onder andere in 1926 en 1929 een passagierstrein. Regelmatig vinden er ook ongelukken plaats bij bewaakte en vooral onbewaakte overgangen. In het onderstaande item is te zien hoe weggebruikers attent worden gemaakt op de gevaren van een onbewaakte overweg.

Niet alleen de treinen en spoorwegen zijn onderwerpen in Polygoonjournaals. Er is ook aandacht voor de passagiers en welke voorwerpen zij in de treinen achterlaten. Van gitaars tot schoenen, de meest vreemde voorwerpen worden in treinen gevonden. Verschillende mensen snuffelen tussen de gevonden voorwerpen op zoek naar iets van hun gading:

In het Spoorwegmuseum in Utrecht kunnen mensen een kijkje nemen in het verleden van de spoorwegen. Hier is onder andere een kopie van de oudste Nederlandse stoomlocomotief te zien, genaamd De Arend. Er valt een oude dienstregeling te bewonderen en op een maquette rijdt een model van een elektrische trein heen en weer. Ook krijgen de bezoekers een kijkje achter de schermen van de NS en is te zien hoe de automatisering van de spoorwegen in zijn werk gaat.

2000ste video op Open Beelden

Met een video over de opening van de Zuid-Bevelandse spoorweg uit 1927 staan er nu 2000 video’s op Open Beelden. Sinds de laatste mijlpaal van 1500 video’s zijn er een aantal mooie video’s toegevoegd. Uit de collectie van Beeld en Geluid werden aan de hand van thema’s als vrouwen, scheepvaart, typisch Nederlands, huisdieren, gezondheid en zorg, Hilversum en spoorwegen diverse video’s uit het Polygoonarchief toegevoegd. Een mooi voorbeeld is een video over Mej. Versluys, die in 1930 als eerste vrouwelijke piloot die haar Nederlandse vliegbrevet haalde:

Naast de Polygoonarchief werden er voor het eerst ook films toegevoegd uit de collectie onderwijsfilms van Beeld en Geluid. Deze films met een educatief karakter werden halverwege de twintigste eeuw geproduceerd door de Stichting Nederlandse Onderwijsfilms. Onder de films bevinden zich bijvoorbeeld de film Giethoorn, geschikt voor het aardrijkskundeonderwijs:

Er werden niet alleen video’s geüpload uit de collectie van Beeld en Geluid. Eye Film Instituut Nederland voegde bijvoorbeeld ook een aantal filmpjes uit de collectie Bits and Pieces toe. Dit materiaal diende tevens als basis voor de remixwedstrijd Celluloid Remix 2: Found Footage. Daarin gingen creatievelingen aan de slag met het materiaal op Open Beelden om nieuwe creaties te maken. In de winnende video, Untitled van Dániel Szöllösi, wordt gebruik gemaakt van een aantal smartphones:

Naast Eye Film Instituut Nederland droeg ook het Nederlands Instituut voor Mediakunst bij aan Open Beelden. In een eigen portal zijn verschillende video’s met mediakunst terug te vinden, zoals The Unified Field van Peter Bogers:

Dankzij de open licenties kunnen de video’s en de data op Open Beelden voor verschillende initiatieven gebruikt worden. Tijdens het IDFA konden bezoekers met de Docs on the Spot-app op de NDSM-werf in Amsterdam de documentaire Omzwervingen in de nacht (Marjoleine Boonstra, 2004) op een nieuwe manier beleven. Via Open Beelden werd deze ervaring verrijkt met beelden uit het verleden van de NDSM-werf. Glimworm won de hoofdprijs tijdens Apps voor Nederland met de app Vistory, gemaakt met de dataset van Open Beelden.

Daarnaast waren de video’s op steeds meer plaatsen zichtbaar. Zo is de Beeld en Geluid-set van Open Beelden is tegenwoordig ook terug te vinden in de digitale bibliotheek Europeana. Op Wikipedia worden de video’s gebruikt om meer dan 1.100 lemma’s van beeldmateriaal te voorzien, niet alleen op de Nederlandse Wikipedia, maar ook op ruim 60 andere taalversies van Wikipedia. Deze lemma’s worden maandelijks ruim 2,5 miljoen keer geraadpleegd.

Open Beelden video’s verrijkt met Open Data

Tijdens en naar aanleiding van het Code Camping event van Hack de Overheid van 26 november zijn er meerdere programmeurs, hackers en coders met Open Cultuur Datasets aan de slag gegaan. Jaap Blom ontwikkelde een Open Beelden data mash-up die gemaakt is met o.a. datasets van Open Beelden video’s (Beeld en Geluid), het Rijkmuseum en het Amsterdam Museum. In deze blog het resultaat en een toelichting van de maker.

Voor Beeld en Geluid heb ik in het kader van het initiatief Nederland opent Data de eerste basis voor de hieronder besproken demo gemaakt. De demo laat zien hoe je een video in een verrijkte context kunt afspelen door open databronnen te koppelen aan termen die voorkomen in de spraaktranscripten van de video. Voor het Code Camping event van Open Cultuur Data heb ik de demo uitgebreid met nieuwe datasets.

Basisbeginselen
Het uitgangspunt van deze demo-applicatie was het hergebruik van en koppelen van datasets aan de collectie van Open Beelden die meer dan 1.700 vrij te (her)gebruiken video’s van met name Polygoonjournaals bevat, welke gepubliceerd zijn onder Creative Commons licenties. Aan de basis van de werking van de demo liggen de spraaktranscripten van deze video’s, die zijn geleverd door de spraakherkenningssoftware van X-MI.

Het idee voor de demonstratie ligt in het contextualiseren van bekeken video’s om de kijker zodoende te voorzien van nuttige, leuke en onverwachte achtergrondinformatie over hetgeen er gesproken wordt in het filmpje.

Demo Open Beelden - Open Cultuur Data

Om een voorbeeld te geven: wanneer Philip Bloemendal in het filmpje getiteld ‘Grote delen van Nederland compleet ingesneeuwd’ spreekt over: ‘(…) maar ook op tal van plaatsen in Drenthe (…)’ zal er naast de video in verschillende blokjes informatie verschijnen over Drenthe. Elk blokje vertegenwoordigt informatie verkregen uit een open databron. Voor het eerste prototype waren deze bronnen o.a.: Google Maps en Wikipedia. Ter illustratie: in het geval van het herkende concept ‘Drenthe’ wordt er bij Google Maps ingezoomd op de provincie Drenthe; in het Wikipedia blokje wordt er een artikel over Drenthe getoond.

In het kader van het Code Camping event van Hack de Overheid heb ik twee nieuwe datasets toegevoegd: de collecties van het Rijksmuseum en van het Amsterdam Museum.

Hoe het allemaal werkt
Aan de basis van de werking van de demo liggen dus de Open Beelden video’s en het bijbehorende spraaktranscript, dat wordt gebruik om aan elk gesproken woord uit het filmpje de exacte tijdscode te koppelen.1

Stap 1
Omdat niet elk woord in een zin interessant is en uitleg behoeft, is de eerste stap het eruit filteren van het spraaktranscript op stopwoorden, zoals de lidwoorden, preposities en bijwoorden.

Stap 2
In de tweede stap wordt er op de overgebleven woorden een script losgelaten dat deze tracht te sorteren op ‘belangrijkheid’. In deze berekening wordt gebruik gemaakt van een combinatie van woordscores en de frequentie dat een woord voorkomt in de tekst. Woorden die een hoge score hebben en vaak voorkomen zullen hierdoor het hoogste eindigen in de sortering.

Stap 3
Na deze sortering worden in volgorde van belangrijkheid de woorden gebruikt als zoekvraag voor zowel de GTAA thesaurus (o.a. gebruikt door Beeld en Geluid), als ook voor de Freebase webservice. Deze laatste service van Google biedt een grote collectie onderling gerelateerde concepten met beschrijvingen uit een grote verscheidenheid aan domeinen. Freebase kan gezien worden als een uitgebreide thesaurus met informatie uit een groot aantal verschillende (vak)gebieden.

Wanneer de GTAA of Freebase een concept oplevert, wordt deze in een kandidatenlijst opgenomen. Op deze kandidatenlijst wordt vervolgens een zeer rudimentaire slag gemaakt om de meest onzinnige concepten er uit te filteren (b.v. wanneer het concept uit meerdere woorden bestaat, wordt het niet meegenomen).

Stap 4
In stap 4 wordt elk GTAA en Freebase concept uit de kandidatenlijst gebruikt voor een zoekvraag naar elk van de gebruikte open databronnen, te noemen:

  1. Google Maps (alleen als het concept herkend is als locatie)
  2. Wikipedia
  3. Amsterdam Museum
  4. Rijksmuseum

Als er resultaten gevonden worden, zullen deze gekoppeld worden aan de tijdcode van het gesproken woord uit het spraaktranscript waarmee de uiteindelijke informatie gevonden is.2 3

Stap 5
Als laatste stap communiceer ik de tijdsgecodeerde contextdata terug naar de browser middels een JSON object, wat ik vervolgens gebruik om met Popcorn.js events te genereren. Deze events zijn gekoppeld aan een HTML5 video player en zorgen ervoor dat er tijdens het spelen de juiste (context)informatie getoond word in de verschillende blokjes.

Omdat het verwerken van deze 5 stappen per filmpje gemiddeld zo’n 15-20 seconden duurt, sla ik de resultaten in .json files op. Bij het openen van de demo worden deze files dus ingelezen in plaats van het ‘live’ ophalen van de data (zoals beschreven in de verschillende stappen)

Er is nog een hoop te doen
De demo toont aan wat mogelijk door conceptdetectie (of ook: Named Entity Recognition) in te koppelen aan open databronnen, maar kan in een aantal aspecten nog sterk verbeterd worden:

Verbetering conceptdetectie

De conceptdetectie zoals die is toegepast kan nog sterk verbeterd worden. Zo wordt er in deze demo geen rekening gehouden met concepten die bestaan meer dan één woord, b.v. ‘Amsterdam Museum’ zou in dit geval twee concepten, ‘museum’ en ‘Amsterdam’, opleveren i.p.v. één concept: ‘Amsterdam Museum’.

Verder zou er specialistische Named Entity Recognition (NER) web services, zoals DBpedia Spotlight (vooral goede resultaten voor het Engels) onderzocht moeten worden om de resultaten te verbeteren. Voor de Nederlandse taal blijft het echter nog even zoeken naar een goeie open source NER service.

Selectie relevante bronnen voor de gebruiker

Wat betreft de relevantie voor de getoonde informatie naar de gebruiker toe kan er beter nagedacht worden over de selectie van de contextbronnen. Waarom bijvoorbeeld iemand die een filmpje over ‘Nederlands oudste stoomgemaal’ bekijkt, iets wil weten van een museumstuk ‘Hensbeker van het gezelschap De negenden’ (gevonden op basis van het woord ‘Gorinchem’) is iets om over na te denken.

De demo geeft in ieder geval aan hoe spraaktranscripten van video’s kunnen worden gecombineerd met open databronnen en hoe deze op hierdoor wederzijds gecontextualiseerd worden. In het kader van het Nederland opent Data project wordt deze demo verder uitgewerkt. De voortgang hiervan zal op ook op Open Cultuur Data worden vermeld!

Jaap Blom | Software engineer | Afdeling R&D, Nederlands Instituut voor Beeld en Geluid

Je kunt de demo hier vinden. 4

Voetnoten

  1. Spraakherkenningssoftware is niet perfect, wat betekent dat niet elk woord in een spraaktranscript 100% zal overeenkomen met het woord dat daadwerkelijk in de video wordt uitgesproken.
  2. Voor de collectie van het Rijksmuseum heb ik eerst de hele collectie geharvest uit hun OAI-PMH data provider en geïndexeerd met SOLR. Via Lucene queries is vervolgens de collectie met vrije tekst te doorzoeken. Tijdens het maken van de index liep ik tegen veelal dezelfde slordigheden in de metadatavelden aan als Hay Kranen, die het Virtuele Rijksmuseum maakte.
  3. De collectie van het Amsterdam Museum is op drie verschillende manieren ontsloten: via AdlibOAI-PMH en via een SPARQL endpoint. Voor deze demo heb ik voor de laatste optie gekozen, omdat het niet zoals OAI-PMH eerst gerharvest moet worden, maar direct via de service doorzocht kan worden. Het was sowieso weer goed wat te spelen met het Semantic Web d.m.v. SPARQL queries.
  4. Je kunt de demo het beste bekijken in Google Chrome, Firefox en Safari. Hij werkt niet optimaal in Internet Explorer.