Categoriearchief: Evenementen

Open Beelden video’s verrijkt met Open Data

Tijdens en naar aanleiding van het Code Camping event van Hack de Overheid van 26 november zijn er meerdere programmeurs, hackers en coders met Open Cultuur Datasets aan de slag gegaan. Jaap Blom ontwikkelde een Open Beelden data mash-up die gemaakt is met o.a. datasets van Open Beelden video’s (Beeld en Geluid), het Rijkmuseum en het Amsterdam Museum. In deze blog het resultaat en een toelichting van de maker.

Voor Beeld en Geluid heb ik in het kader van het initiatief Nederland opent Data de eerste basis voor de hieronder besproken demo gemaakt. De demo laat zien hoe je een video in een verrijkte context kunt afspelen door open databronnen te koppelen aan termen die voorkomen in de spraaktranscripten van de video. Voor het Code Camping event van Open Cultuur Data heb ik de demo uitgebreid met nieuwe datasets.

Basisbeginselen
Het uitgangspunt van deze demo-applicatie was het hergebruik van en koppelen van datasets aan de collectie van Open Beelden die meer dan 1.700 vrij te (her)gebruiken video’s van met name Polygoonjournaals bevat, welke gepubliceerd zijn onder Creative Commons licenties. Aan de basis van de werking van de demo liggen de spraaktranscripten van deze video’s, die zijn geleverd door de spraakherkenningssoftware van X-MI.

Het idee voor de demonstratie ligt in het contextualiseren van bekeken video’s om de kijker zodoende te voorzien van nuttige, leuke en onverwachte achtergrondinformatie over hetgeen er gesproken wordt in het filmpje.

Demo Open Beelden - Open Cultuur Data

Om een voorbeeld te geven: wanneer Philip Bloemendal in het filmpje getiteld ‘Grote delen van Nederland compleet ingesneeuwd’ spreekt over: ‘(…) maar ook op tal van plaatsen in Drenthe (…)’ zal er naast de video in verschillende blokjes informatie verschijnen over Drenthe. Elk blokje vertegenwoordigt informatie verkregen uit een open databron. Voor het eerste prototype waren deze bronnen o.a.: Google Maps en Wikipedia. Ter illustratie: in het geval van het herkende concept ‘Drenthe’ wordt er bij Google Maps ingezoomd op de provincie Drenthe; in het Wikipedia blokje wordt er een artikel over Drenthe getoond.

In het kader van het Code Camping event van Hack de Overheid heb ik twee nieuwe datasets toegevoegd: de collecties van het Rijksmuseum en van het Amsterdam Museum.

Hoe het allemaal werkt
Aan de basis van de werking van de demo liggen dus de Open Beelden video’s en het bijbehorende spraaktranscript, dat wordt gebruik om aan elk gesproken woord uit het filmpje de exacte tijdscode te koppelen.1

Stap 1
Omdat niet elk woord in een zin interessant is en uitleg behoeft, is de eerste stap het eruit filteren van het spraaktranscript op stopwoorden, zoals de lidwoorden, preposities en bijwoorden.

Stap 2
In de tweede stap wordt er op de overgebleven woorden een script losgelaten dat deze tracht te sorteren op ‘belangrijkheid’. In deze berekening wordt gebruik gemaakt van een combinatie van woordscores en de frequentie dat een woord voorkomt in de tekst. Woorden die een hoge score hebben en vaak voorkomen zullen hierdoor het hoogste eindigen in de sortering.

Stap 3
Na deze sortering worden in volgorde van belangrijkheid de woorden gebruikt als zoekvraag voor zowel de GTAA thesaurus (o.a. gebruikt door Beeld en Geluid), als ook voor de Freebase webservice. Deze laatste service van Google biedt een grote collectie onderling gerelateerde concepten met beschrijvingen uit een grote verscheidenheid aan domeinen. Freebase kan gezien worden als een uitgebreide thesaurus met informatie uit een groot aantal verschillende (vak)gebieden.

Wanneer de GTAA of Freebase een concept oplevert, wordt deze in een kandidatenlijst opgenomen. Op deze kandidatenlijst wordt vervolgens een zeer rudimentaire slag gemaakt om de meest onzinnige concepten er uit te filteren (b.v. wanneer het concept uit meerdere woorden bestaat, wordt het niet meegenomen).

Stap 4
In stap 4 wordt elk GTAA en Freebase concept uit de kandidatenlijst gebruikt voor een zoekvraag naar elk van de gebruikte open databronnen, te noemen:

  1. Google Maps (alleen als het concept herkend is als locatie)
  2. Wikipedia
  3. Amsterdam Museum
  4. Rijksmuseum

Als er resultaten gevonden worden, zullen deze gekoppeld worden aan de tijdcode van het gesproken woord uit het spraaktranscript waarmee de uiteindelijke informatie gevonden is.2 3

Stap 5
Als laatste stap communiceer ik de tijdsgecodeerde contextdata terug naar de browser middels een JSON object, wat ik vervolgens gebruik om met Popcorn.js events te genereren. Deze events zijn gekoppeld aan een HTML5 video player en zorgen ervoor dat er tijdens het spelen de juiste (context)informatie getoond word in de verschillende blokjes.

Omdat het verwerken van deze 5 stappen per filmpje gemiddeld zo’n 15-20 seconden duurt, sla ik de resultaten in .json files op. Bij het openen van de demo worden deze files dus ingelezen in plaats van het ‘live’ ophalen van de data (zoals beschreven in de verschillende stappen)

Er is nog een hoop te doen
De demo toont aan wat mogelijk door conceptdetectie (of ook: Named Entity Recognition) in te koppelen aan open databronnen, maar kan in een aantal aspecten nog sterk verbeterd worden:

Verbetering conceptdetectie

De conceptdetectie zoals die is toegepast kan nog sterk verbeterd worden. Zo wordt er in deze demo geen rekening gehouden met concepten die bestaan meer dan één woord, b.v. ‘Amsterdam Museum’ zou in dit geval twee concepten, ‘museum’ en ‘Amsterdam’, opleveren i.p.v. één concept: ‘Amsterdam Museum’.

Verder zou er specialistische Named Entity Recognition (NER) web services, zoals DBpedia Spotlight (vooral goede resultaten voor het Engels) onderzocht moeten worden om de resultaten te verbeteren. Voor de Nederlandse taal blijft het echter nog even zoeken naar een goeie open source NER service.

Selectie relevante bronnen voor de gebruiker

Wat betreft de relevantie voor de getoonde informatie naar de gebruiker toe kan er beter nagedacht worden over de selectie van de contextbronnen. Waarom bijvoorbeeld iemand die een filmpje over ‘Nederlands oudste stoomgemaal’ bekijkt, iets wil weten van een museumstuk ‘Hensbeker van het gezelschap De negenden’ (gevonden op basis van het woord ‘Gorinchem’) is iets om over na te denken.

De demo geeft in ieder geval aan hoe spraaktranscripten van video’s kunnen worden gecombineerd met open databronnen en hoe deze op hierdoor wederzijds gecontextualiseerd worden. In het kader van het Nederland opent Data project wordt deze demo verder uitgewerkt. De voortgang hiervan zal op ook op Open Cultuur Data worden vermeld!

Jaap Blom | Software engineer | Afdeling R&D, Nederlands Instituut voor Beeld en Geluid

Je kunt de demo hier vinden. 4

Voetnoten

  1. Spraakherkenningssoftware is niet perfect, wat betekent dat niet elk woord in een spraaktranscript 100% zal overeenkomen met het woord dat daadwerkelijk in de video wordt uitgesproken.
  2. Voor de collectie van het Rijksmuseum heb ik eerst de hele collectie geharvest uit hun OAI-PMH data provider en geïndexeerd met SOLR. Via Lucene queries is vervolgens de collectie met vrije tekst te doorzoeken. Tijdens het maken van de index liep ik tegen veelal dezelfde slordigheden in de metadatavelden aan als Hay Kranen, die het Virtuele Rijksmuseum maakte.
  3. De collectie van het Amsterdam Museum is op drie verschillende manieren ontsloten: via AdlibOAI-PMH en via een SPARQL endpoint. Voor deze demo heb ik voor de laatste optie gekozen, omdat het niet zoals OAI-PMH eerst gerharvest moet worden, maar direct via de service doorzocht kan worden. Het was sowieso weer goed wat te spelen met het Semantic Web d.m.v. SPARQL queries.
  4. Je kunt de demo het beste bekijken in Google Chrome, Firefox en Safari. Hij werkt niet optimaal in Internet Explorer.

Open Beelden in Docs on the Spot

Tijdens het IDFA kunnen bezoekers met de Docs on the Spot app de documentaire Haven: omzwervingen in de Nacht (Marjoleine Boonstra, 2004) op hun mobiel en op locatie vanuit een geheel nieuw perspectief ervaren. In een tocht langs de verhalen van de personen die de NDSM-werf mede hebben gevormd tot wat het vandaag de dag is herleeft men de haven van weleer, de donkere leefwerelden en dromen van oud-bewoners en dokwerkers. Door op locatie naar www.docsonthespot.tv te gaan kunnen bezoekers de verhalen op de daadwerkelijke locatie herbeleven, gewoon op hun eigen mobiel met koptelefoon. Fragmenten uit de documentaire worden verrijkt met aanvullend historisch of karakteristiek beeldmateriaal uit het Nederlands Instituut voor Beeld en Geluid en het Stadsarchief. De fragmenten van Beeld en Geluid zijn via Open Beelden beschikbaar gesteld.

De web-app is ontwikkeld in het kader van het Culture Vortex programma, een samenwerking tussen Institute of Network Cultures, MediaLAB Amsterdam, IDFA, Nederlands Instituut voor Beeld en Geluid, Virtueel Platforms’ HOT100, Open Beelden en Stadsarchief Amsterdam. Tot het einde van het IDFA (27 november) is de app te gebruiken op de NDSM werf in Amsterdam-Noord. Neem een opgeladen smartphone en oordopjes mee.

Docs on the Spot

Open Beelden met Led It Up op Mundial Festival

Schermafbeelding-2011-05-16-om-13.43.14

Het Nederlands Instituut voor Beeld en Geluid is partner van Led It Up, een project van het MediaLab Amsterdam. Led It Up heeft in opdracht van het Culture Vortex programma een interactieve installatie ontwikkeld die op Mundial Festival 2011 wordt gelanceerd. Onder het motto “expand your playground” is er samen met partners Dropstuff en het Nederlands Instituut voor Beeld en Geluid gewerkt aan een innovatieve belevenis om publieke participatie te stimuleren binnen online, culturele databases. Hollands cultureel erfgoed is in een digitaal jasje gestoken waardoor festivalgangers kunnen spelen met het verleden. Partner Dropstuff, het platform voor digitale en interactieve kunst, heeft een groot LED scherm geleverd waarop old school games via een mobiele web applicatie worden gespeeld. Festivalgangers kunnen via hun smartphones inloggen in de mobiele web applicatie en voor het grote LED scherm naar hartenlust gamen.

Scherm1

De games, moderne versies van klassiekers ‘galgje’ en ‘zoek de verschillen’, draaien om typisch Nederlandse videobeelden die afkomstig zijn van Open Beelden. Open Beelden biedt audiovisueel materiaal onder een Creative Commons licentie aan, waardoor het publiek vrij is om op een creatieve manier de beelden te remixen en te hergebruiken. Led It Up probeert dit te stimuleren door het publiek bewust te maken van deze mogelijkheden.

Remix en interactie vormen de kern van het project. Het internet als digitaal archief heeft ervoor gezorgd dat het delen van informatie een alledaagse activiteit is geworden. Allerlei culturele uitingen worden gedigitaliseerd en opgeslagen in enorme databases. Het wordt steeds gemakkelijker voor gebruikers om deze data te downloaden en te (her-)gebruiken, of te remixen. Het remixen van o.a. video en muziek is iets dat past binnen de online Web 2.0 en participatie cultuur. We gaan tegenwoordig ‘in gesprek’ met de huidige cultuur. Het is een vorm van interactie dat bij eerdere generaties niet mogelijk was. We willen niet slechts achterover zitten en luisteren – passief consumeren – maar participeren, knippen, plakken, interacteren met de cultuur – actief consumeren.

Het is de missie van het Culture Vortex programma om deze participatie binnen online, culturele databases te stimuleren. Open Beelden sluit hier naadloos bij aan. Doelstelling van dit project is om mensen te stimuleren de historische (video)beelden te hergebruiken op creatieve wijze. Led It Up heeft een webapplicatie ontwikkeld waardoor deze missies op een innovatieve en vooral leuke manier realiteit zijn geworden.

Op 18 en 19 juni zal het project gelanceerd op Festival Mundial in Tilburg.

mundialproductionsEvent.sflb

Open Beelden in ‘Madurodam in Beeld’

Gisteren hebben Madurodams burgemeester Djoeke Siemssen en algemeen directeur van Beeld en Geluid Jan Müller de nieuwste aanwinst van Madurodam onthuld: het kleurrijke gebouw van Beeld en Geluid uit Hilversum.

De vakmensen van Madurodam hebben het gevelontwerp van Jaap Drupsteen minutieus nagemaakt. Daar hebben ze al hun kennis en vaardigheden voor moeten aanspreken. De gevel van het gebouw bevat kleurige, licht doorlatende geabstraheerde afbeeldingen uit allerlei televisieprogramma’s, identiek aan de gevel van het echte gebouw in Hilversum. De bouwers hebben de glazen gevel bekleed met kleurfolie, waarin 748 tv-beelden zijn verwerkt. Het glasreliëf is uit kunststof gefreesd. Vervolgens zijn de individuele ruitjes, 2.244 stuks, uitgezaagd en één voor één op de glas- en folielaag aangebracht.

Voorafgaand aan de onthulling presenteerde Beeld en Geluid de nieuwe app Madurodam in Beeld. Deze iPhone-applicatie, gratis te downloaden in de iTunes App Store, verrijkt een bezoek aan Madurodam met historische archiefbeelden van verschillende maquettes in de miniatuurstad. Deze beelden zijn allen afkomstig van Open Beelden. Een voorbeeld:

Economies of the Commons 2

Economies of the Commons 2: Paying the Costs of Making Things Free
Internationale conferentie, seminar en openbare avondprogramma’s met o.a. Charlotte Hess (Syracuse University, NY)
Amsterdam en Hilversum
11 – 13 november 2010

Economies of the Commons 2 is een tweedaags internationaal congres op 12 en 13 november in De Balie in Amsterdam, voorafgegaan door een internationaal seminar over open video van het Nederlands Instituut voor Beeld en Geluid op 11 november in Hilversum. Economies of the Commons 2 kijkt kritisch naar de economische aspecten van het online publieke domein en publiek toegankelijke informatiebronnen, kennis en media (de zogenoemde ‘digital commons’). De afgelopen 10 jaar hebben publiek toegankelijke informatiebronnen een sterke groei doorgemaakt. De bezoekersaantallen lopen in de miljoenen, in sommige gevallen zelfs per dag. Het succes van projecten als Wikipedia, Beelden voor de Toekomst en Europeana geeft wel aan hoe levendig het nieuwe digitale publieke domein is. Publiek toegankelijke informatiebronnen zijn niet langer exclusief voorbehouden aan digitale ‘insiders’, maar worden met veel enthousiasme door steeds meer mensen gebruikt.

Voorstanders zijn vol lof over de laagdrempeligheid (lage kosten) van open content voor gebruikers, en de samenwerkingsverbanden waarmee open content gepaard gaat. Critici stellen daar tegenover dat open content de ‘poortwachtersfunctie’ van auteurs, de wetenschap en professionele instituties ondermijnt en bovendien geen betrouwbaar eigen verdienmodel heeft. Economies of the Commons 2 biedt een cruciale analyse van de duurzame economische modellen die het voortbestaan en de verdere ontwikkeling van het online publieke domein kunnen waarborgen. We besteden aandacht aan nieuwe hybride oplossingen voor het archiveren, benaderen en hergebruiken van onlinecontent die niet alleen commercieel interessante mogelijkheden bieden maar eveneens het publieke belang dienen in de hedendaagse geglobaliseerde informatie-economie.

Economies of the Commons 2 is een vervolg op het succesvolle Economies of the Commons-congres dat in april 2008 plaatsvond. Het programma bestaat uit:
•    11 november, Hilversum: een internationaal seminar over open video georganiseerd door het Nederlands Instituut voor Beeld en Geluid
•    12 & 13 november, Amsterdam: een tweedaags internationaal congres en twee openbare avondprogramma’s

Sprekers:
Charlotte Hess (Syracuse University – Keynote), Ben Moskowitz (Open Video Alliance), Simona Levi (Free Culture Forum), Bas Savenije (Koninklijke Bibliotheek), Yann Moulier Boutang (Multitudes), Peter B. Kaufman (Intelligent Television), Harry Verwayen (Europeana), James Boyle (Duke University), Jeff Ubois (DTN), Sandra Fauconnier (NIMK), Dymitri Kleiner (Telekommunisten), Nathaniel Tkacz (Universiteit van Melbourne), etc.

Open Beelden biedt vrij gebruik archiefmateriaal

Persbericht
24 september 2009

OPEN BEELDEN BIEDT VRIJ GEBRUIK ARCHIEFMATERIAAL

Hilversum – Vandaag lanceert Beeld en Geluid Open Beelden, een nieuw open mediaplatform dat toegang biedt tot een selectie archiefmateriaal voor creatief hergebruik. Fragmenten uit deze audiovisuele collecties mogen geremixed worden in nieuwe werken. Gebruikers van Open Beelden kunnen dit nieuwe materiaal vervolgens weer toevoegen aan het platform en daarmee deze beeldbank verder uitbreiden.

Creative Commons
De toegang tot het materiaal op Open Beelden is gebaseerd op het Creative Commons-licentiemodel. Creative Commons biedt auteurs, kunstenaars, wetenschappers en onderwijzers de vrijheid om op een flexibele manier met hun auteursrechten om te gaan en om werken beschikbaar te stellen aan anderen op een manier die men zelf kiest. Zo worden niet alle rechten (zoals binnen het traditionele auteursrecht het geval is) maar slechts enkele rechten naar keuze voorbehouden.

Deze ‘open’ benadering wordt ook in de techniek van het platform doorgevoerd door gebruik te maken van open formaten, standaarden en softwarecomponenten. Daarbij wordt alle software die in het kader van Open Beelden wordt ontwikkeld tevens als open source-software beschikbaar.

Naast het remixen van archiefbeelden biedt Open Beelden de mogelijkheid om koppelingen met andere informatiebronnen te maken. In het kader van Open Beelden zijn er op dit moment al tientallen Polygoonitems aan lemma’s op de Nederlandstalige Wikipedia toegevoegd. Bijvoorbeeld op het lemma over Almere is de tekstuele beschrijving van de geschiedenis van deze stad voorzien van een audiovisuele illustratie over de eerste bewoners. In samenwerking met Wikimedia Nederland wordt momenteel gekeken hoe Open Beelden in navolging van dit experiment ook op een meer structurele manier een audiovisuele meerwaarde aan Wikipedia kan bijdragen.

Open Beelden is een initiatief van het Nederlands Instituut voor Beeld en Geluid in samenwerking met Stichting Nederland Kennisland. Op Open Beelden zijn ruim 200 Polygoonitems afkomstig uit het archief van Beeld en Geluid te vinden. De collectie van herbruikbaar materiaal zal de komende jaren flink groeien, wekelijks worden nieuwe werken ge-upload.

Iedereen is zeer welkom om materiaal bij te dragen aan het platform. Hierbij valt te denken aan collectiebeherende instellingen en producenten, maar ook nieuw materiaal dat creatieven gemaakt hebben op basis van het materiaal op Open Beelden.

Presentaties
Het projectteam geeft presentaties over Open Beelden op de volgende evenementen:
•    Vandaag, tijdens PICNIC ’09, verricht Hans Westerhof, programmadirecteur Beelden voor de Toekomst, de officiële lancering van dit mediaplatform met een presentatie tijdens de Creative Commons Special.
•    In het kader van de StrangerAcademy in Amsterdam zullen van 13 tot en met 17 oktober 150 jonge filmmakers in de vorm van workshops hun vaardigheden verbeteren en in een korte tijd een filmproductie te maken. Een van deze workshops staat in het kader van Open Beelden en laat een tiental jonge filmtalenten aan de hand van het hergebruik van archiefbeelden hun eigen verhaal vertellen.

Open Beelden is ontwikkeld in het kader van Beelden voor de Toekomst, dat digitalisering en ontsluiting van audiovisueel erfgoed op grote schaal mogelijk maakt.

Terugblik KL Studio 2008

Donderdag 2 oktober was Open Beelden door Kennisland op de KL Studio 2008 uitgenodigd om tijdens de workshop Open Content een ‘pitch’ te houden. De videoregistratie hiervan is al enige tijd op Google Video te vinden (en ook op SlideShare). Nu kan je hem hier ook bekijken:

Het doel van deze presentatie was om de aanwezigen tijdens de workshop enthousiast te krijgen voor een rondetafelgesprek over het project. Moderator Mundo Resink van Kennisland vatte dit gesprek in het onderstaande schema samen:


Foto: Mundo Resink (Kennisland)

Lees verder Terugblik KL Studio 2008

Open Beelden op KL Studio 2008

Aanstaande donderdag organiseert Stichting Kennisland de KL Studio 2008. Tijdens dit evenement presenteert Kennisland haar toekomstvisie van Nederland als kenniseconomie. Als onderdeel van de workshop Open Content zal Open Beelden in de vorm van een ‘pitch’ hier voor het eerst publiekelijk naar buiten treden.

Het doel van deze pitch is om deelnemers aan de Open Content workshop te verleiden tot een rondetafelgesprek. Vervolgens kan er dieper op het gepresenteerde initiatief in worden gegaan. Een ideale mogelijkheid voor dit project-in-ontwikkeling om waardevolle feedback te verzamelen dus. 

Hopelijk tot ziens bij de KL Studio 2008!