Automatisierte Rekonstruktion der Programmlisten französischer Fernsehsender

Highlights
INDUSTRY : Audiovisual
MARKET : French
TURNOVER : €37,9M
NUMBER OF EMPLOYEES : 1250

    Kontext

    Als Hüter der französischen Fernseh-, Radio- und Webmedienarchive ist das INA-Institut zuständig für das ordnungsgemäße Archivieren des französischen audiovisuellen Erbes sowie für dessen Schutz und für das Zugänglichmachen für eine breite Öffentlichkeit, für Wissenschaftler und Fachleute. Als das Institut gegründet wurde, gab es in Frankreich nur eine Handvoll ausschließlich öffentlich-rechtlicher Sender. Seitdem hat sich der Tätigkeitsbereich des INA ebenso wie der Umfang der zu verarbeitenden Sendungen erheblich erweitert (Das INA erfasst täglich 184 Fernseh- und Radiokanäle und speichert Inhalte von mehr als 15.000 Konten in sozialen Netzen, von mehr als 10.000 Konten auf Videoplattformen und mehr als 5.000 Podcastsammlungen). Gleichzeitig muss das Institut, um seine Mission zu erfüllen, mit einer Legacy-Technologie zurechtkommen, die aus verschiedenen nach und nach implementierten Lösungen besteht. Dadurch wurden die Daten zunehmend in abgeschotteten „Silos“ eingeschlossen, was eine permanente manuelle Synchronisation von einer Datenbank zur anderen erfordert. Diese Situation führte 2014 zur Umsetzung einer Datenmanagementstrategie, deren zentraler Bestandteil die Überarbeitung des Informationssystems ist. Das Projekt zielt auf die Zentralisierung und Harmonisierung der verschiedenen Systeme ab und hat es dem Unternehmen ermöglicht, verschiedene Initiativen zur Automatisierung der Datenproduktion zu starten.

    Zielsetzungen

    Die Programmlisten der französischen Fernsehsender Sequenz für Sequenz und Tag für Tag zu rekonstruieren. Mithilfe der Automatisierung die Archivare bei der Indexierung und Klassifizierung mit Daten zu unterstützen.
    Die Indizierung von Videostreams zu standardisieren, unabhängig von Quelle, Format oder Qualität

    Herausforderungen

    Die dokumentarische Aufbereitung der Medien als Pflichtexemplare stützt sich derzeit auf Daten von Partnern wie Rundfunkanstalten oder auf Medienbeobachtung spezialisierten Agenturen. Diese von den Sendern zur Verfügung gestellten Daten sind jedoch manchmal unvollständig und vor allem prognostiziert, was zahlreiche Verifikationen erfordert. Vor diesem Hintergrund hat sich das INA für eine Automatisierung beim Schneiden und Katalogisieren von Fernseh- und Radioprogrammen interessiert. Das Ziel: das derzeitige technologische „Tortenschichtsystem“ und die damit verbundenen Probleme (nicht harmonisierte Daten, Duplikate usw.) zu überwinden und sich stattdessen auf eine intelligente Lösung zu stützen, die verschiedene Werkzeuge miteinander kombiniert. Diese Lösung musste in der Lage sein, die einzelnen Fernsehprogramme zu identifizieren, aber auch die täglichen Programmlisten zu rekonstruieren, um die Katalogisierung und Beschreibung der Sammlungen zu erleichtern.

    Die Automatisierung verfolgt das Ziel, Autonomie bei der Rekonstruktion der Programmlisten zu erlangen, die Daten des Instituts besser bekannt zu machen und an der Umsetzung eines einheitlichen und umfassenden Zugangs zu den Sendearchiven mitzuwirken.

    Lösung

    Das INA wählte die Deepomatic Plattform, um seine eigenen Bildklassifizierungsmodelle zu entwickeln und zu trainieren und so eine erste Aufschlüsselung der Programme pro Tag vorzunehmen. Überzeugt hatte sie das Versprechen von Deepomatic, dass dank dieser Lösung Geschäftsanwender schnell vollkommen autonom agieren können, ohne systematisch das Know-how eines Datenwissenschaftlers hinzuziehen zu müssen.

    Die Plattform ermöglichte zunächst eine Segmentierung von Nachrichtensendungen, wobei automatisch zwischen Bildern aus dem Studio und Bildern von Berichterstattungen bzw. dem Abspann oder der Wettervorhersage unterschieden wurde. Mit diesen ersten Ergebnissen konnte eine Analyse von Sendetagen von permanent laufenden 24-Stunden-Nachrichtenkanälen in Erwägung gezogen werden. Dabei erlaubt die von Deepomatic entwickelte Bildklassifizierung nicht nur die Unterscheidung von „universellen“ Elementen wie den einzelnen Sets, sondern auch von „spezifischen“ Elementen, wie dem Set eines bestimmten Programms. Derzeit plant die INA, Deepomatic auch bei Musiksendungen und Talkshows einzusetzen, die komplexer strukturiert sind und bei denen sich Passagen am Set mit künstlerischen Darbietungen, Berichterstattungen und Interviews abwechseln.

    Nutzen

    Der Nutzen von Deepomatic zeigt sich heute vor allem auf 3 Ebenen:

    • Zeitgewinn und optimierte Präzision beim Katalogisieren und Indizieren von Videos
      Mitwirkung bei der Governance und Anreicherung des Data Lake, um die Daten noch wertvoller zu machen (Verknüpfung zwischen den verschiedenen Daten aufrechterhalten, Daten anreichern und verknüpfen usw.)
    • Autonomie sowohl bei der Bereitstellung als auch bei der Modellierung dank einer umfassenden und intuitiven Benutzeroberfläche, die für Geschäftsanwender einfach zu bedienen ist

    Das 1975 gegründete Nationale Institut für audiovisuelle Medien (INA) ist ein öffentlich-rechtliches französisches Unternehmen für Rundfunk- und Digitalmedien, dessen Hauptaufgabe in der Erfassung, Archivierung und Verbreitung des französischen audiovisuellen Erbes besteht. Um kontinuierlich seinen Nutzern Innovationen zu bieten, bewirbt das INA seine Inhalte und teilt sie mit einem möglichst breiten Publikum. Seit 1995 besteht daher die Doppelfunktion des Instituts darin, einerseits die Archive des öffentlich-rechtlichen Fernsehens zu verwalten, zu bewahren und zu vermarkten und andererseits im Interesse der Kulturpflege die Pflichtexemplare von Film, Fernsehen und Radio zu erfassen und zu betreuen.