Garant des archives de la télévision, de la radio et des médias web français, l’INA est responsable de la bonne conservation du patrimoine audiovisuel national, de sa sauvegarde et de sa valorisation auprès du grand public, des chercheurs et des professionnels.
À l’époque de la création de l’INA, le paysage audiovisuel français se résumait à une poignée de chaînes, toutes publiques. Depuis, le périmètre d’actions de l’Institut s’est considérablement élargi, tout comme le volume de flux audiovisuels à traiter : l’INA capture quotidiennement 184 chaînes télé et stations de radio, et collecte les contenus de plus de 15 000 comptes de réseaux sociaux, plus de 10 000 comptes de plateformes vidéo, et plus de 5 000 collections de podcasts.
Pour mener à bien sa mission, l’Institut doit en outre composer avec un héritage technologique constitué de différentes solutions mises en place successivement. Résultat : les données sont enfermées dans des systèmes étanches et nécessitent d’incessantes synchronisations manuelles d’une base de données à l’autre.
C’est cette situation qui a mené l’INA à mettre en place en 2014 une stratégie de gouvernance des données basée sur la refonte de son système d’information. Cette approche, visant à centraliser et harmoniser les systèmes, a permis à l’INA de lancer différents projets d’automatisation de production des données.
Actuellement, le traitement documentaire des médias au dépôt légal s’appuie sur des données acquises auprès de sociétés de diffusion ou de quelques agences spécialisées dans la veille médiatique. Mais ces données fournies par les chaînes sont parfois incomplètes et surtout, prévisionnelles, ce qui implique de nombreuses vérifications.
C’est pourquoi l’INA s’est intéressé à l’automatisation du découpage et du catalogage des programmes audiovisuels. L’objectif : s’affranchir du « millefeuille » technologique et des problèmes inhérents (données non harmonisées, doublons…), pour obtenir une solution intelligente combinant différents outils. Une solution à la fois capable d’identifier les programmes audiovisuels et de reconstituer les grilles de programmation journalières pour faciliter le catalogage et la description des collections.
Le but de l’automatisation est de gagner en autonomie dans la reconstitution des grilles de programme, de mieux valoriser les données de l’Institut, et de participer à la mise en place d’un accès unifié et détaillé aux archives audiovisuelles.
L’INA a choisi la plateforme Deepomatic pour constituer et entraîner ses propres modèles de classification d’image, afin d’effectuer un premier découpage des programmes par journée. L’Institut a été convaincu par la promesse de Deepomatic : permettre rapidement aux équipes métiers d’être totalement autonomes, sans avoir recours systématiquement aux compétences d’un data scientist.
La solution a d’abord permis une segmentation des JT, en distinguant automatiquement les images de plateau des images de reportage, des génériques ou encore des images météo. Ces premiers résultats ont ensuite permis d’envisager l’analyse des journées de diffusion de 24H provenant des chaînes d’information en continu.
La classification d’images proposée par Deepomatic permet non seulement de distinguer des éléments « universels » comme les plateaux, mais aussi des éléments « spécifiques », comme le plateau de telle ou telle émission.
L’INA projette désormais de faire intervenir Deepomatic sur les émissions de variété musicale et les talkshows : des formats aux structures plus complexes, alternant passages en plateau, performances artistiques, reportages et interviews.
Pour l’INA, les bénéfices de Deepomatic sont de trois grands ordres :
Un gain de temps, et une précision optimisée dans le catalogage et l’indexation des vidéos
La contribution à la stratégie de gouvernance et d’enrichissement du lac de données de l’Institut pour mieux les valoriser (maintenir le lien entre les différentes données, les enrichir et les mettre en relation…)
L’autonomie, à la fois dans le déploiement et dans la modélisation, grâce à une interface complète et intuitive facile à utiliser pour les utilisateurs métier
Créé en 1975, l’Institut national de l’audiovisuel (INA), est une entreprise publique audiovisuelle et numérique ayant pour mission la collecte, la sauvegarde et la valorisation du patrimoine audiovisuel français. Pour innover sans cesse en matière d’expérience utilisateurs, l’INA valorise ses contenus et veille à les partager avec le plus large public possible. Sa double mission l’amène ainsi, depuis 1995, à gérer, conserver et commercialiser les archives de l’audiovisuel public d’une part, et de l’autre à assurer, dans une optique de conservation culturelle, la collecte et la consultation du dépôt légal de l’audiovisuel (film, TV et radio).
Deepomatic Paris, 53 rue de Turbigo, 75 003 Paris
Deepomatic New York, 447 Broadway, 2nd FL, New York, NY, 10 013