Blog / Fondations, Métadonnées

Mois des métadonnées !

Peter Krogh
Mon Jun 29 2020

Nous consacrons ce mois entier aux métadonnées. (Oui, nous savons que nous sommes techniquement toujours en juin, mais chaque jour ressemble au jour de la marmotte.) Nous allons explorer le fonctionnement des métadonnées, ce que vous pouvez en faire et comment créer une excellente stratégie de métadonnées. C'est parti.

Les métadonnées sont un terme qui fait généralement référence aux données sur les données. Cela va du banal (le format d’un fichier ou son emplacement) au sublime (les types de concepts qu’une photo permet d’illustrer ou la structure de récits complexes).

Vous pouvez utiliser des métadonnées pour décrire à peu près toutes les caractéristiques d'un élément multimédia : où il a été créé, à quel point vous l'aimez, le sujet spécifique, les droits d'utilisation, etc.

Une course effrénée vers l'avenir

Idéalement, chaque logiciel devrait pouvoir voir, utiliser et conserver toutes les métadonnées.

Malheureusement, ce n’est pas le cas. Et non, ce n’est pas dû à une conspiration, ni même à une guerre de territoire, c’est simplement une course effrénée vers l’avenir. Nous examinerons les problèmes liés à la gestion des métadonnées un peu plus tard.

Un lieu pour stocker les connaissances

Vous pouvez ajouter des balises, comme des mots-clés, à vos images afin de savoir de quoi il s'agit. Les balises peuvent donc vous aider à trouver des photos dans une bibliothèque. Mais les balises ont également une autre fonction : elles peuvent vous renseigner sur une photo et son sujet.Les tags sont donc également un lieu de stockage des connaissances sur les événements décrits par les médias.Une bibliothèque multimédia centralisée peut donc être un endroit formidable pour stocker des connaissances sur des personnes, des lieux et des événements, tout en stockant en même temps une représentation visuelle des événements.

Les métadonnées associées à votre collection multimédia gagnent en importance et en valeur. Les images elles-mêmes sont de riches réservoirs de données qui sont utiles de manière indépendante. Le graphique d'une image peut représenter les réseaux humains lorsque les photos sont partagées, appréciées et repartagées. Et il existe une énorme richesse d'informations qui peuvent être déduites des dates, des lieux et de l'analyse des images par apprentissage automatique.

Intégration du balisage informatique

Le débat sur les métadonnées était autrefois entièrement centré sur des outils bien établis et normalisés de classification des images, comme les normes Dublin Core et IPTC. Ces outils continuent d'exister (et il est important de les maîtriser dans le cadre de la gestion de votre collection), mais l'avènement du balisage informatique a (et continuera de) changer fondamentalement le paysage des métadonnées.

  • Schémas de métadonnées traditionnelsévoluent lentement en réponse à de nouveaux besoins. Ils restent la méthode de référence pour personnaliser et verrouiller les informations importantes concernant votre collection d'images.
  • Étiquetage informatiquedans de nombreuses versions différentes, l'automatisation d'une part croissante de la charge de travail des métadonnées.
  • ConnectivitéLa connectivité entre les systèmes devient un outil très important pour donner un sens aux collections d'images. Les méthodes d'intégration de votre collection avec d'autres bases de données et bases de connaissances se développent à un rythme rapide.
  • Boîte noireLe marquage et la recherche exploitent toute la puissance des services d'apprentissage automatique. Adobe, Amazon, Apple et Google fournissent tous des environnements de boîte noire qui s'améliorent continuellement à mesure qu'ils en apprennent davantage sur vous et vos images.

Attends, quoi ?

Avant de rentrer dans les détails, laissez-moi approfondir un peu plus ces points. Cela ressemble à un changement assez important par rapport à la façon dont les choses fonctionnaient dans le passé. Et c'est le cas (ou le sera bientôt). Cependant, comme la plupart des changements apportés au flux de travail des médias, il s'appuie principalement sur le passé, plutôt que de le remplacer.

Les métadonnées les plus importantes que vous aurez probablement seront toujours celles que vous aurez vous-même sélectionnées et qui auront été créées, plutôt que celles créées par un robot d’apprentissage profond. Le photographe et/ou le gestionnaire de la collection connaît mille choses qu’il sera très difficile (ou impossible) pour un service d’IA de connaître. Pourquoi la photo a-t-elle été prise ? Quelle est l’histoire de la personne, de l’événement, du lieu ou de l’objet représenté ? Pourquoi tout cela est-il pertinent pour moi, pour la collection et pour les parties prenantes de la collection ?

Pour l’horizon temporel visible, il sera important pour les collections professionnelles et institutionnelles (ainsi que pour de nombreuses collections de passionnés) d’inclure des métadonnées qui reflètent les priorités et les intentions des créateurs, des utilisateurs et des gestionnaires de collections. La meilleure façon de préserver et d’exploiter ces informations est de les enregistrer dans des structures de métadonnées traditionnelles.

Marquage assisté par l'homme

Les services de marquage informatique et de données liées peuvent vous faciliter la vie. Au lieu de les considérer comme un substitut au marquage humain, ils devraient être considérés comme un outil de marquage assisté par l'homme. Certains de ces services seront automatiques, comme le marquage GPS intégré à l'appareil photo. D'autres nécessiteront une intervention plus poussée, comme l'apprentissage de la reconnaissance faciale pour identifier certaines personnes.

Nous sommes sur le point de voir apparaître des fonctionnalités très intéressantes en matière de liaison de données. Certaines d’entre elles sont déjà opérationnelles dans certains endroits, comme les collections institutionnelles où les images sont liées à une base de données de contrats qui précisent les droits d’utilisation. D’autres liens sont encore plus expérimentaux, comme la possibilité de créer des liens vers des bases de connaissances externes telles que Wikipédia. Mais même si ces liens sont faciles à créer, il appartiendra toujours au gestionnaire de la collection de décider vers quels services établir les liens et comment les faire fonctionner.

Boîtes noires

Les systèmes de boîte noire tentent d’effectuer tout le balisage automatiquement. Il s’agit d’une combinaison de reconnaissance visuelle qui peut créer des balises, ainsi que d’agents de recherche intelligents qui peuvent deviner ce qui est important pour vous. Ces systèmes ont encore du chemin à parcourir avant de pouvoir remplacer votre balisage et votre curation gérés par des humains, mais ils s’améliorent rapidement.

Dans ce contexte, les prochains articles examineront le fonctionnement des métadonnées..

Mediagraph est-il adapté à votre organisation ?

Découvrons-le ensemble.

Réservez votre démo aujourd'hui