Blog / Fondations, Métadonnées

Où vivent les métadonnées ?

Peter Krogh
Wed Jul 01 2020

Les métadonnées d’un fichier multimédia peuvent se trouver à plusieurs endroits. Cela soulève la question de l’emplacement des métadonnées. Nous y reviendrons un peu plus tard.

Intégré dans le fichier

La plupart des types de fichiers multimédias peuvent stocker des métadonnées directement dans le fichier lui-même. Cela se fait généralement dans l'en-tête du fichier, qui est un bloc de stockage distinct de la charge utile du média réel. Le stockage des métadonnées dans l'en-tête du fichier permet aux programmes de lire, de modifier ou d'utiliser facilement les métadonnées sans décoder l'intégralité du fichier. Cela rend les métadonnées à la fois accessibles et portables.

L'intégration de métadonnées dans un fichier est l'un des moyens les plus simples de rendre les balises détectables lorsqu'un fichier est déplacé d'un endroit à un autre et d'une application à une autre. Il n'existe aucun moyen de verrouiller de manière permanente les métadonnées intégrées dans la plupart des types de fichiers. Il est donc possible de les supprimer du fichier au fur et à mesure de sa transmission.

Dans un fichier side-car

Les métadonnées peuvent également résider dans un fichier texte stocké à côté du fichier multimédia. Ce fichier peut être enregistré sous la forme d'un fichier sidecar par fichier multimédia ou d'un fichier sidecar par dossier de fichiers. Ces fichiers sidecar sont généralement utilisés lorsque le fichier multimédia est un type de fichier propriétaire qui n'est pas entièrement documenté. Dans ces cas, il est possible que l'écriture de métadonnées dans l'en-tête du fichier puisse corrompre par inadvertance l'image. L'approche la plus sûre consiste donc à écrire les métadonnées dans un fichier séparé.

Les fichiers sidecar peuvent également être utilisés lorsque les concepteurs de l'application souhaitent prendre en charge un flux de travail en lecture seule strict pour les fichiers sources. Cela peut être le cas même lorsqu'il est possible de réécrire dans les fichiers en toute sécurité.

Les fichiers texte Sidecar créés par le logiciel Adobe (et les logiciels compatibles) porteront l'extension XMP. Malgré l'extension de fichier personnalisée, il s'agit simplement de fichiers texte ordinaires.

Dans une base de données de bibliothèque

Les métadonnées peuvent être stockées dans une base de données de bibliothèque. La plupart des logiciels de bibliothèque liront et stockeront les métadonnées intégrées lorsque le fichier sera indexé pour la première fois par le logiciel. Les nouvelles balises créées dans la bibliothèque seront stockées dans la base de données, par exemple un mot-clé ajouté dans Lightroom. Il peut être possible de réécrire tout ou partie des métadonnées de la base de données dans le fichier ou dans le fichier annexe.

Conserver la copie « principale » de vos métadonnées dans une base de données présente plusieurs avantages. La centralisation facilite la recherche et l’organisation des métadonnées, et garantit une utilisation cohérente des balises. La centralisation de toutes vos métadonnées facilite également la création d’une sauvegarde complète du balisage et de la conservation que vous effectuez sur vos fichiers multimédias. Il est beaucoup plus facile de sauvegarder un catalogue que de sauvegarder plusieurs milliers de fichiers individuels.

Notez que le logiciel de bibliothèque rencontrera probablement des métadonnées intégrées qu'il ne pourra pas comprendre. Si la base de données de la bibliothèque n'est pas conçue pour fonctionner avec un espace de noms spécifique, elle sera généralement ignorée. Étant donné le nombre important et croissant de schémas, cela doit être attendu pour au moins certaines métadonnées.

Dans le nuage

Un service cloud doit se comporter de la même manière qu'une base de données de bibliothèque. Les métadonnées comprises doivent être analysées dans la base de données cloud pour pouvoir être utilisées. Les métadonnées non comprises doivent être ignorées mais pas détruites. Dans la plupart des cas, cela se fait en stockant les balises dans un BLOB.

Dans un BLOB

Autre exemple d'humour de nerd informatique : un objet binaire de grande taille (BLOB) est un gros bloc de données numériques qui est stocké dans une base de données sans être analysé en champs. En général, les BLOB sont utilisés pour stocker des informations que le logiciel de base de données ne comprend pas, comme des balises provenant de schémas non pris en charge. Le stockage des informations sous forme de BLOB préserve les informations et permet leur transmission à des fichiers dérivés.

L'enregistrement de métadonnées non prises en charge sous forme de BLOB peut permettre au service cloud ou à la base de données d'offrir un certain niveau de prise en charge des schémas et des espaces de noms inconnus. Les données stockées dans un BLOB peuvent être accessibles via l'intégration avec des services externes. Ainsi, mon service cloud peut ne pas comprendre toutes les métadonnées GPS, mais si toutes les balises GPS se trouvent dans un BLOB, un autre service peut être en mesure de rechercher et d'utiliser les balises GPS non prises en charge. Étant donné que les BLOB contiennent des données non analysées, leur accès peut être assez lent. Néanmoins, lent est probablement mieux que non existant.

Dans un projet

Si vous utilisez un logiciel de création de projets comme InDesign ou Premiere Pro, il est probable que des métadonnées utiles soient stockées dans le fichier de projet lui-même. Au minimum, le fichier de projet contient des informations sur les fichiers sources utilisés et sur la manière dont un fichier multimédia est utilisé dans le projet, par exemple, sur quelle page l'image apparaît-elle ? Il peut être possible d'extraire ces informations du fichier de projet, ou les métadonnées peuvent n'être utiles qu'à l'intérieur du logiciel de projet lui-même.

Bases de données liées

Les informations sur vos médias peuvent également être stockées dans une base de données liée. Par exemple, vous pouvez lier les balises GPS d'une image à des informations supplémentaires sur le lieu où une photo a été prise. Ce domaine devrait connaître une croissance assez rapide à mesure que de plus en plus de bases de données et de services sont liés entre eux via des API.

Mediagraph est-il adapté à votre organisation ?

Découvrons-le ensemble.

Réservez votre démo aujourd'hui