Blog / Fondations, Métadonnées

Schémas de métadonnées, partie 1

Peter Krogh
Wed Jul 08 2020

Pour comprendre la quantité d’informations pouvant être communiquées à l’aide de métadonnées, et pour mieux comprendre les données structurées, examinons plusieurs schémas différents. Vous pourrez voir comment ils sont axés sur un objectif et comment certains d’entre eux se chevauchent. Cela est utile pour comprendre comment utiliser les métadonnées plus efficacement.

Dublin Core

Nommé d'après Dublin, Ohio, où la norme a été créée en 1995, le Dublin Core est une norme de métadonnées qui a commencé avec 15 champs pour décrire les fichiers numériques. Il s'agissait d'une première tentative de décrire des objets numériques avec un ensemble très large de caractéristiques. Bien qu'il ne soit pas spécifique aux images, le Dublin Core, avec la norme IPTC, a constitué la base des métadonnées modernes. Une grande partie du schéma Dublin Core a été intégrée à la norme IPTC.

Si vous regardez la notation des métadonnées XMP, vous pouvez toujours voir le Dublin Core. Les mots-clés, par exemple, sont en fait écrits dans un champ appelé dc:subject, qui fait référence à l'ancien champ Sujet du Dublin Core, et le nom du photographe est écrit dans le champ dc:author. Cette syntaxe partagée est un héritage du développement et de la fusion des normes de métadonnées

EXIF

EXIF est une norme utilisée par les fabricants d'appareils photo pour stocker les informations créées par l'appareil photo dans le fichier. Elle a été créée par la Japan Electronic Industries Development Association (JEIDA) en 1995 et la révision la plus récente a été effectuée en 2016. La figure 4-15 montre certaines des valeurs EXIF écrites dans un fichier Nikon D750 et une photo iPhone. Les informations EXIF sont divisées en deux types :

  • Codage des médias- Cela inclut des informations sur la structure du fichier, le modèle de couleur utilisé, ainsi que la résolution et les dimensions en pixels de l'image. Ces informations sont assez invisibles pour la plupart des utilisateurs et sont utilisées par les programmes pour décoder le fichier image.
  • Paramètres de l'appareil photo- Cela inclut la date et l'heure, ainsi que les paramètres d'exposition, d'objectif et d'équilibre des couleurs. Ces paramètres sont généralement compris par les logiciels d'imagerie et de gestion des images numériques et peuvent aider à organiser les images. EXIF peut également contenir des données GPS, que nous examinerons plus loin dans le chapitre.

Universalité?

Bien que la spécification EXIF soit standardisée, elle est implémentée différemment selon les modèles d'appareils photo. Par conséquent, tous les champs EXIF n'existent pas dans tous les fichiers et, même s'ils existent, les données peuvent ne pas être accessibles aux tiers car elles ne peuvent pas être comprises. Parfois, cela est dû au fait qu'un fabricant d'appareils photo souhaite masquer les informations, et parfois, il s'agit simplement d'un sous-produit de la façon dont l'appareil photo écrit le fichier. Les fabricants d'appareils photo, d'ordinateurs et de logiciels tentent de résoudre cette situation par l'intermédiaire du groupe de travail sur les métadonnées.

Groupe de travail sur les métadonnées

Le Metadata Working Group (MWG) est une autre initiative visant à normaliser l'échange de métadonnées. Cet effort a été mené par Microsoft, Adobe, Apple, Canon, Nokia et Sony. Ils se sont concentrés sur les règles de gestion des métadonnées, ainsi que sur certains problèmes plus épineux comme la reconnaissance faciale et d'autres balises qui s'appliquent à une partie spécifique de l'image.

Les règles de gestion des métadonnées publiées par le MWG servent de lignes directrices aux fabricants de logiciels lors de la création de fichiers dérivés ou du traitement d'images. Étant donné que nous utilisons un grand nombre de schémas et qu'aucun programme d'application ne les comprend tous, le MWG a travaillé à la création d'un traitement standardisé de ces informations.

Balisage de région

L’autre gros problème auquel s’est attaqué le MWG est le marquage de région. Lorsque Facebook, Lightroom ou votre appareil photo dessine un cadre autour d’un visage et vous permet d’ajouter un nom, vous marquez une région de l’image. Il s’agit d’une fonctionnalité utile qui connaîtra une croissance significative à l’ère du marquage informatique. Les outils d’IA et de machine learning étant capables de mieux identifier les visages ou les objets individuels dans une image, il sera pratique que ces balises fassent directement référence à la partie de l’image qui a été identifiée.

Bien qu’il soit relativement facile de dessiner un cadre sur une image en utilisant des coordonnées de pixels x-y, il est plus difficile de rendre ces informations durables. Les positions x-y doivent être recalculées lorsqu’une image est redimensionnée, pivotée ou recadrée. La solution proposée par le MWG prévoit un processus de conservation de ces balises même dans le cas de ce type de transformation de l’image. Bien que cette solution ne soit pas universellement acceptée, nous disposons au moins d’une méthode convenue pour préserver les données.

Mediagraph est-il adapté à votre organisation ?

Découvrons-le ensemble.

Réservez votre démo aujourd'hui