Les représentations tridimensionnelles prennent de plus en plus d’importance dans la communication visuelle. Dans l’article d’aujourd’hui, nous examinons certaines des méthodes utilisées pour capturer et représenter des images en 3D.
Il existe de nombreuses façons différentes d’enregistrer et d’utiliser la profondeur dans les images visuelles. Il existe plusieurs formats prenant en charge la profondeur qui sont simplement des extensions d’images fixes uniques, et nous les examinerons rapidement ici. Chacun d’entre eux utilise plusieurs images qui sont combinées pour créer un rendu tridimensionnel. Et chacun d’entre eux est de plus en plus accepté comme une technique qui va au-delà d’un logiciel ou d’un fabricant particulier. Notez qu’il est également possible que chacune de ces techniques soit également utilisée pour les images animées.
Paires stéréoscopiques
L'imagerie dimensionnelle est depuis longtemps possible grâce à l'utilisation de paires stéréoscopiques, une pour chaque œil. Ces images produisent l'illusion de profondeur lorsqu'elles sont correctement visualisées, par exemple sur un téléviseur stéréo, un casque, un GAF ViewMaster ou un autre appareil de visualisation binoculaire. La diapositive au format réaliste dans la bannière de cet article est un exemple de format stéréo populaire du milieu du siècle.
Projections de Mercator et images sphériques
Les informations de profondeur peuvent également être capturées et représentées sous forme de panorama sphérique. C'était une utilisation courante de Quicktime VR aux débuts de l'imagerie numérique. L'imagerie sphérique est désormais possible avec les smartphones et les appareils photo dédiés comme le Ricoh Theta. Il existe deux principales façons d'enregistrer ces images. Une projection Mercator « déroule » une sphère sur un rectangle. Lorsqu'elle est visualisée avec le logiciel approprié, l'image est réintégrée dans un modèle sphérique.
Les images sphériques peuvent également être représentées sous forme d'images fisheye jumelles à 180 degrés ou plus. Là encore, celles-ci peuvent être enroulées sur une sphère dans un logiciel pour une expérience de visualisation plus convaincante.

Une projection Mercator, créée sous forme d'image fixe par Rich Theta, montre comment une image sphérique peut être dépliée pour s'insérer dans un cadre rectangulaire.

C'est ainsi que le Ricoh Theta enregistre une vidéo sous forme de paire de « bulles ». Elles sont réassemblées lors de la lecture.
Cartes de profondeur du canal alpha
Enfin, les informations de profondeur peuvent être représentées par un canal alpha qui traduit la distance relative en tons clairs et foncés. Cette méthode est utilisée à la fois par les téléphones Apple et Android et est susceptible d'être plus dominante que les méthodes décrites ci-dessus. Il y a deux raisons à cela. La première est que ces informations peuvent être créées presque instantanément avec des téléphones avec appareil photo ordinaires. La deuxième est qu'il existe une variété de cas d'utilisation, comme indiqué ci-dessous.

Voici un exemple de canal alpha utilisé comme carte de profondeur. Les éléments plus sombres sont plus proches que les plus clairs. Vous pouvez également voir le panneau des canaux dans Photoshop. Cette technique est utilisée depuis un certain temps dans plusieurs applications. Les nouveaux téléphones sensibles à la profondeur peuvent les créer automatiquement. Photo reproduite avec l'aimable autorisation deColleen Wheeler/www.Deke.com
- Profondeur de champ sélective- Les téléphones qui proposent le « mode portrait » utilisent la carte de profondeur pour créer une profondeur de champ étroite de manière synthétique. La carte de profondeur peut être utilisée pour ajouter du flou aux parties de l'image les plus éloignées du visage ou pour assombrir l'arrière-plan, produisant ainsi des portraits plus spectaculaires.
- Intégration avec la réalité augmentée- La réalité augmentée utilise généralement la perception géométrique pour placer des objets dans une scène. Pour ce faire, l'appareil de réalité augmentée doit être capable de définir des relations dimensionnelles dans une scène et de faire en sorte qu'un objet s'intègre naturellement dans cette scène. Les cartes de profondeur permettent à l'appareil de réalité augmentée de comprendre le sujet de la photo comme un objet tridimensionnel et de le placer plus facilement de manière crédible.
- Autres fonctionnalités de l'IA- Il existe toutes sortes d'astuces qui peuvent être réalisées lorsque des informations de profondeur sont incluses dans une image. Les arrière-plans peuvent être supprimés, un éclairage synthétique peut être appliqué ainsi que d'autres transformations de proportions. En termes plus simples, l'ajout d'informations de profondeur aux images ouvrira tout un nouveau monde de possibilités d'imagerie qu'il est difficile d'imaginer à l'heure actuelle.
Comment les cartes de profondeur sont-elles capturées ?
Il existe plusieurs façons de capturer des cartes de profondeur, mais l’une d’entre elles est de plus en plus courante sur les smartphones. Les appareils photo des smartphones peuvent rapidement refaire la mise au point et capturer plusieurs images en une fraction de seconde. Ces images peuvent être traitées pour trouver les zones nettes. Comme l’appareil photo sait où il fait la mise au point lorsqu’il prend la photo, il est possible de créer une « carte » de la distance relative des éléments de la photo.
RVB-D
Toutes les méthodes ci-dessus pour décrire la profondeur entrent dans la catégorie générique Rouge, Vert, Bleu, Profondeur (RVB-D). Cette désignation est un terme générique pour les images numériques qui ont un composant de profondeur intégré, bien qu'elle implique généralement l'utilisation d'une carte de profondeur. Elle a d'abord été popularisée pour décrire la façon dont Microsoft Kinect « voit » les informations de profondeur.
Il existe plusieurs autres façons de représenter la profondeur numériquement.Nuages de pointssont des ensembles de coordonnées tridimensionnelles qui peuvent être utilisées pour construire des espaces de réalité virtuelle.
Dans le prochain article, nous examinerons la connectivité cloud et un composant émergent de l’imagerie visuelle.