+ +

Etude de l’image rétinienne

L’image rétinienne

La rétine tapisse la paroi interne de l’œil, mais c’est la macula, au pôle postérieur du globe oculaire qui est le siège de la vision centrale. Au sein de la macula, la rétine dite « fovéale » est le siège de la vision fine, que l’on utilise pour lire un panneau routier, discerner le feuillage d’un arbre au loin, lire un texte, etc. Cette zone n’occupe  qu’une surface de quelques millimètres carrés. Elle contient les cellules photosensibles appelées cônes, dont la surface collectrice n’est que de quelques microns carrés : ces  « pixels » rétiniens ont pour les plus fins une largeur de moins de 2 microns (2 millièmes de millimètres). Le monde environnant est constitué de sources lumineuses primitives (le soleil, les étoiles, un ver luisant, une simple ampoule électrique) et secondaires (les objets qui reflètent ou transmettent passivement une partie de la lumière des sources primitives). La lumière est formée de particules énergétiques dépourvues de masse appelées « photons »:  cette description un peu balistique n’est pas tout à fait complète car certaines expériences montrent que la lumière est également pourvue de propriétés ondulatoires.

Plutôt qu’aborder un débat sur la nature de la lumière, nous considérerons simplement que  la mission qui incombe à l’œil est de collecter une partie de l’information lumineuse dispersée par la source, et d’en former une image fidèle, quelle que soit la nature de cette information. En optique géométrique, les rayons lumineux peuvent être compris comme une représentation abstraite de la trajectoire des photons émis depuis une source; ils permettent surtout de prédire l’endroit où se formera l’image la plus nette d’un objet « vu » par un système optique. Pour former une image rétinienne suffisamment « fidèle » d’une source de lumière, il faut capter puis faire converger vers la rétine les rayons lumineux que cette source émet. Pour simplifier notre étude, nous allons dans un premier temps découvrir qu’il est possible  d’assimiler, et ce quelle que soit sa complexité, le motif visuel observé à un ensemble de structures élémentaires. Puis, nous étudierons la manière dont les éléments constitutifs élémentaires de la scène sont « imagés » sur la rétine.

L’image comme un ensemble  de points élémentaires

Prenons l’exemple de la source de lumière la plus élémentaire : l’étoile. Elle constitue la plus simple des images qu’il soit donné à contempler : en raison de sa distance avec la Terre, elle apparaît comme un simple point brillant qui se détache d’un fond noir et uniforme. Des rayons que l’astre émet dans toutes les directions, l’œil d’un Terrien ne collecte qu’une portion infinitésimale. Pour qu’ils forment l’image nette de l’étoile sur la rétine, focalisée dans le plan des photorécepteurs, on conçoit que ces rayons doivent s’y rencontrer, c’est à dire s’y croiser en un point unique et situé dans ce plan.

image d'une étoile par l'oeil
L’étoile dans un ciel nocturne correspond à une image élémentaire: les rayons émis divergent depuis l’étoile, dans toutes les directions de l’espace. Une partie de ces rayons peut être captée par un observateur qui dirige ses yeux vers l’étoile. Du fait de la distance énorme de l’étoile vis-à-vis des dimensions de l’’œil, les rayons captés sont considérés comme parallèles. La cornée et le cristallin doivent faire dévier (on parle de « réfraction ») ces rayons vers la rétine, où ses rayons devront se « croiser » .

Les rayons captés doivent ainsi converger sur une distance de l’ordre de 2 cm environ: cette distance correspond à la longueur du globe oculaire, qui sépare la cornée à l’avant, de la rétine à l’arrière. Pourtant, les rayons ont divergé depuis leur source stellaire, qui a émis la lumière dans toutes les directions de l’espace. Toutefois, de par la distance astronomique de l’étoile, qui est située à des années lumières, les rayons captés par l’œil sont considérés comme parallèles car provenant d’une source « à l’infini ». Leur convergence ultérieure vers la rétine est assurée par l’effet qu’impriment la cornée et le cristallin à leur trajet.  L’angle de la déflexion infligée aux rayons par ces structures oculaire doit être ajusté avec précision: si la rencontre des rayons survient trop en avant ou en arrière de ce plan, ils y formeront une image élargie, qui aura alors la forme d’un disque et non d’un point. Ceci aura des conséquences sur la netteté et le contraste de l’image rétinienne.

tache de défocalisation
L’image rétinienne de l’étoile est punctiforme si les rayons sont focalisés dans le plan rétinien. Elle prend l’aspect d’un disque si les rayons captés ne sont pas focalisés exactement dans le plan rétinien. Ceci survient quand l’œil est « trop long » (myopie) ou « trop court » (hypermétropie) vis-à-vis de la distance de focalisation de l’œil.

Quand les rayons ne sont pas focalisés dans le plan de la rétine, on les dit « défocalisés » : ils impressionnent la rétine en y formant une tâche de défocalisation: les dimensions de cette tache sont supérieures à celle du point que forment les rayons à l’endroit où ils se coupent (voir par exemple: le flou de la vision du myope) A ce stade, il faut faire une digression et s’éloigner du formalisme de l’optique géométrique, où l’on assimile le déplacement de la lumière au trajet de rayons. Un objet d’apparence ponctuelle (l’étoile) peut produire une image strictement ponctuelle, au croisement précis des rayons : on appelle cette propriété de faire d’un point source un point image le « stigmatisme ». En réalité, la lumière étant munie de propriétés ondulatoires, les trajectoires rectilignes ne peuvent matérialisent la totalité de la trajectoire qu’empruntent les ondes lumineuses. Au contact des obstacles, ces ondes subissent un phénomène dit de « diffraction », qui induit une déviation de leur trajet ; les ondes s’étalent un peu après franchissement de l’obstacle.

Diffraction et PSF
Oeil et tache d etalement de la lumiere defocalisation

Pour l’œil, tout se passe comme si les rayons qui frôlaient le bord de l’iris (qui délimite notre pupille, le diaphragme naturel de l’œil) voyaient leur trajet légèrement défléchi en dehors. C’est la pupille irienne, l’«orifice collecteur de la lumière admise par l’œil», et dont le diamètre se modifie spontanément pour réguler le flux lumineux reçu par la rétine, qui produit le phénomène de la diffraction. Ainsi les rayons lumineux captés ne peuvent être focalisés en un point mathématique, mais forment au minimum une tache circulaire, dont les dimensions dépendent de celle de la pupille, et de la longueur d’onde de la lumière captée. La diffraction empêche le stigmatisme « rigoureux »: ceci n’est pas forcément très délétère pour la vision, puisque les dimensions des photorécepteurs rétiniens  (les « pixels » de la rétine, qui « échantillonnent » l’image rétinienne) ne sont pas non plus ponctuelles, ni même infinitésimales.

Cones et image rétinienne
L’image projetée sur la rétine est échantillonnée par les photorécepteurs de la fovéa (les cônes). La taille des cônes (leur densité) conditionne la quantité de détails que la rétine pourra traiter, un peu comme un écran permettra de représenter plus de détails s’il est plus « riche en pixels ». Les surface collectrice des cônes possède a peu près le même diamètre que la tache d’éclairement optimale que l’œil peut former sur la rétine (l’image d’un point source ne peut être strictement ponctuelle en raison de la diffraction). La taille des cônes conditionne la capacité d’échantillonnage de l’image rétinienne.

En réalité, la Nature a bien fait les choses puisque les dimensions de la tâche d’éclairement de la rétine formée à partir de l’observation d’un point source sont proches de celles des photorécepteurs les plus fins (leur diamètre minimum est proche de 1,5 à 2 microns). La taille des photorécepteurs (dont découle la densité, c’est à dire la finesse du pavage de la surface de la rétine) impose une limite supérieure à la richesse en détails de l’image rétinienne. Pour que cette limite soit atteinte, il faut que la tache d’éclairement ne soit pas significativement plus large que la surface collectrice d’un photorécepteur (voir les page consacrées à l’acuité visuelle et ) la densité en photorécepteurs) L’allure et les dimensions de cette tâche d’éclairement jouent un rôle important vis-à-vis de l’acuité visuelle et la qualité optique de l’œil humain… Les techniques d’exploration dites « aberrométriques » permettent à l’ophtalmologiste de l’étudier : la tache d’éclairement issue de l’observation d’un point source élémentaire (ex : une étoile) est appelée « Fonction d’étalement du point » (FEP), ou « Point Spread Function » (PSF).   Pour appréhender l’importance de la PSF sur certains aspects de la vision, considérons non pas une, mais deux étoiles rapprochées sur la voûte céleste. L’œil aura-t-il l’acuité visuelle requise permet-pour distinguer, c’est-à-dire séparer l’image rétinienne de ces deux étoiles, pourtant très rapprochées dans le ciel ? Pour distinguer chacun des astres lumineux, leurs images rétiniennes, ces taches focales, devront être disjointes, ou au mieux ne pas trop empiéter l’une sur l’autre.

image rétinienne sources séparées
L’image rétinienne de deux étoiles proches sur la voute céleste pourra conduire à la vision de deux astres distincts si l’image rétinienne de chaque étoile est projetée avec un écart suffisant sur la rétine: cet écart dépend de la largeur de chacune des taches d’éclairement. Une condition annexe est que la densité en photorécepteurs soit suffisante pour « échantillonner » les images respectives des étoiles.

 

images rétiniennes oeil hypermetrope
Dans cet exemple d’œil « trop court » (hypermétrope), le plan de la rétine est situé en avant du plan où se coupent les rayons issu du couple d’étoile proches. La tache d’éclairement de chaque étoile est un disque, et les disques empiètent l’un sur l’autre : la rétine ne voit qu’un point unique: les étoiles ne peuvent être « séparées ».

Notre vision ne nous sert que trop rarement à observer et distinguer des étoiles dans les beaux ciels d’été. Dans la vie courante, elle est utilisée pour « voir » des motifs bien plus complexes,  pour s’orienter, repérer des obstacles, reconnaitre des visages familiers, lire, regarder un écran d’ordinateur ou de TV, etc… Ces tâches visuelles ont en commun le même prérequis: former une image du monde environnant suffisamment fidèle sur le tissu rétinien photosensible. Les cas de l’étoile seule ou en duo étaient relativement simples à appréhender; mais qu’en serait-il d’un motif plus complexe comme un paysage, un visage ? On peut se ramener au cas simple de l’étoile, si l’on considère un motif complexe comme un ensemble de points sources élémentaires, à l’instar des artistes peintres de l’école pointilliste qui représentaient le monde comme un assemblage de petites touches en forme de points colorés. Au sein d’une image complexe, isolons un point élémentaire,  au centre du motif observé ; ce point servira alors de référence. Son image rétinienne sera issue de la captation des rayons qu’il émet, et qui formeront après réfraction par la cornée et le cristallin une tache d’éclairement sur la rétine, dont la taille et la forme découlent de la manière dont ces structures optiques de l’œil focalisent les rayons captés.

image rétinienne lettre E
La lettre « E » est considérée comme un ensemble de points sources élémentaires contigûs. On considère que l’image rétinienne correspond à la juxtaposition des images respectives de chaque point élémentaire.

La qualité de la focalisation de ce point découle des effets conjugués d’éventuelles imperfections optiques (aberrations) et de l’inévitable diffraction. Or, cette qualité est identique pour l’ensemble des points proches de  notre point de référence élémentaire. L’image reçue par la rétine centrale au niveau de la fovéa, le siège de la vision fine, est issue de la juxtaposition des taches d’éclairement de ces points adjacents. Cette invariance centrale de la PSF permet de reconstruire ou simuler l’image rétinienne d’un motif complexe, grâce à la simple image rétinienne d’un point source.

image rétinienne d un point source elementaire
On peut considérer une image complexe comme un ensemble de point source juxtaposés. L’image point source élémentaire sera une « tache d’éclairement rétinien » forcément moins compacte, en raison de la diffraction et des imperfections optiques (appelées aberrations) de l’œil considéré. On ne peut pas réellement voir l’image rétinienne d’un œil, mais certaines techniques d’exploration comme l’aberrométrie permettent de « prédire » la manière façon dont l’œil forme une image d’un point élémentaire (on parle de calcul de la PSF). Sur cette illustration, le point source élémentaire est représenté comme un trait vertical, dont la hauteur est proportionnelle à son intensité lumineuse. La répartition de l’énergie du point image a un profil en V inversé, en raison de l’étalement lumineux.

Nous avons vu que la fonction mathématique qui permet de décrire la forme de la tache focale s’appelle la fonction d’étalement du point (PSF : Point Spread Function). Sa dénomination est assez parlante, car  moindre sera l’étalement, meilleure sera la qualité de l’image rétinienne. L’opération qui permet de reconstruire l’image rétinienne d’un objet complexe en appliquant à chacun de ses points élémentaires l’étalement subi par le point de référence s’appelle la convolution.

convolution et simulation de l image retinienne
Si l’on connait la PSF, on peut prédire l’image rétinienne. L’image de référence est décomposée en un ensemble de points élémentaires contigus. Chaque point est « convolué » avec (subit l’étalement de) la PSF ( = FEP pour fonction d’étalement du point). Quand l’étalement du point est important, les images des points adjacents empiètent les unes sur les autres: ceci explique le flou de l’image rétinienne, et l’impossibilité de distinguer certaines lettres. La PSF de l’œil schématisé ici pourrait être celle d’un œil myope ou hypermétrope. L’astigmatisme provoque un étalement asymétrique de la tache d’éclairement, qui adopte un contour ovale.

A l’instar des premiers astronomes qui, scrutant le ciel nocturne, crurent y discerner des motifs familiers dont ils nommèrent des constellations, il est très commode pour les spécialistes de l’optique visuelle de se représenter une scène comme constituée d’une constellation de point sources lumineux élémentaires… Cet ensemble est fait de points contigus, comme ceux d’un tableau pointilliste.  Plus son acuité visuelle est élevée, plus l’œil pourra discerner des points élémentaires distincts au sein d’un motif complexe, et enrichir ainsi la perception des détails d’une scène observée.

L’image comme un réseau de fréquences spatiales

Il existe une autre manière de voir les objets lumineux du monde environnant, qui, bien qu’elle fournisse un moyen d’étude puissant pour l’étude de certaines caractéristiques de la vision humaine, nous apparait moins intuitive. Un accord musical est analogue à la superposition de fréquences sonores distinctes, dont la fréquence de chacune détermine la hauteur de la note qu’elle porte, et l’amplitude son intensité (c’est-à-dire le volume sonore qu’elle occupe au sein de l’accord). Par analogie, n’importe quel motif visuel peut être assimilé à une superposition de « fréquences spatiales ». Ces dernières sont des constructions théoriques, mais leur champ d’application est vaste : n’importe quel motif visuel peut être décomposé en un ensemble propre de fréquences spatiales. Ce domaine d’étude ne fait pas partie de l’optique géométrique, et le paragraphe suivant peut être sauté par le lecteur pressé. Il est toutefois intéressant de poursuivre notre incursion dans le domaine des fréquences spatiales pour mieux appréhender les méthodes d’analyse de qualité et de traitement de l’image. Les fréquences spatiales sont des « franges ondulantes » : leur luminosité alterne continument et régulièrement entre régions plus claires et plus sombres. La qualité de l’image rétinienne ne dépend pas que de la densité des détails perçus ; elle dépend également de la restitution d’un bon contraste. Le rendu du contraste concerne la capacité à discerner non pas simplement deux étoiles proches dans le ciel nocturne quand elles brillent de manière comparable (séparer deux points blancs sur un fond noir), mais de continuer à le faire quand leur éclat pâlit, alors que le ciel lui s’éclaircit (il s’agirait maintenant de séparer deux points gris clairs sur un fond gris foncé).

frequences spatiales et lettre E
En effectuant une analogie musicale un peu audacieuse, on peut assimiler ces fréquences spatiales aux « notes » principales, celles qui domineraient dans un accord « E ». Pour que l’œil puisse percevoir la lettre « E », il est important que le contraste de ces fréquences (l’intensité des notes principales) au sein de l’image rétinienne soit non nul, et supérieur au seuil minimal de perception du contraste. Pour coder pour la lettre E telle que représentée ici, avec des bords bien nets, il faut utiliser d’autres fréquences spatiales, plus «hautes ». Si l’intégralité de ces fréquences est transmise avec un contraste suffisant au niveau rétinien, la lettre sera identifiable et perçue comme nette. Si une partie des fréquences les plus élevées est transmise avec un contraste insuffisant pour être détecté, l’œil pourra identifier la présence d’une lettre « E », à condition qu’au moins les fréquences représentées sur cette illustration soient transmises avec un contraste suffisant.

Une fréquence spatiale est une variation d’intensité lumineuse dont le profil ondule comme une sinusoïde, alternant zones plus sombres (du gris moyen au noir – minimum – avant de revenir au gris moyen) et zones plus claires (du gris moyen au blanc – maximum – avant de revenir au gris moyen). L’association d’une zone sombre et d’une zone claire constitue un cycle : le nombre de cycles par unité de distance définit la valeur de la fréquence spatiale. Plus la fréquence est élevée, plus les cycles sont nombreux: on comprend intuitivement que le degré d’une fréquence est proportionnel à la finesse du détail qu’elle « code » dans l’image. Son amplitude (maximale si un cycle va du blanc au noir, moindre si un cycle va du gris clair au gris foncé, nulle si le niveau de gris ne change pas) correspond au contraste que possède ladite fréquence dans l’image. Nous avons vu qu’à l’instar d’un accord musical qui se décompose en notes de musiques, n’importe quelle image pouvait être comprise comme la superposition d’un ensemble déterminé de fréquences spatiales superposées. Cette propriété ne s’applique pas qu’au motif observé… elle concerne également l’image rétinienne ! De plus, l’image d’une fréquence spatiale par un système optique est la même fréquence spatiale (même nombre de cycles par degré), mais dont le contraste est modulé (toujours à la baisse, ne serait-ce qu’en raison de la diffraction).  Modulation du contraste de l image retinienne frequence spatiale 50 pcSi sa composition en fréquences spatiales est identique à celle du motif observé, et que leur amplitude n’est que peu diminuée, l’image sera fidèle à l’original. Bien évidemment, ne serait-ce que parce qu’une partie de la lumière émise et captée par l’œil diffracte au niveau des bords de la pupille, la composition fréquentielle de l’image rétinienne est toujours  un peu moins « riche » que celle du motif visuel de référence. La perte de détails dans une image (le flou), est due à la réduction excessive du contraste des hautes fréquences spatiales dans l’image rétinienne ; ces fréquences, qui codent pour les détails de l’image, ne sont plus perçues. Une image floue est appauvrie en détails, c’est une image d’où l’on a retiré certaines fréquences spatiales.

contraste modulé sous le seuil
Le contraste de l’objet (une fréquence spatiale) est de 100%: en raison de la diffraction et des aberrations optiques éventuelles, le contraste de la fréquence spatiale image est réduit: ce contraste peut être inférieur à un seuil en deçà duquel les voies visuels ne peuvent transmettre l’information. La fréquence est « coupée », et les détails qu’elles codent dans l’image ne sont plus perçus.

Au terme d’un calcul dont nous tairons la complexité, on peut établir un relevé appelé «courbe de transfert de modulation » (FTM, ou MTF en anglais) qui traduit la manière dont l’œil module l’amplitude (le contraste) de chaque fréquence spatiale. La position des points de la courbe MTF est un peu analogue à celle qu’occuperaient les curseurs d’une table de mixage audio : ils traduisent la modulation du contraste que subit la fréquence concernée (plus ou moins grave, medium, aigue en audio ; plus ou moins basse, moyenne ou élevée en optique).

Laisser un commentaire

Vous pouvez poser des questions ou commenter ce contenu : pour cela, utilisez le formulaire "commentaires" situé ci-dessous. Seront traitées et publiées les questions et commentaires qui revêtent un intérêt général, et éclairent ou complètent les informations délivrées sur les pages concernées.

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *