Sound is a pressure wave — a rapid back-and-forth compression of air molecules that travels from a source to our ears. When a loudspeaker cone pushes forward, it compresses the air in front of it; when it pulls back, it creates a rarefaction. This alternation, repeated hundreds or thousands of times per second, is what we perceive as sound.
Three essential properties define what we hear:
A pure tone is a simple sine wave — a single frequency with no overtones. Real musical sounds are complex tones: they contain a fundamental frequency f₀ plus a series of harmonics at 2f₀, 3f₀, 4f₀… The relative amplitudes of these harmonics give each instrument its unique voice.
A loudspeaker is essentially a circular membrane driven by an electromagnet. When it vibrates in its simplest mode, the entire cone moves back and forth uniformly — producing a pure tone. But at higher frequencies or with more complex signals, the cone vibrates in partial modes: some regions push while others pull, creating patterns identical in structure to Zernike polynomials.
This synthesizer exploits this exact analogy: each Zernike aberration mode is treated as a vibration pattern of a circular membrane (the pupil disk = the speaker cone). The spatial pattern is converted into a time-varying audio signal — literally "listening" to how a wavefront would sound if it were a vibrating drumhead.
Zernike polynomials form a complete orthonormal basis on the unit disk. They decompose any aberrated wavefront into elementary modes. Each polynomial Znm(ρ, θ) is defined by a radial order n and an azimuthal frequency m:
When a circular membrane (like a drumhead) vibrates, certain regions oscillate up while others oscillate down. The boundaries between these regions — where the surface remains perfectly still — are called nodal lines. They come in two types:
Nodal patterns of Zernike modes. Gold dashed lines = nodal lines (zero displacement). +/− = regions vibrating in opposite phase.
In the animated phase map, the wavefront oscillates as Z(ρ,θ)·cos(ωt): red regions swap with blue through a flat zero-crossing, exactly like a vibrating membrane. The animation (~1.8 Hz) is slowed for visibility.
The exact eigenmodes of a clamped circular membrane use Bessel functions Jn(αnm·ρ). The Zernike radial polynomials Rn|m|(ρ) are not identical, but share key structural properties:
The key insight: both families produce the same nodal topology for a given (n,m) — same count of circles and diameters. This is why Zernike modes can be meaningfully "heard" as membrane vibrations: the spatial structure maps naturally to vibrational modes.
Each Zernike mode is decomposed into harmonics. The azimuthal frequency |m| sets the dominant harmonic (|m|=3 → 3×f₀). The radial structure adds sidebands. Sweep modulates ρ over time, evolving timbre.
A sinusoidal carrier sin(2πf₀t) is mapped to the angular coordinate θ. The Zernike polynomial acts as a nonlinear transfer function that re-shapes the carrier waveform. Higher Drive = wider θ excursion = richer harmonics through progressive distortion.
Inspired by Chowning's FM synthesis. The wavefront Z(ρ₀, θ(t)) modulates the phase of a carrier. With fmod = f₀, the azimuthal structure at |m| generates integer harmonics at |m|·f₀ — keeping results tonal. The modulation index β (Drive) controls sideband count and amplitude.
The pupil disk is scanned in a spiral: ρ oscillates slowly at Sweep frequency while θ rotates rapidly at f₀. The output Z(ρ(t), θ(t)) captures both radial and angular structure — like tracing a finger across a vibrating drumhead in an expanding spiral.
The large circular display shows the resultant wavefront — the combined Zernike polynomial evaluated across the unit disk. Colors encode the wavefront height: red = positive (surface pushed forward), blue = negative (surface pulled back). When a note plays, this map oscillates like a vibrating membrane, showing the sound's spatial "fingerprint".
The waveform shows the time-domain signal — the actual air pressure variations that your speakers produce. The horizontal axis is time (a few milliseconds); the vertical axis is amplitude. Two channels are shown: blue = Left and orange = Right. The shape of this curve directly reveals the timbre:
The spectrum shows the frequency-domain decomposition of the sound — which harmonics are present and how loud each one is. Each vertical bar represents one frequency component. The height of the bar shows its amplitude. This is the Fourier transform of the waveform: it reveals the harmonic "recipe" that creates the timbre. The color gradient runs from magenta (low) through violet to cyan (high).
m=0 modes (defocus, spherical) have rotational symmetry — no angular variation, so θ-scanning alone produces silence. In non-additive modes, they act as amplitude modulation on the carrier, "breathing" energy without adding fictitious frequencies. A 20 Hz high-pass filter removes residual DC.
Noll (1976) J. Opt. Soc. Am. — Zernike polynomials & turbulence. Thibos et al. (2002) J. Refract. Surg. — OSA/ANSI standards. Chowning (1973) J. Audio Eng. Soc. — FM synthesis. Fletcher & Rossing (1998) Physics of Musical Instruments. Gatinel et al. — IOL calculations & wavefront analysis, gatinel.com
Le son est une onde de pression — une compression et décompression rapide des molécules d'air qui se propage de la source à nos oreilles. Quand la membrane d'un haut-parleur avance, elle comprime l'air devant elle ; quand elle recule, elle crée une raréfaction. Cette alternance, répétée des centaines ou milliers de fois par seconde, est ce que nous percevons comme un son.
Trois propriétés essentielles définissent ce que nous entendons :
Un son pur est une simple sinusoïde — une seule fréquence. Les sons musicaux réels sont des sons complexes : ils contiennent une fondamentale f₀ plus une série d'harmoniques à 2f₀, 3f₀, 4f₀… Les amplitudes relatives de ces harmoniques donnent à chaque instrument sa voix unique.
Un haut-parleur est essentiellement une membrane circulaire entraînée par un électroaimant. En vibration simple, tout le cône avance et recule uniformément — produisant un son pur. Mais à des fréquences plus élevées ou avec des signaux complexes, le cône vibre en modes partiels : certaines zones poussent tandis que d'autres tirent, créant des motifs structurellement identiques aux polynômes de Zernike.
Ce synthétiseur exploite cette analogie : chaque mode d'aberration de Zernike est traité comme un motif de vibration d'une membrane circulaire (le disque pupillaire = le cône du haut-parleur). Le motif spatial est converti en signal audio — on « écoute » littéralement comment un front d'onde sonnerait s'il était une peau de tambour vibrante.
Les polynômes de Zernike forment une base orthonormale complète sur le disque unité. Ils décomposent tout front d'onde aberrant en modes élémentaires. Chaque polynôme Znm(ρ, θ) est défini par un ordre radial n et une fréquence azimutale m :
Quand une membrane circulaire (peau de tambour) vibre, certaines régions oscillent vers le haut tandis que d'autres oscillent vers le bas. Les frontières entre ces régions — là où la surface reste parfaitement immobile — sont les lignes nodales. Il en existe deux types :
Motifs nodaux. Tirets or = lignes nodales (déplacement nul). +/− = régions en opposition de phase.
Les modes propres d'une membrane encastrée utilisent les fonctions de Bessel Jn(α·ρ). Les polynômes radiaux de Zernike Rn|m|(ρ) ne sont pas identiques, mais partagent la même structure :
L'idée clé : les deux familles produisent la même topologie nodale — même nombre de cercles et de diamètres. Les modes de Zernike se « traduisent » naturellement en vibrations de membrane.
Chaque mode est décomposé en harmoniques. |m| détermine l'harmonique dominant (|m|=3 → 3×f₀). La structure radiale ajoute des bandes latérales. Sweep module ρ pour un timbre évolutif.
Le polynôme sert de fonction de transfert non linéaire. Plus le Drive est élevé, plus l'excursion θ est grande → distorsion progressive → harmoniques plus riches.
Le front d'onde module la phase de la porteuse. Avec fmod = f₀, la structure azimutale génère des harmoniques entiers à |m|·f₀. L'indice β (Drive) contrôle le nombre de bandes latérales.
Balayage en spirale : ρ oscille à Sweep tandis que θ tourne à f₀. La sortie Z(ρ(t), θ(t)) capture les deux structures en un balayage continu.
Le grand affichage circulaire montre le front d'onde résultant — le polynôme de Zernike combiné évalué sur le disque unité. Les couleurs encodent la hauteur du front d'onde : rouge = positif (surface poussée vers l'avant), bleu = négatif (surface tirée vers l'arrière). Quand une note joue, cette carte oscille comme une membrane vibrante.
L'oscilloscope montre le signal temporel — les variations de pression réelles que vos haut-parleurs produisent. L'axe horizontal = temps (quelques millisecondes) ; l'axe vertical = amplitude. Deux canaux : bleu = Gauche et orange = Droite. La forme de cette courbe révèle directement le timbre.
Le spectre montre la décomposition fréquentielle du son — quels harmoniques sont présents et à quelle intensité. Chaque barre verticale représente une composante fréquentielle. C'est la transformée de Fourier de la forme d'onde : elle révèle la « recette » harmonique qui crée le timbre. Le dégradé de couleur va du magenta (grave) au cyan (aigu).
Modes m=0 : symétrie de révolution → pas de variation angulaire → silence au balayage θ seul. En modes non-additifs, ils agissent comme modulation d'amplitude. Filtre passe-haut 20 Hz élimine le DC.
Noll (1976) J. Opt. Soc. Am. Thibos et al. (2002) J. Refract. Surg. Chowning (1973) J. Audio Eng. Soc. Fletcher & Rossing (1998) Physics of Musical Instruments. Gatinel et al. — gatinel.com