La Stéréophonie
Le son en relief car stéréo ne veut pas dire comme on le pense généralement gauche-droite, mais des sons venus de gauche et de droite qui se superposent pour donner une impression de relief.
Alors, la stéréophonie : 2 oreilles = 2 enceintes ? Pas si simple !!
Le triangle d'écoute idéal. En stéréophonie 2 canaux, la zone d'écoute optimale est définie par un triangle d'écoute qui s'élargit au fur et à mesure que l'on s'éloigne des enceintes. Il est lié à plusieurs paramètres : caractéristiques de directivité et de phase acoustique des enceintes, nature acoustique du local d'écoute, variation de la distance entre chacune des enceintes et l'auditeur. (Nd du vénérable: à savoir la distance entre les deux enceintes doit être égale à la distance séparant le milieu de l'enceinte et l'oreille de l'auditeur situé au milieu de ces deux enceintes.
La vulgarisation du Home Cinéma a relancé la course au son en relief, un rêve que Clément Ader, père de l'aviation et du moteur à explosion concrétisa pour la première fois en 1881, dans 4 salles de l'Exposition d'Electricité. Depuis, on n'a cessé de relancer le débat sur le nombre de canaux nécessaires à la reconstitution du relief sonore dans toutes ses dimensions.
Plusieurs dates marquantes ponctuent la fabuleuse histoire de la stéréophonie, du son en relief. La plus ancienne est 1881 lorsque Clément Ader, un inventeur, proposa dans le cadre de l'Exposition d'Electricité des démonstrations de son stéréophonique depuis l'Opéra de Paris. Harvey Flécher, autre chercheur célèbre, contribua également aux premiers essais de son stéréophonique dans les laboratoires "Western Electric et Bell Labs. C'est grâce à leurs travaux que furent expérimentés, en 1931 puis en 1933, l'enregistrement, la restitution stéréophonique et la première transmission par fil entre Washington et Philadelphie, d'un concert donné par l'Academy of Music de Philadelphie. Ce concert n'était pas transmis, contrairement aux suppositions, en deux canaux mais en stéréophonie trois canaux. C'est un détail qui a beaucoup d'importance. En effet, l'adoption du principe de la stéréophonie à 2 canaux, couronnée de succès, découle de plusieurs contraintes: mise en application des techniques proposées par Arthur C. Keller (gravure stéréo 45/45, Western Electric, 1932), par Alan Blumlein (Grande Bretagne, 1934, gravure stéréophonique monosillon par matriçage horizontal/vertical) et pressions d'ordre technico-commercial liées à la restitution sonore (disques, cellules phonolectrices, équipements électro-acoustiques ). Ce succès n'occulte nullement la supériorité de la stéréophonie à 3 canaux, un principe adopté dès 1933, abandonné par la suite, puis redécouvert grâce au Home Cinéma.
Les aléas de l'écoute en stéréophonie deux canaux
L'écoute d'un enregistrement sonore réalisé et retranscrit selon le principe de la stéréophonie à deux canaux pose, lors de la restitution dans la salle d'écoute, une contrainte bien connue. L'auditeur doit se placer le plus pies possible d'un axe situé à égale distance des deux enceintes pour apprécier les bénéfices de l'effet stéréophonique. Plus il s'écarte de cet axe, plus il se déplace vers la gauche ou vers la droite et plus la source virtuelle vase déplacer selon une amplitude beaucoup plus grande que celle de son propre déplacement, un peu comme si la source virtuelle centrale Était "magnétisée" par les enceintes. Cet effet est lié à deux phénomènes : rapprochement du point d'écoute par rapport à l'une des enceintes, éloignement du point d'écoute par rapport à l'autre, le second étant l'influence de la caractéristique de directivité des enceintes sur la sensibilité relative perçue depuis le point d'écoute.
L'oreille, plus sensible dans une zone où les haut-parleurs commencent à accuser, à partir de 2 kHz et au-dessus, une certaine directivité, accentue cet effet de déplacement de la source virtuelle. De cette constatation, connue depuis les de/buts de la stéréophonie deux canaux, on a établit une zone, un triangle d'écoute optimal équilatéral précité. Le non-respect de cette condition d'écoute optimale est fâcheux en audio pure comme en Home Cinéma. En effet,lorsque l'auditeur se déplace vers la droite, la source virtuelle centrale, comme '"magnétisée" par l'enceinte droite. semblera provenir de cette dernière pour un auditeur positionné à mi-distance entre le centre et l'enceinte droite. En audio. la position du violon solo se confondra avec le reste de l'orchestre, le tout donnant l'impression de provenir principalement de l'enceinte droite. En Home Cinéma, le dialogue stéréophonique entre deux acteurs situés l'un au centre, l'autre à droite, sera confondu sur l'enceinte droite, en produisant une distorsion de localisation désagréable entre ce que le spectateur voit et ce qu'il localise.
Stéréophonie 2 canaux et distorsion géométrique
On n'insiste jamais assez sur le fait que les microphones procurent tous, quel que soit leur principe et leur type de directivité, un effet d'éloignement un rendu de la distance virtuelle très différent de la distance réelle source sonore-microphone. Ce phénomène se démontre facilement avec des repérages sur le sol de la distance entre la source sonore et le microphone que l'on place successivement à des distances respectives de 1, 2, 5 et 10 m par exemple. On s'aperçoit qu'à l'écoute, la sensation de distance virtuelle source sonore-microphone n'est pas du tout la même et qu'il se produit un effet d'éloignement prononcé par rapport à la distance réelle. Dans une salle de concert, un auditeur est en mesure d'estimer, même les yeux bandes, la distance qui le sépare de l'orchestre. Dans les mêmes conditions, depuis le dixième rang, un microphone procurera à l'écoute un effet d'éloignement important par rapport à l'orchestre et une dose importante de sons réverbérés. Ce phénomène explique pourquoi on a généralisé la prise de son multi-micros, ce avec les avantages et les inconvénients qui en résultent. Il explique aussi pourquoi il est très difficile de réaliser une prise de son stéréophonique d'un grand orchestre à partir d'une seule paire de microphones sans perte de définition ni d'effet d'éloigne-ment trop important des arrières plans.
En stéréophonie 2 canaux, un petit ensemble composé par exemple de 7 instruments montre, , que la prise de son à partir d'une paire de microphones tend à produire facilement lors de la restitution, un phénomène de trou central et un déplacement virtuel des sources référencées 2.3 ainsi que 4 et 5 vers les enceintes gauche et droite. André Charlin, célèbre pour sa fameuse tête artificielle et ses prises de son stéréophoniques réalisées en France à partir de la fin des années 50, était parfaitement conscient de ce phénomène. Il était, à ce titre, l'un des rares qui allait jusqu'à déplacer non seulement les microphones, mais les artistes eux-mêmes de manière à obtenir entre les enceintes des sources virtuelles réparties comme il le souhaitait. Une précorrection de position des sources réelles permettait d'obtenir après essais successifs, des sources virtuelles réparties de manière homogène entre les enceintes.
Stéréophonie 2 ou 3 canaux? Une expérience datant de 1934
Dans la revue américaine Electrical Engineering, deux chercheurs, W.B. Show et J.C. Steinberg publièrent en janvier 1934 un arliele relatif à la stéréophonie qui fait toujours référence aujourd'hui. Il relate d'une suite d'expérimentations basées sur 9 sources sonores réelles placées sur une scène, derrière un rideau acoustique ment transparent, lesquelles sont éeoutées par une douzaine d'auditeurs. Le test consiste à demander à chaque auditeur à quel endroit il localise chaque source sur la scène, puis à établir une valeur moyenne, La méthode est rigoureuse, car l'expérience a recours à plusieurs sortes de sources sonores (voix, bruits variés), toutes placées à des endroits précis sur la scène. Les expériences suivantes consistent à reproduire ces 9 sources sonores disposées en trois rangées de trois sources à partir de plusieurs procédés stéréophoniques.
Le premier procédé, le plus simple, toujours actuel, consiste à utiliser une prise de son à deux micros lors de l'enregistrement et une restitution confiée à une paire d'enceintes. Le second, beaucoup plus intéressant comme nous le verrons plus loin, consiste en une prise de son stéréophonique à trois micros placés à gauche, au centre et à droite et à reproduire le tout à travers un système composé de trois enceintes situées elles aussi à gauche, à droite et au centre devant les auditeurs, tout en utilisant, comme lors de l'écoute directe, un rideau acoustique ment transparent pour masquer les enceintes. Les autres méthodes consistent à utiliser des variantes des principes d'enregistrement à partir de deux ou de trois microphones el à restituer le son stéréophonique de différentes manières sur les trois enceintes. Pour chacune de ces expériences, on demande aux auditeurs de localiser individuellement chacune des neuf sources sonores sans lui faire prendre connaissance de la méthode utilisée pour la prise de son comme pour la restitution sonore.
L'importance de la voie centrale en stéréophonie
La figure 6 montre les résultats découlant de ces différentes expérimentations. On remarquera que, lors d'une écoute directe, les précautions prises (salle d'écoute peu perturbée par le bruit environnant, variété des sons émis, résultats dépendants non par d'un mais d'un panel d'une douzaine d'auditeurs) aboutissent à des résultats très intéressants et toujours vérifiables de nos jours. On note tout d'abord que les auditeurs parviennent à localiser les sources réelles avec une bonne acuité tant dans le plan latéral qu'en profondeur. Ce test sera confirmé plus tard par différentes expériences conduites aussi bien aux Etats-Unis (celles menées par Harry F. Oison, en 1940, par Benjamin B. Bauer, de CBS, en 1961) que par le laboratoire de stéréo audiométrie de Lille (détaillé dans la Revue du Son n°142 de février 1965). Elles confirment à ce titre un pouvoir localisateur extraordinaire de l'oreille en mode bi-auriculaire, celui de pouvoir localiser, en chambre sourde, dans le cône d'attention frontal, le déplacement latéral d'une source se déplaçant sous un angle aussi faible que 3 degrés seulement. Ayant recours à un système stéréophonique à trois canaux, composé de trois microphones pour la prise de son et trois enceintes pour la reproduction, le panel d'auditeurs parvient à localiser les neuf sources avec une bonne précision, c'est-à-dire sous forme de trois rangées de trois sources. Les légères distorsions de position de chacune des sources virtuelles par rapport à la réalité seraient dues à l'imperfection des systèmes de reproduction utilisés à l'époque et au fait que les douze auditeurs n'étaient pas tous placés dans l'axe central de la pièce, face à l'enceinte centrale et à égale distance des enceintes gauche et droite.
Malgré son intérêt, le principe de la stéréophonie à trois canaux n'a pas été retenu, essentiellement pour des raisons d'ordre technico-commercial. Ce qui met en évidence de manière flagrante les défauts de la prise de son et de la reproduction stéréophonique à deux canaux. La localisation en profondeur devient quasi nulle, elle semble plus liée aux différences d'intensité sonore qu'à un effet de perspective sonore réel (dans la réalité, des sources sonores faibles ou puissantes peuvent être à volonté proches ou lointaines). Un autre principe consiste à faire appel à une prise de son à deux microphones, à reproduire le son stéréophonique sur une paire d'enceintes gauche et droite et à ajouter au centre une voie centrale émettant un signal issu de la somme des canaux gauche + droit sous un niveau sonore précis. Bien que l'on n'obtienne pas lors de la restitution une localisation aussi précise des trois rangées de trois sources sonores qu'avec la méthode à trois voies, avec trois microphones et trois enceintes, on s'en approche. On peut, de plus, améliorer la précision du rendu de la localisation en largeur comme en profondeur en jouant sur le réglage de niveau de la voie centrale, sur la prise de son (écarte ment, positionnement angulaire des microphones, choix de la directivité et caractéristiques de ces derniers) et sur les paramètres de linéarité de réponse en fréquence et en phase des enceintes acoustiques.
Dans un autre article publié en 1953 dans le journal de la S.MPTF.. William B. Snow compléta une série d'expériences citées dans sou article datant de 1934. [1 démontra notamment que, grâce à la voie centrale, un auditeur, même placé en dehors de l'axe de symétrie formé par les enceintes, continuait à profiler de l'effet stéréophonique, de la localisation en profondeur. Paul W. Klipsch revendiqua, de son côté, au-delà d'une position très affirmée en faveur des haut-parleurs à haut rendement, l'intérêt décisif représenté par la voie centrale en stéréophonie, ce à travers une longue série d'articles publics entre 1940 et I960.
Le son en relief: bien plus qu'un son en deux dimensions
Le son en relief est bien plus qu'un son en deux dimensions. On pourrait à ce titre se poser une suite de questions, y apporter les réponses découlant de noire propre expérience pour se rendre compte qu'en stéréophonie deux canaux, les effets de perspective obtenus n'ont pas de rapport réel avec une réelle localisation en profondeur. En effet, si cette dernière pouvait être reproduite, elle signifierait qu'une source punctiforme, de taille assimilable à un ballon de football, pourrait à volonté se déplacer d'une enceinte à l'autre, s'éloigner, se rapprocher de l'auditeur et passer derrière lui après avoir fait le tour de sa tête à des distances variant entre quelques centimètres et plusieurs mètres. Le son en deux dimensions vraies devrait en être capable. Le système tétraphonique ou mullieanaux s'en approche, bien qu'il s'avère très difficile de créer autour de l'auditeur une source sonore punctiforme capable de s'éloigner, de se rapprocher de lui dans n'importe quelle direction située dans le plan horizontal. Dans les meilleurs cas, la source reste localisée au niveau des enceintes, elle peut donner l'impression de s'éloigner mais ne prend jamais place à un endroit précis situé entre les enceintes et l'auditeur. La localisation spatiale tridimensionnelle, aussi imparfaite soit-elle, est une faculté qui nous rend les plus grands services dans la vie quotidienne. Elle nous permet de localiser parfaitement, sans l'aide de la vue, Tendrait où est tombé un objet sur le sol, l'endroit et la distance d'où proviennent un son, un bruit, ne serait-ce qu'en s'aidant de légers mouvements de la tête (actions conjuguées du retard inter-aural et de l'enveloppe spectrale formée par l'ombre acoustique de la tête par rapport à l'objet sonore).
Le vrai son en relief est bien plus qu'une sorte de géode sonore constituée d'une myriade d'enceintes couplées chacune à une myriade de microphones disposés les uns a côté des autres pour former une sphère. Même dans ce cas extrême, il n'est pas affirmé que l'on puisse, lors de la reproduction faire évoluer un son ponctuel se déplaçant librement dans l'espace, non seulement sur la surface interne de cette géode sonore mais dans n'importe quelle direction et à n'importe quelle distance virtuelle du point d'écoute. Le procédé binaural nécessite une écoute réservée exclusivement au casque et une prise de son binaurale réalisée à partir d'une tête artificielle. Il permet d'obtenir des résultats intéressants, du moins pour l'hémisphère sonore dorsal : notion de la distance entre la source virtuelle et l'auditeur, depuis quelques centimètres jusqu'à plusieurs di7aines de mètres, à laquelle vient s'ajouter une notion de hauteur (passage d'un avion, donnant l'impression d'être situé très haut au-dessus de la tête, bruit d'un objet touchant le sol, derrière soi ou sur le côté). Pour l'hémisphère sonore frontal, le résultat, moins évident, semble lié au pouvoir localisateur de nos oreilles et à l'aide, non négligeable. apportée par le cône d'attention visuel. En effet, des expériences menées depuis le début du siècle dernier (H. Pierce, 1903), montrent que, dans le noir, un bruit tournant sur un plan horizontal autour de nous n'est pas perçu comme tel. Il est sujet à des erreurs de localisation vérifiables et quantifiables, Si quelques 18 % des auditeurs ont l'impression que la source sonore tourne bien sur un plan horizontal autour d'eux, 24% d'entre-eux ont en revanche l'impression que la source remonte de 10 à 30o lorsqu'elle passe devant eux. Quant aux autres, ils confondent facilement les sons provenant du devant avec ceux provenant du dessus. L'ajout d'une image montrant un objet en mouvement devant l'auditeur et émettant un bruit au même endroit réduit sensiblement ces erreurs de localisation.
Le piège d'une mode en Home Cinéma: l'enceinte centrale de type d'Appolito horizontale.
Des considérations d'ordre pratique ont, pour une grande part, contribué à la mode de l'enceinte centrale en forme de parallélépipède horizontal, équipée d'un tweeter encadré horizontalement par deux haut-parleurs de grave-médium. La forme plate de l'enceinte facilite ainsi sa mise en place sous un écran, sur un téléviseur ou sous ce dernier. Dans cette configuration, assimilable de près ou de loin à la formule dite d'Appolito. des haut-parleurs de petit diamètre permettent d'assimiler l'émission acoustique à un haut-parleur elliptique ou hyper-elliptique avec montage central de la voie d'aigu. On obtient ainsi, lorsque l'enceinte est positionnée verticalement, une directivité plus prononcée dans le sens vertical que dans le sens horizontal. Cette caractéristique est intéressante en Home Cinéma car, en privilégiant l'émission acoustique vers la zone d'écoute, on améliore l'intelligibilité des dialogues. Il est toutefois important de reconnaître que celte configuration a été prévue à l'origine pour un alignement vertical et non pas horizontal des haut-parleurs. Lorsque les haut-parleurs sont alignés dans le plan horizontal, la zone de diffusion sonore dans le plan vertical est bonne, ce qui n'a rien d'intéressant tandis que dans le plan horizontal, la zone d'émission acoustique devient par contre plus étroite et sujette à des phénomènes de déphasages, à la base "d'effets de peigne" (succession de court-circuits acoustiques se produisant à des fréquences précises, de plus en plus nombreux au fur et à mesure que la fréquence augmente).
Il y a un exemple classique d'enceinte centrale mesurée dans l'axe et sous une incidence horizontale de 30°. Dans l'axe, la réponse amplitude fréquence est régulière tandis que sous une incidence de 30
o dans le plan horizontal, les centres émissifs des haut-parleurs de grave-médium décalés d'une douzaine de centimètres engendrent un creux situé vers 2,5 kHz. Selon le type d'enceinte, sa largeur, selon la structure du filtre et la fréquence de coupure choisie, l'amplitude de ce creux, voire d'une succession d'accidents, peut varier entre quelques dB et plus de 20 dB. Dans le cadre d'une utilisation en Home Cinéma, l'auditeur A placé au centre appréciera les dialogues provenant du centre de manière équilibrée avec une localisation provenant bien de cette enceinte. Il n'en sera pas de même pour l'auditeur B, placé de côté, sous un angle de 30o. Depuis cette position, l'équilibre spectral émanant de l'enceinte centrale lui semblera étriqué. creusé, avec une pointe de niveau dominant vers 7 kHz et une sensation de creux dans le médium. Le tout sera accompagné, ce qui est plus gênant, d'une impression de son difficile à localiser car déphasé dans la plage de médium avec, pour paradoxe, des sons en phase, provenant bien de l'enceinte centrale, mais seulement dans une plage située vers 7 kHz. Ce phénomène varie en fait d'une enceinte centrale à l'autre, même pour des modèles d'aspect identique faisant usage d'un tweeter encadré horizontalement par deux transducteurs de grave-médium. Cet effet est facile à mettre en évidence en utilisant un bruit rosé tout en écoulant l'enceinte centrale de face, puis sous d'autres incidences dans le plan horizontal.Ce défaut lié au décalage des plans émissifs des haut-parleurs de grave-médium par rapport au point d'écoute apparaît clairement aux mesures. Les constructeurs osent rarement les publier, sauf lorsque les résultats sont bons (ils sont plus rares, mais ils existent !). Il existe un test facile à réaliser à partir de mini-enceintes (haut-parleurs de 10 cm environ), reliées en parallèle (mais hors phase) et légèrement décalés l'une par rapport à l'autre (1,5 cm seulement). En écoutant l'ensemble de face, le son semble provenir d'un point situé à gauche. Si cet effet peut être mis a profit pour procurer un élargissement de l'effet stéréo sur certains combinés radio-CD portables, il n'est pas du tout bienvenu sur une enceinte centrale dont le rôle est de donner à l'auditeur l'illusion de suivre les sons là où ils sont censés se produire sur l'écran. En résumé, si le calage temporel des enceintes frontales gauche-droite-centre est important, le calage en phase l'est autant et cette remarque s'applique aussi aux enceintes d'ambiance, vu que l'on recherche à la fois des sons bien localisables el d'autres très diffus. En étant très exigeant, le respect de ces règles montre que la zone d'écoute optimale est limitée en fait à un ou deux spectateurs !
d'après Jean Hiraga Revue du Son mars 2002