Dans cette rubrique nous donnons la parole à des jeunes auteurs et à des passionnés qui écrivent sur la chanson. Aujourd’hui, nous publions un entretien avec un acteur essentiel du monde la chanson : l’ingénieur du son. Frédéric Finand* nous parle de son métier et de son approche de l’enregistrement d’albums, notamment de chansons.
En quoi consiste le travail du preneur de son ?
Pour moi, le travail du « preneur de son » consiste en deux choses différentes : la captation du son, bien sûr, mais aussi le traitement du son. C’est un rôle qui ressemble à celui du photographe, il s’agit de déformer la réalité pour qu’elle apparaisse vraie. Un photographe qui veut photographier un coucher de soleil sans filtre rouge n’obtiendra pas un effet de coucher de soleil. Le preneur de son, enfin je le définis personnellement comme ça, devra aussi utiliser les filtres qui vont souligner le caractère de tel ou tel instrument, utiliser le micro qui va mettre en évidence telle ou telle caractéristique du son. Je me suis aperçu au fil du temps que les micros qui transcrivent le son de manière extrêmement neutre donnent au final des enregistrements qui paraissent insipides, qui manquent de caractère. On a besoin de souligner, de forcer un petit peu le trait. Il s’agit de transcrire quelque chose qu’on aurait pu entendre**. Le son sorti de son contexte (par l’enregistrement) nous apparaît différent, la prise de son doit compenser cette différence.
Quel est son rapport aux artistes ?
Le rapport aux artistes, au-delà du travail d’enregistrement proprement dit, c’est une affaire de mise en confiance. Enregistrer est un travail d’équipe. On prend le son de quelqu’un, il faut qu’il le retrouve, il faut qu’il se reconnaisse dans cette réalité augmentée. Il faut un rapport de confiance et d’échange dans le dialogue. Et si je dis quelque chose, il faut que cela soit perçu à sa juste valeur. Les artistes ont beaucoup besoin d’être rassurés. Rassurés à la fois sur la musique et aussi sur le son produit, sur la manière dont ils entendaient les choses et sur la manière dont elles apparaissent effectivement à travers des micros.
Est-ce que le rôle de l’ingénieur du son peut aller plus loin que « rassurer » les artistes, jusqu’à discuter un choix esthétique, un phrasé, un tempo, par exemple ?
Oui, assez souvent, on peut approuver pour rassurer, bien sûr, mais ça peut aller aussi dans l’autre sens, celui d’une proposition différente et dire, par exemple : « Cette tonalité ne me paraît pas adaptée à ta tessiture ou à l’instrument », et proposer une autre tentative parce que le son que produit la tonalité de départ semble ne pas convenir.
En fait, très souvent dans le cadre de petites ou d’autoproductions, l’ingénieur du son peut également endosser le rôle de « directeur artistique ». Personnellement je reste vigilant à ne jamais emmener l’artiste sur un tout autre chemin que celui qu’il avait imaginé.
Perçois-tu une différence entre le travail d’enregistrement d’un album de chansons et celui d’un album de musique instrumentale ?
La différence est assez subtile. Dans la captation du son, il n’y a pas de différence. La différence se situe davantage dans le traitement qu’on va appliquer à la voix. Dans la phase de mixage on va donner plus d’importance au texte. En tout cas, je fais attention à ça, quelle que soit la « garniture » au-dessous du texte, j’essaie de toujours me mettre au service des paroles, de veiller à la lisibilité et à la compréhension du texte, ce qu’on ne retrouve pas dans la musique pop, rock, ou même dans le jazz où il y a parfois aussi du chant, mais où la voix est traitée comme un instrument et du coup se fond un peu plus dans la musique.
Je crois qu’on peut dire qu’il y a une « french touch » et que la chanson française a un grain de son très particulier. Justement dans la façon de placer la voix dans le mixage. C’est quelque chose qu’on ne trouve pas ailleurs, une voix très lisible, très détachée des parties instrumentales. Peut-être un peu trop ! Pour ma part, j’ai tendance à traiter la voix comme dans le dernier CD de Madeleine Peyroux, par exemple. La voix reste très intelligible, mais elle est mixée davantage comme un instrument.
Mais en chanson il y a une culture du son « à la française » et les Anglais, par exemple, reconnaissent cette « french touch ».
La prise de son de la voix demande-t-elle des précautions particulières ?
Non, pas particulière par rapport à d’autres instruments, mais particulière dans le sens où, pour moi, la position du micro influe énormément sur le grain de son. Si on veut beaucoup de consonnes on va mettre le micro très près, de même si on est attaché aux bruits de la bouche, mais si on veut « poitriner » la voix, on va descendre un petit peu le micro, ou au contraire le monter pour redonner un côté « nasal ». C’est grâce à ces techniques qu’on cherche la manière de colorer le son, pour qu’il retranscrive l’écoute au naturel.
Le problème de la prise de son est qu’on est toujours beaucoup plus près, avec le micro, que pendant l’écoute au naturel. Le micro fait une sélection des sons, différente de ce qu’un auditeur perçoit lorsqu’il est loin. Quand on est loin, il y a un mixage qui se fait naturellement entre le son de poitrine, le son nasal, le son de gorge et de bouche. Le micro agit comme une loupe qui sélectionne une partie de ces sons-là. Du coup, après, il faut retrouver le dosage qui fait qu’on reconnaît la personne. Et surtout qui souligne son trait de caractère.
Il y a deux écueils particuliers avec la prise de son de la voix. D’abord les « plosives »* **, incontournables dès qu’on met un micro, mais qu’on peut facilement corriger avec des filtres, et ensuite les « sifflantes », liées sans doute à la dentition de la personne. Cela dit, j’ai constaté que d’un jour à l’autre il pouvait y avoir ou ne pas y avoir de sifflantes dans la voix d’une même personne, surtout chez les femmes ! Beaucoup moins chez les hommes. Je ne sais pas pourquoi. Et ça, il n’y pas de moyen mécanique pour supprimer ce défaut, pas de filtres ou de façon de travailler sur la position des micros à la prise. Les sifflantes peuvent devenir une gêne importante, car ces sifflantes sont dans des fréquences très aiguës. Ça n’était pas un problème avec des systèmes plus anciens qui ne développaient pas beaucoup les aigus, mais avec les systèmes performants d’aujourd’hui, qui fournissent tellement de « propreté » dans les fréquences élevées, ces sifflantes-là sont devenues un problème.
Quels sont les écueils que rencontrent le plus souvent les débutants en studio, du moins dans le domaine de la chanson ?
J’assiste à beaucoup de premières expériences en studio (à l’ENM) et je crois que l’écueil principal rencontré par les débutants se situe au niveau de la préparation. Les gens pensent être prêts musicalement, posséder le texte de leur chanson, etc. Mais au final, ils s’aperçoivent que ce qu’ils pensaient abouti ne l’est pas tant que ça. Là où ils estiment qu’il faudra à peu près une heure pour enregistrer une chanson, il en faut en fait deux parce que le fait d’enregistrer révèle une petite faiblesse sur un pont instrumental, une phrase qui n’est pas complètement acquise, ou encore un manque dans l’interprétation. Le micro agit comme une loupe et met en avant les défauts. Souvent ce sont des problèmes d’arrangement qui sont révélés. Les débutants ont tendance à mettre beaucoup de choses dans l’arrangement qui du coup « mange » le texte, par exemple. Il y a souvent cette volonté d’étoffer, de faire quelque chose de riche pour soutenir la voix, alors que parfois en épurant ça marche mieux. En fait, il m’est plus souvent arrivé de dire « on enlève ça, et ça va mieux marcher » que de dire « il manque quelque chose à tel endroit ». Lors des premières expériences, on a plus tendance à élaguer qu’à ajouter.
Dans le cas des ingénieurs du son débutants, la difficulté principale vient de la nécessité de faire des essais pour entendre ce qui convient le mieux. Il leur manque ce que j’appelle « le son intérieur » : c’est-à-dire entendre dans sa tête le son final, le titre mixé, alors qu’on est seulement à la phase d’enregistrement. Avec l’expérience, il suffit de choisir les outils (micros, effets, etc.) qui donnent le son « entendu à l’intérieur ». Il m’arrive de changer une prise de son après la première ou la deuxième prise parce que l’audition de la chanson, de l’arrangement, me font imaginer un son que la prise en cours ne permettrait pas.
Tu as connu l’analogique et ensuite le numérique, comment perçois-tu la différence entre ces deux modes d’enregistrement et de diffusion ?
Sans entrer dans la « guéguerre » opposant les qualités de l’un à celles de l’autre, on peut déjà dire qu’aujourd’hui tout passe de toute façon par le numérique, à un moment ou à un autre, même dans les phases de production, parce qu’il permet une souplesse de travail très importante par rapport à l’analogique. L’analogique, à coup sûr, apporte un certain grain de son, alors que le numérique donne quelque chose de très transparent. Mais en tant que preneur de son qui se revendique « à la recherche d’un son bio », je préfère le numérique parce qu’il ne déforme ni ne colore les sons des micros. L’analogique va plutôt aller dans le sens contraire, c’est-à-dire qu’il va permettre de rechercher un certain grain de son, coloré. Ensuite, sur le support final, j’ai une large préférence pour le numérique parce qu’il apporte un niveau de détails très supérieur. Mais c’est aussi lié au changement des habitudes d’écoute. Avec l’enrichissement de la qualité des systèmes de reproduction, on s’est habitué à entendre beaucoup de détails. Il y a tout un travail qu’avait initié la Deutsch Grammophon, notamment Herbert von Karajan, qui mettait des micros partout dans l’orchestre pour aller chercher le grain de chaque instrument. C’est devenu une référence et on cherche à avoir à la fois un son homogène d’orchestre et le détail de chaque instrument, comme si on était proche de chacun d’eux. Clairement, cela a modifié les canons du son. Nous ne sommes plus habitués à entendre un instrument enregistré de loin parce que, si je prends l’exemple de la guitare acoustique, on aime entendre le bruit de l’ongle sur la corde ou du doigt qui se pose sur les frettes, etc. Il est intéressant d’avoir ces détails-là, mais il faut faire attention à l’excès, car cela peut très vite produire quelque chose d’artificiel. Ce genre de détail technique, l’analogique n’est pas capable de les transcrire aussi bien que le numérique.
Chaque preneur de son a sa « patte », un peu comme un guitariste ou un pianiste a un son qui lui est propre. Quel que soit l’instrument sur lequel il joue, il va quasiment reproduire toujours le même son. Il y a aussi ce niveau d’identité chez les preneurs de son, on va toujours vers un même objectif et la recherche d’un « son » qui est propre à chacun. Le choix du matériel sur lequel chacun aime travailler découle de cette quête.
Tu as parlé de « la recherche d’un son bio », qu’est-ce au juste ?
Le son « bio » est celui qui ressemble le plus au son naturel, mais avec ce petit côté « détails », que j’évoquais tout à l’heure, qui ajoute de l’intimité avec l’instrument ou avec la voix. Parler d’un son « bio » est peut-être abusif, mais on peut l’entendre dans le sens de « sans traitement artificiel », et non pas bio au sens où cela retranscrit simplement la nature du son, mais bio au sens où il n’est pas trafiqué. C’est un son qui a du goût!
Je m’interdis de toucher au son de la voix. A ce sujet et à titre d’exemple, je peux citer l’album d’Henri Salvador Jardin d’hiver. Quand on l’écoute sur un bon système, la voix est horriblement gonflée dans les basses. Ça passe bien sur des petits systèmes parce que ça donne une espèce de son de poitrine à la voix, mais dès qu’on écoute sur un vrai système de son, on sent le côté artificiel, poussé, forcé.
Est-ce que dans la phase de mixage tu tiens compte du fait que la plupart des gens écoutent le produit fini sur de petits haut-parleurs peu performants ?
Généralement, je demande aux artistes quel est le vecteur de diffusion du produit, le vecteur principal en tout cas, et effectivement j’adapte la nature du son au média qui va diffuser la chanson ou la musique. C’est une affaire de choix de production. J’ai connu une époque où l’on faisait deux mixages, on faisait ce qu’on appelait le « radio edit ». Quand on enregistrait un CD, il y avait une version mixée normalement pour les gens qui allaient écouter sur CD et une version radio, « radio édit », mixée différemment pour tenir compte des contraintes de diffusion, à savoir les petits transistors, les autoradios, etc.
Aujourd’hui, ça n’est plus tellement dans les pratiques. Pourtant je crois qu’on devrait faire une production spécifique pour internet, puisque c’est comme ça que les chansons et la musique sont le plus diffusées, et une production pour ceux qui écoutent sur un support physique, comme le CD, sur un bon système d’écoute. On peut même imaginer la disparition du support physique, si les plateformes de distribution diffusent de la haute-définition avec une qualité au moins équivalente à celle du CD. Avec un mixage qui présuppose que les gens qui vont écouter ce format.ont un système de diffusion qui tient la route. Alors que ceux qui achètent du mp3 n’ont généralement pas un système d’écoute performant, système qui montrerait précisément les faiblesses de ce format (mp3).
Un paradoxe
La piètre qualité du son est entrée dans l’« éducation sonore » des jeunes générations. Aujourd’hui, le numérique permet d’avoir des sons qui sont d’une qualité exceptionnelle, c’est dommage de le distribuer amputé de tout ce qui fait cette qualité.
C’est un paradoxe, le numérique permet au niveau de la production des choses extraordinaires, et au niveau de la diffusion il propose un résultat très médiocre. On peut espérer que cela changera un tout petit peu avec l’augmentation des débits, la fin des limitations, etc. Ce qui me fait dire ça, c’est le fait qu’ Apple vient de lancer un label Mastered for I Tunes. Pour obtenir ce label, il faut fournir des produits en haute-définition. On « soupçonne » Apple d’engranger de la musique à ce format-là pour disposer d’un catalogue très important au moment où la distribution de ce type de support sera vulgarisée. Pour le moment, c’est encore compliqué parce que ça demande des débits trop importants. Apple anticipe sans doute. Dès que les plateformes seront en mesure de distribuer de la musique en HD, en streaming, Apple aura déjà un catalogue très conséquent. Même écouté sur de petits haut-parleurs, la qualité sera plus grande, c’est sûr.
Ne penses-tu qu’il soit également possible que les systèmes d’écoute s’améliorent, sur les ordinateurs par exemple ?
Il y a peu de temps, j’ai été esbroufé par une toute petite enceinte, de la taille d’une brique de lait ! Le son était bluffant. Elle était si petite que je me suis dit qu’il n’était pas possible que les basses et que les aigus soient définis, et pourtant ils l’étaient ! Je crois que la recherche va nous mener vers des enceintes plus petites mais très performantes. Le problème actuel reste leur taille qui doit être assez importante pour obtenir un son de qualité. Pour le moment, il y a le casque qui permet de contourner ce problème-là. Avec du matériel peu encombrant et accessible économiquement, on peut obtenir quelque chose de très haute qualité. D’ailleurs, aujourd’hui, on assiste à un nouveau développement des casques de très haute-fidélité. Pendant cinq ou six ans, les constructeurs ne se sont pas trop préoccupés de ça. Aujourd’hui, la consommation au casque, très répandue chez les jeunes générations, fait qu’il y a à nouveau des recherches dans cette direction-là. On voit fleurir des casques à plus de mille euros ! Une des raisons est que le casque présente l’avantage de s’affranchir de la pièce dans laquelle on écoute, du coup on est toujours dans les conditions optimales. Car la pièce interagit avec les enceintes et déforme leur son. Quel que soit le niveau de qualité de l’enceinte.
Propos recueillis par Pierre Delorme
* Frédéric Finand est le créateur du studio Oreilles Délicates ( http://oreillesdelicates.fr/). Il est également responsable du studio d’enregistrement de l’École nationale de musique, de danse et d’art dramatique ( ENMDAD) de Villeurbanne où il partage son temps entre les séances d’enregistrement professionnel et les séances pédagogiques. Depuis 2016 il est spécialiste en réalité virtuelle sonore et son immersif. Il enseigne également les techniques du son à l’université Lyon-II en Master pro MAAAV (musiques appliquées aux arts visuels).
** Louis-Ferdinand Céline dans les Entretiens avec le Professeur Y (p. 123, dans l’édition Gallimard de 1981) parle de son style “rendu émotif” en évoquant le phénomène de la réfraction : un bâton dans l’eau a l’air cassé et pour qu’il ait l’air droit, il faut le casser d’abord, “avant de le plonger dans l’eau” !
*** Les plosives ou occlusives sont les consonnes que l’on prononce en fermant la bouche puis en l’ouvrant brusquement, telles que « P » et « B ». Elles provoquent généralement un déplacement d’air qui frappe la capsule du micro, provoquant ce qu’on appelle un pop, bruit bref et désagréable.
Excellent article, très intéressant, qui offre une vision assez large mais en même temps très pointue.
Merci Pierre! Merci Fred! 🙂
Quelques questions à Fred Finand (en espérant qu’il aura l’envie et le temps d’y répondre!) concernant les sifflantes sur la voix:
Le de-esser n’est-il pas un outil adapté pour les atténuer au mixage? ou bien est-ce que tu considères que c’est trop « artificiel » dans le cadre d’un bon son « bio »? 😉
J’ai l’impression que tu es dans l’optique de façonner quand même le son, mais surtout à la prise, et presque pas au mixage.
Tu dis par exemple « je m’interdis de toucher à la voix »… as-tu une approche plus souple en dehors de la voix, pour les guitares acoustiques, par exemple?
Effectivement le « De-esser » est là pour corriger les problèmes de sifflantes. Je ne m’interdis pas de l’utiliser car le son des sifflantes peut vraiment nuire à l’écoute globale. Le son bio visé est sur le résultat, j’aime donner l’impression que le (la) chanteur(se) est dans la pièce avec l’auditeur. Or les sifflantes sont liées à l’extrême proximité de la prise de son, position que l’on n’a jamais en écoute naturelle. je ne trouve donc pas incohérent de corriger cet artifice. Toutefois, le De-esser est assez grossier et je préfère le fabriquer à partir d’un compresseur multibande que je pourrai travailler plus finement.
Je suis heureux que ma façon de travailler transparaisse dans cet article, car oui j’essaie au maximum de façonner le son à la prise. L’expérience m’a montré que dès que l’on doit « corriger » un défaut de prise, on altère une dimension essentielle pour moi : le caractère « vivant » du son.
Dans le cas d’instruments qui accompagnent une voix (guitare par exemple), je retouche les instruments pour qu’ils servent la voix.
Pour moi les étapes de mixage et de mastering servent à « sublimer » les prises, non à les corriger.
Frédéric Finand
Je n’avais pas vu passer cet article au moment de sa publication. Je le trouve passionnant ! Mon commentaire ne sert à rien, sinon à vous remercier tous deux d’avoir pris le temps de partager ces informations.
Merci à toi d’avoir pris le temps de le lire et de nous en remercier! 🙂