
La retranscription audio, ça donne quoi en 2019 ?
On a tendance à penser que la retranscription audio est un micro univers, sans grand intérêt et sans évolution visible. Et pourtant ! Pour connaître les vraies utilisations actuelles de ce système, nous avons rencontré André, un véritable expert en la matière. Retour sur une entrevue retranscrite via l’outil créé par André himself.
The Bodyguard : La retranscription audio à notre époque, comment ça évolue ?
André : La retranscription automatisée, c’est vraiment quelque chose de très récent. C’est un marché qui a peu près deux ans. Il y a des acteurs un peu plus historiques comme Dragon (un logiciel de reconnaissance vocale, ndlr) qui sont vraiment concentrés sur une personne. Mais les technologies de reconnaissance vocal ont, en fait, atteint le même seuil de reconnaissance que l’humain en 2017. C’est à partir de ce moment-là que cette technologie a pu être utilisée pour de la reconnaissance vocale dans le cas de la retranscription. C’est vrai que ça peut surprendre quand je dis que ça atteint le même niveau de reconnaissance que l’être humain parce qu’il y a toujours des erreurs, il y a toujours des erreurs mais ça reste basé sur des fichiers de très haute qualité. Comme si je parlais en face à face sans avoir un fichier mp3 qui a été compressé à mort ou un entretien qui a été fait dans un bâtiment avec 45 personnes dernière. C’est pour ça que cette technologie a pu être appliquée à la retranscription ces dernières années.
TB : De nos jours, pour quels besoins est utilisée la retranscription principalement ?
André : La retranscription de nos jours, c’est énorme. Si tu regardes autour de toi, à peu près toutes les entreprises ou toutes les institutions ont besoin d’un service de retranscription. Que ce soit d’une assemblée d’un pays, comme en France où ils retranscrivent tout ce qu’ils disent, des psychologues qui retranscrivent leurs conversations. Il y a aussi les journalistes qui retranscrivent leurs entretiens ou même les chercheurs, les designers, les podcasters pour leurs contenus ce qui leur permet d’avoir plus de signaux et de toucher une audience plus large, etc… Je pourrais te lister, comme ça, des dizaines et des dizaines de cas d’usage. C’est un marché qui est énorme. De notre côté, on se concentre principalement sur le marché de l’éducation. Tout ce qui va être l’université avec les étudiants et les chercheurs mais aussi les journalistes et les médias en général. Pour ce deuxième cas, il s’agit de tout ce qui va être interviews dans le but d’écrire un article par exemple.
TB : Plus personnellement, est-ce que tu peux te présenter en quelques mots et nous expliquer ton parcours ?
André : Je suis originaire du Sud-Ouest et du Gers plus précisément. J’ai fait mes études de commerce à Paris et ensuite à Dublin. Là-bas, je travaillais sur une recherche académique, comprendre les entrepreneurs sociaux en Irlande. J’ai conduit pas mal d’entretiens pour pouvoir analyser les faits et j’avais, à peu près, douze entretiens à retranscrire. Quand j’ai fait mes calculs, je me suis rendu compte que pour retranscrire douze entretiens d’une heure à une heure et demie, ça allait me prendre 45 heures. À ce moment-là, je me suis dis qu’il fallait peut-être trouver une alternative parce que je n’allais pas passer toute la semaine à retranscrire ces entretiens. Je suis rentré chez moi et il se trouve que mon colocataire à l’époque, qui est aujourd’hui mon associé, faisait sa thèse sur toutes les technologies de machine learning, d’intelligence artificielle, ect… À ce moment précis, il m’a dit : « tu devrais essayer la reconnaissance vocale, je pense que ça peut bien marcher dans ce cas ». J’ai ensuite la soirée entière à essayer de « bidouiller » quelque chose. C’est grâce à ça que j’ai réussi à retranscrire mes entretiens et que j’ai dû gagner, au début, 30% de mon temps. Ce n’était pas optimisé mais c’était déjà beaucoup pour moi. À ce moment-là, tout mon groupe de recherche à commencer à utiliser cette méthode et le lendemain, il se trouve que j’ai reçu beaucoup d’e-mails d’étudiants, de doctorants qui me disaient « Salut André, on a entendu parler de ce que vous avez construit avec Marc. Est-ce que vous pourriez venir dans notre laboratoire pour installer votre outil, ça pourrait nous être vraiment très utile ». À partir de ce moment, on s’est dit que si plusieurs personnes étaient intéressées, peut-être qu’on devait créer quelque chose. On a ensuite passé le week-end à concevoir une application web et on la mise en ligne sur un réseau social pour chercheurs. On s’est ensuite fait contacter par un journaliste aux Etats-Unis qui nous dit qu’il a vu notre outil, qu’il va écrire dessus et que l’article sortira trois jours plus tard. Trois jours après, on se rend compte que les serveurs ne répondent plus trop, que c’est très très lent. Je suis allé voir les données sur Analytics et j’ai vu qu’il y avait 150 personnes sur le site qui essayaient de télécharger des fichiers en même temps. L’architecture de notre site n’était pas du tout prévu pour ça. C’est à partir de ce moment-là qu’on a essayé de monter HappyScribe et de faire une entreprise à partir de ce projet.
TB : Ce sont souvent des heureux hasards comme ça où on se dit « j’ai besoin de ça et ça n’existe pas donc je vais le faire moi-même »…
André : Exactement, c’est ça. Et puis surtout que la retranscription, c’est un marché où il y a beaucoup de frustrations. J’ai jamais vu ça ailleurs. Je le compare à ma vie de tous les jours comme entrepreneur. Parce qu’au final, c’est un peu ce que les entrepreneurs voient avec la comptabilité. C’est quelque chose que tous ces gens doivent faire pour obtenir des résultats, pour pouvoir faire leur travail. Ils savent qu’ils doivent le faire mais ça ne les enchante pas. Jusqu’à aujourd’hui, c’est un marché qui est pleins de promesses mais dans la plupart des cas, celles-ci ne sont pas toujours tenues. C’est pour ça qu’il y a une frustration qui s’est créée dans ce marché sur le « comment la technologie va aider ces gens-là ? ».
TB : Est-ce que tu peux nous présenter HappyScribe. Quelles sont ses fonctionnalités phares ? Quelles sont ses différences par rapport à d’autres logiciels de reconnaissance vocale ?
André : Il faut essayer pour voir mais en gros, la reconnaissance vocale, c’est une technologie. Ça peut être appliqué pour dicter, pour faire des recherches sur le web mais ça peut être aussi appliquée à la transcription. Le problème, c’est qu’il y a beaucoup de logiciels qui vendent la technologie comme étant la solution. Sauf qu’aujourd’hui, je te donne un texte qui a été retranscrit par ces logiciels, tu mets ton fichier, tu récupères ton texte, bonne chance pour en faire quoi que ce soit avec le texte et le fichier. Déjà, il va falloir que tu trouves le format que telle ou telle plateforme peut accepter, ensuite, on va te donner un document qui est dans un format texte qui est pratiquement inutilisable. Là où HappyScribe apporte une valeur ajoutée, c’est qu’on est capable de synchroniser totalement le texte et l’audio sur une interface qui est faite pour la retranscription. Tu vas être capable de lire ton fichier audio et, au même moment, de faire la correction de ton texte donc de savoir exactement où tu en es. Nous, on voit HappyScribe, pas comme un outil de retranscription mais comme un outil qui s’intègre au workflow des entreprises et des individus qui ont besoin de la retranscription. On pense qu’en aucun cas la retranscription est un but en soi pour aucun de nos clients. Si tu regardes les entreprises de post-production le but c’est de faire du sous titre. Si tu regardes les chercheurs le but c’est de pouvoir analyser des données. Donc nous on essaye de regarder la retranscription à travers ce cadre.
TB : Et à l’avenir, comment perçois-tu le fonctionnement de HappyScribe ?
André : Nous, aujourd’hui, on regarde secteur après secteur et on analyse. Récemment, c’était la production. On se demandait comment on pouvait s’intégrer pour ce marché. On va continuer de fonctionner comme ça pour plusieurs autres secteurs d’activité avec qui on sait que la retranscription automatisée a de la valeur. À partir de ça, on va essayer de leur fournir les meilleures intégrations pour leur workflow. Aujourd’hui, on a accepté plusieurs formats pour être sûr qu’il n’y ait pas de soucis de ce côté-là, que les personnes n’aient même pas à se poser la question de savoir si on accepte tel ou tel fichier et ensuite l’intégration de plusieurs outils qu’ils utilisent. De manière générale, c’est comme ça qu’on voit l’avenir.

André est titulaire d’un Master en commerce électronique de Dublin City University, où il rencontre son associé, Marc. Avant de construire Happy Scribe, André a été le premier Sales sur le marché français pour Intuit. Happyscribe.co

3 raisons d’apprendre à coder quand on fait du marketing
L’important c’est d’y aller progressivement. Il faut gérer sa motivation. Ne pas foncer et se brûler au bout d’une semaine parce qu’on galère.