Petite nouvelle pour vous tous : ElevenLabs vient de sortir la version 3 de son modèle de synthèse vocale, et devinez quoi ? Ils prétendent être le TTS le plus expressif du marché. Je ne sais pas si cela signifie « le plus expressif au monde » (ils sont clairement en train de se montrer plus audacieux, cependant), mais une chose est sûre : c'est clairement plus expressif que tout ce qu'ils ont sorti jusqu'à présent. J'avais hâte de le tester, alors voici ce que j'ai trouvé !
Quel est le buzz ?
Voici l'essentiel : ce nouveau modèle est encore en mode « aperçu de recherche », mais vous pouvez déjà vous y plonger. Chaque fois qu'il génère une voix, deux options vous sont proposées : vous pouvez donc choisir votre propre aventure pour vos besoins en synthèse vocale. Le plus intéressant ? Il est encore en phase de perfectionnement, car la concurrence devient de plus en plus rude. C'est le moment idéal pour vous lancer et commencer à l'expérimenter.
Fonctionnalités intéressantes à découvrir
Voici un aperçu de certaines choses qui ont attiré mon attention :
Émotions et prononciation : Oui, vous pouvez désormais ajouter de l'émotion à votre voix grâce aux parenthèses. Très simple d'utilisation, il donne beaucoup plus de caractère à votre voix.
Dialogues à plusieurs vitesses : vous pouvez désormais avoir deux personnages parlant à des vitesses différentes, ce qui est idéal pour créer des conversations réalistes.
70 langues : Oui, ils ont 70 langues à leur actif, vous pouvez donc appliquer ce modèle à l'échelle mondiale (ou au moins régionale, selon l'endroit où vous l'utilisez).
API d'accès anticipé : l'API n'est pas encore entièrement opérationnelle, mais si vous souhaitez y accéder plus tôt, vous pouvez les contacter et tenter de la tester.
Alerte offre spéciale !
Si vous êtes intéressé, profitez de 80 % de réduction jusqu'en juin. Oui, vous avez bien lu : 80 %. Alors, si vous souhaitez créer du contenu audio de qualité sans vous ruiner, c'est le moment de vous lancer. Après juin, j'imagine que les prix vont grimper, alors n'attendez pas !
Essai : Écoutons-le !
J'ai moi-même fait un test rapide et les résultats parlent d'eux-mêmes. Écoutez ces deux versions générées par le modèle sur la chaîne YouTube ci-dessus.
Il y a une légère différence dans la façon dont ils sonnent - la version 2 est meilleure, plus naturelle.
Mais c’est là toute la beauté du modèle : vous pouvez choisir la version qui vous convient le mieux.
Quelle est la prochaine étape ?
Ce modèle est encore en développement, mais je suis vraiment enthousiaste quant à ses possibilités. Commencez à l'expérimenter dès maintenant et faites-moi part de vos découvertes. Que vous souhaitiez générer du contenu audio réaliste, créer des robots interactifs ou simplement vous amuser avec différents personnages, les possibilités sont infinies.