Petite nouvelle pour vous tous : ElevenLabs vient de sortir la version 3 de son modèle de synthèse vocale, et devinez quoi ? Ils prétendent être le TTS le plus expressif du marché. Je ne sais pas si cela signifie « le plus expressif au monde » (ils sont clairement en train de se montrer plus audacieux, cependant), mais une chose est sûre : c'est clairement plus expressif que tout ce qu'ils ont sorti jusqu'à présent. J'avais hâte de le tester, alors voici ce que j'ai trouvé !

Quel est le buzz ?

Voici l'essentiel : ce nouveau modèle est encore en mode « aperçu de recherche », mais vous pouvez déjà vous y plonger. Chaque fois qu'il génère une voix, deux options vous sont proposées : vous pouvez donc choisir votre propre aventure pour vos besoins en synthèse vocale. Le plus intéressant ? Il est encore en phase de perfectionnement, car la concurrence devient de plus en plus rude. C'est le moment idéal pour vous lancer et commencer à l'expérimenter.

Fonctionnalités intéressantes à découvrir

Voici un aperçu de certaines choses qui ont attiré mon attention :

  • Émotions et prononciation : Oui, vous pouvez désormais ajouter de l'émotion à votre voix grâce aux parenthèses. Très simple d'utilisation, il donne beaucoup plus de caractère à votre voix.

  • Dialogues à plusieurs vitesses : vous pouvez désormais avoir deux personnages parlant à des vitesses différentes, ce qui est idéal pour créer des conversations réalistes.

  • 70 langues : Oui, ils ont 70 langues à leur actif, vous pouvez donc appliquer ce modèle à l'échelle mondiale (ou au moins régionale, selon l'endroit où vous l'utilisez).

  • API d'accès anticipé : l'API n'est pas encore entièrement opérationnelle, mais si vous souhaitez y accéder plus tôt, vous pouvez les contacter et tenter de la tester.

Alerte offre spéciale !

Si vous êtes intéressé, profitez de 80 % de réduction jusqu'en juin. Oui, vous avez bien lu : 80 %. Alors, si vous souhaitez créer du contenu audio de qualité sans vous ruiner, c'est le moment de vous lancer. Après juin, j'imagine que les prix vont grimper, alors n'attendez pas !

Essai : Écoutons-le !

J'ai moi-même fait un test rapide et les résultats parlent d'eux-mêmes. Écoutez ces deux versions générées par le modèle sur la chaîne YouTube ci-dessus.

Il y a une légère différence dans la façon dont ils sonnent - la version 2 est meilleure, plus naturelle.
Mais c’est là toute la beauté du modèle : vous pouvez choisir la version qui vous convient le mieux.

Quelle est la prochaine étape ?

Ce modèle est encore en développement, mais je suis vraiment enthousiaste quant à ses possibilités. Commencez à l'expérimenter dès maintenant et faites-moi part de vos découvertes. Que vous souhaitiez générer du contenu audio réaliste, créer des robots interactifs ou simplement vous amuser avec différents personnages, les possibilités sont infinies.

Share Article

Get stories direct to your inbox

We’ll never share your details. View our Privacy Policy for more info.