Una breve novità per tutti voi: ElevenLabs ha appena rilasciato la versione 3 del suo modello di sintesi vocale, e indovinate un po'? Affermano di essere il TTS più espressivo in circolazione. Ora, non so se questo significhi "il più espressivo al mondo" (si stanno sicuramente sbilanciando, però), ma una cosa è certa: è decisamente più espressivo di qualsiasi cosa abbiano mai lanciato prima. Non vedevo l'ora di provarlo, quindi ecco cosa ho scoperto!

Di cosa si tratta?

Ecco il punto: questo nuovo modello è ancora in modalità "anteprima di ricerca", ma ti permettono già di provarlo. Ogni volta che genera una voce, ti offre due opzioni tra cui scegliere, così puoi avere una sorta di "scegli la tua avventura" per le tue esigenze di sintesi vocale. La parte interessante? Lo stanno ancora perfezionando perché, beh, la concorrenza si sta facendo agguerrita. Questo è un buon momento per metterti all'opera e iniziare a sperimentarlo.

Funzionalità interessanti da provare

Ecco un riepilogo di alcune cose che mi hanno colpito:

  • Emozioni con pronuncia : sì, ora puoi aggiungere emozione alla pronuncia della voce usando le parentesi. Super facile da usare e conferisce molto più carattere alla voce.

  • Dialoghi a velocità diverse : ora puoi far parlare due personaggi a velocità diverse, il che è ottimo per creare conversazioni realistiche.

  • 70 lingue : sì, hanno 70 lingue a disposizione, quindi puoi usare questo modello a livello globale (o almeno regionale, a seconda di dove lo usi).

  • API ad accesso anticipato : l'API non è ancora completamente attiva, ma se vuoi averla subito puoi contattarli e provare a testarla.

Avviso di offerta speciale!

Se siete interessati, c'è uno sconto dell'80% fino a giugno. Sì, avete letto bene: 80%. Quindi, se volete iniziare a generare contenuti audio di qualità senza spendere una fortuna, è il momento di farlo. Dopo giugno, immagino che il prezzo salirà, quindi non aspettate!

Prova pratica: sentiamo!

Ho fatto un rapido test e, beh, i risultati parlano da soli. Ascoltate queste due versioni generate dal modello sul canale YouTube allegato qui sopra.

C'è una leggera differenza nel suono: la versione 2 è venuta fuori meglio, più naturale.
Ma è proprio questo il bello del modello: puoi scegliere la versione che funziona meglio per te.

Cosa succederà adesso?

Questo modello è ancora in fase di sviluppo, ma sono davvero entusiasta di ciò che è già in grado di fare. Inizia a sperimentarlo ora e fammi sapere cosa ne pensi. Che tu voglia generare contenuti audio realistici, costruire bot interattivi o semplicemente divertirti con personaggi diversi, le possibilità sono infinite.

Share Article

Get stories direct to your inbox

We’ll never share your details. View our Privacy Policy for more info.