זה יותר אקספרסיבי, יותר טבעי, ויותר רב-לשוני - אבל לא לגמרי ללא רבב.

OpenAI הוציאה זה עתה שדרוג למצב קולי מתקדם עבור משתמשי ChatGPT בתשלום - וזהו סימן ברור שהבינה המלאכותית שאיתה אנו מדברים מתחילה להישמע הרבה יותר כמונו.

גרסה חדשה זו, שמגיעה יומיים בלבד לאחר שהאינטרנט רטט סביב גרסה 3 של ElevenLabs , מביאה אינטונציה עדינה יותר, קצב חכם יותר (כן, היא יודעת מתי לעצור), וטווח רגשי הכולל כעת אמפתיה , סרקזם וכל מה שביניהם. אה, והיא יכולה גם לתרגם בשידור חי בין שפות, באמצע שיחה. בין אם אתם מזמינים קפה בפורטוגזית או מסבירים פרויקט ביפנית - Voice יכולה כעת לשחק גם את המתורגמן וגם את העוזר.

🎙️ אבל אל תבלבלו בין חלק למושלם.

💬 מה ש-OpenAI אומר

עם עדכון זה, OpenAI רוצה לגרום לשיחות עם ChatGPT להרגיש פחות כמו מתן פקודות - ויותר כמו שיחה עם מישהו ש"מבין את זה". מצב קולי עבר ממצב שטוח למצב צבעוני מלא, וכעת מסוגל להישמע מנחם , סקרן או אפילו קצת חצוף .

ועם תרגום בזמן אמת , הוא ממצב את עצמו כבן לוויה תמידי לנסיעות ועמית לעבודה ברחבי העולם.

🧠 מה זה אומר (במילים אנושיות)

מצב קולי הוא לא רק טבעי יותר - הוא פרקטי יותר.

  • כעת ניתן לשוחח בין שפות שונות , ללא ידיים.

  • זה עוצר ומדגיש כמו אדם אמיתי.

  • וכן, זה יכול עכשיו להישמע קצת סרקסטי אם הרגע דורש זאת.

זה מקרב את טכנולוגיית הקול של ChatGPT לרמה של עוזרות מבוססות תסריטים כמו Alexa או Siri - אבל עם הגמישות של דיאלוג פתוח.

אֶלָא…

❗ תקלות ידועות: עדיין קצת מחוספסות בקצוות

כמו כל אמן שמוצא את הטווח שלו, מצב קול עדיין לא מושלם.

  • מוזרויות אודיו : חלק מהמשתמשים מדווחים על ירידות באיכות הצליל, כמו שינויי גוון מביכים או ארטיפקטים רובוטיים.

  • הזיות מוזרות : מקרים נדירים של רעשי רקע, מוזיקה או צלילים דמויי פרסומות - למרות שאין נתונים כאלה.

הקולות אולי חלקים יותר, אבל הרוחות במכונה לא עזבו את הבניין במלואן.

❄️ נקודת מבט של צוות FrozenLight

השדרוג הזה מרשים. אבל הנה החלק השקט שכדאי לומר בקול רם:

להישמע אנושי זה לא אותו דבר כמו להיות מועיל.
קול שזורם באופן טבעי מרגיש אמין יותר - אבל זו אשליה רגשית. זה לא הופך את המודל למדויק יותר, או את התובנות למשמעותיות יותר. וזה בהחלט לא אומר שבעיית ההזיות נעלמה.

וגם - אקספרסיביות חותכת לשני הכיוונים. ככל שהקול מרגיש "אמיתי" יותר, כך הוא מרגיש לא בנוח יותר כשהוא טועה במשהו. טעות בנימה מונוטונית היא נסבלת. טעות בנימה בטוחה וסרקסטית? זה מוזר.

💡 אז הנה הרעיון שלנו:
אנחנו אוהבים את הכיוון הזה. אבל הצעד הבא הוא לא רק ליטוש קולי - זה לוודא שהתוכן של מה שנאמר תואם את איך שזה נשמע.

כי אי אפשר להפוך אמון לאוטומטי. אבל אפשר לבנות אותו - מילה במילה, קול בקול.

Share Article

Get stories direct to your inbox

We’ll never share your details. View our Privacy Policy for more info.