זה יותר אקספרסיבי, יותר טבעי, ויותר רב-לשוני - אבל לא לגמרי ללא רבב.
OpenAI הוציאה זה עתה שדרוג למצב קולי מתקדם עבור משתמשי ChatGPT בתשלום - וזהו סימן ברור שהבינה המלאכותית שאיתה אנו מדברים מתחילה להישמע הרבה יותר כמונו.
גרסה חדשה זו, שמגיעה יומיים בלבד לאחר שהאינטרנט רטט סביב גרסה 3 של ElevenLabs , מביאה אינטונציה עדינה יותר, קצב חכם יותר (כן, היא יודעת מתי לעצור), וטווח רגשי הכולל כעת אמפתיה , סרקזם וכל מה שביניהם. אה, והיא יכולה גם לתרגם בשידור חי בין שפות, באמצע שיחה. בין אם אתם מזמינים קפה בפורטוגזית או מסבירים פרויקט ביפנית - Voice יכולה כעת לשחק גם את המתורגמן וגם את העוזר.
🎙️ אבל אל תבלבלו בין חלק למושלם.
💬 מה ש-OpenAI אומר
עם עדכון זה, OpenAI רוצה לגרום לשיחות עם ChatGPT להרגיש פחות כמו מתן פקודות - ויותר כמו שיחה עם מישהו ש"מבין את זה". מצב קולי עבר ממצב שטוח למצב צבעוני מלא, וכעת מסוגל להישמע מנחם , סקרן או אפילו קצת חצוף .
ועם תרגום בזמן אמת , הוא ממצב את עצמו כבן לוויה תמידי לנסיעות ועמית לעבודה ברחבי העולם.
🧠 מה זה אומר (במילים אנושיות)
מצב קולי הוא לא רק טבעי יותר - הוא פרקטי יותר.
כעת ניתן לשוחח בין שפות שונות , ללא ידיים.
זה עוצר ומדגיש כמו אדם אמיתי.
וכן, זה יכול עכשיו להישמע קצת סרקסטי אם הרגע דורש זאת.
זה מקרב את טכנולוגיית הקול של ChatGPT לרמה של עוזרות מבוססות תסריטים כמו Alexa או Siri - אבל עם הגמישות של דיאלוג פתוח.
אֶלָא…
❗ תקלות ידועות: עדיין קצת מחוספסות בקצוות
כמו כל אמן שמוצא את הטווח שלו, מצב קול עדיין לא מושלם.
מוזרויות אודיו : חלק מהמשתמשים מדווחים על ירידות באיכות הצליל, כמו שינויי גוון מביכים או ארטיפקטים רובוטיים.
הזיות מוזרות : מקרים נדירים של רעשי רקע, מוזיקה או צלילים דמויי פרסומות - למרות שאין נתונים כאלה.
הקולות אולי חלקים יותר, אבל הרוחות במכונה לא עזבו את הבניין במלואן.
❄️ נקודת מבט של צוות FrozenLight
השדרוג הזה מרשים. אבל הנה החלק השקט שכדאי לומר בקול רם:
להישמע אנושי זה לא אותו דבר כמו להיות מועיל.
קול שזורם באופן טבעי מרגיש אמין יותר - אבל זו אשליה רגשית. זה לא הופך את המודל למדויק יותר, או את התובנות למשמעותיות יותר. וזה בהחלט לא אומר שבעיית ההזיות נעלמה.
וגם - אקספרסיביות חותכת לשני הכיוונים. ככל שהקול מרגיש "אמיתי" יותר, כך הוא מרגיש לא בנוח יותר כשהוא טועה במשהו. טעות בנימה מונוטונית היא נסבלת. טעות בנימה בטוחה וסרקסטית? זה מוזר.
💡 אז הנה הרעיון שלנו:
אנחנו אוהבים את הכיוון הזה. אבל הצעד הבא הוא לא רק ליטוש קולי - זה לוודא שהתוכן של מה שנאמר תואם את איך שזה נשמע.
כי אי אפשר להפוך אמון לאוטומטי. אבל אפשר לבנות אותו - מילה במילה, קול בקול.