إنه أكثر تعبيرًا، وأكثر طبيعية، وأكثر تعددًا في اللغات - ولكن ليس خاليًا من العيوب تمامًا.

أطلقت OpenAI للتو ترقية لوضع الصوت المتقدم لمستخدمي ChatGPT المدفوعين - وهي علامة واضحة على أن الذكاء الاصطناعي الذي نتحدث إليه بدأ يبدو أكثر تشابهًا بنا.

هذا الإصدار الجديد، الذي صدر بعد يومين فقط من ضجة الإنترنت حول الإصدار الثالث من ElevenLabs ، يُضفي نبرة صوت أكثر دقة، وإيقاعًا أكثر ذكاءً (نعم، يعرف متى يتوقف)، ونطاقًا عاطفيًا يشمل الآن التعاطف والسخرية وكل ما بينهما. كما يُمكنه الترجمة الفورية بين اللغات أثناء المحادثة. سواء كنت تطلب قهوة بالبرتغالية أو تشرح مشروعًا باليابانية، يُمكن للصوت الآن أن يلعب دور المترجم الفوري والمساعد.

🎙️ ولكن لا تخلط بين السلس والكمال.

💬 ما يقوله OpenAI

مع هذا التحديث، تريد OpenAI جعل المحادثات باستخدام ChatGPT تبدو أقل مثل إصدار الأوامر - وأكثر مثل التحدث إلى شخص "يفهم الأمر". لقد انتقل وضع الصوت من المسطح إلى اللون الكامل، وهو الآن قادر على إصدار صوت مريح أو فضولي أو حتى وقح قليلاً .

وبفضل الترجمة الفورية ، فإنه يضع نفسه كرفيق سفر دائم وزميل عمل عالمي.

🧠 ماذا يعني ذلك (بالكلمات البشرية)

وضع الصوت ليس أكثر طبيعية فحسب، بل إنه أكثر عملية أيضًا .

  • يمكنك الآن المحادثة عبر اللغات دون استخدام اليدين.

  • ويتوقف ويؤكد مثل شخص حقيقي.

  • ونعم، يمكن الآن أن يبدو الأمر ساخرًا بعض الشيء إذا كانت اللحظة تستدعي ذلك.

ويجعل هذا تقنية الصوت في ChatGPT أقرب إلى مستوى المساعدين النصيين مثل Alexa أو Siri - ولكن مع مرونة الحوار المفتوح.

يستثني…

❗ الأخطاء المعروفة: لا تزال اللعبة غير واضحة بعض الشيء

مثل أي فنان يبحث عن نطاقه، فإن Voice Mode ليس مثاليًا بعد.

  • عيوب الصوت : أبلغ بعض المستخدمين عن انخفاض في جودة الصوت، مثل التحولات اللونية المحرجة أو التحف الروبوتية.

  • هلوسات غريبة : حالات نادرة من الضوضاء في الخلفية، أو الموسيقى، أو الأصوات التي تشبه الإعلانات - على الرغم من عدم وجود مثل هذه البيانات.

ربما تكون الأصوات أكثر سلاسة، لكن الأشباح الموجودة في الجهاز لم تغادر المبنى بالكامل.

❄️ منظور فريق FrozenLight

هذا التحديث مُبهر. لكن إليكم الجزء المهم الذي يستحق أن نُعلنه:

إن أن تبدو إنسانيًا لا يعني بالضرورة أنك مفيد.
الصوت الذي يتدفق بشكل طبيعي يبدو أكثر موثوقية، لكن هذا وهم عاطفي. فهو لا يزيد دقة النموذج، ولا يجعل الأفكار أكثر مغزى. وبالتأكيد لا يعني هذا زوال مشكلة الهلوسة.

كذلك، التعبيرية لها جانبان. كلما كان الصوت "حقيقيًا"، زاد الانزعاج عند ارتكاب خطأ. خطأ بنبرة رتيبة أمر مقبول. أما خطأ بنبرة واثقة وساخرة؟ هذا غريب.

💡 إذن إليكم وجهة نظرنا:
نحن معجبون بهذا التوجه. لكن الخطوة التالية ليست مجرد صقل الصوت، بل التأكد من أن محتوى ما يُقال يتوافق مع صوته.

لأن الثقة لا يمكن أتمتة بناءها، لكن يمكنك بنائها - كلمةً بكلمة، صوتًا بصوت.

Share Article

Get stories direct to your inbox

We’ll never share your details. View our Privacy Policy for more info.