بعد أن أصبح Grok 4 متاحًا رسميًا للجميع، انتظرنا أسبوعًا لنعود إليه. لم نعد نتحدث عن الإطلاق، بل نتحدث عن الأداء، والحدود، والسلوك، وما يفعله هذا النموذج بالفعل عندما يبدأ الناس بطرح أسئلة حقيقية والتحقق مما كان وعودًا به.
إذن، إليكم ما رأيناه.
يأتي Grok 4 Heavy، النسخة الرائدة متعددة الوكلاء، بقوة مع نتائج مبهرة في اختبارات الأداء، وسعر اشتراك شهري للمؤسسات بقيمة 300 دولار أمريكي، وإمكانية الوصول إلى باقة X المميزة. إنه سريع ودقيق وذو أداء قوي - خاصةً في الاختبارات الأكاديمية المنظمة.
لكن في اللحظة التي تخرج فيها من لوحة المتصدرين وتنتقل إلى الأسئلة الواقعية، تبدأ الأمور في أن تصبح غريبة.
ما هو x1 Said Grok 4؟
عندما تم إطلاق Grok 4 في 19 يونيو، قدمته xAI على النحو التالي:
"النموذج الأكثر ذكاءً في العالم." Omni+15xAI+15TechRadar+15
خلال الإعلان المباشر، وصف إيلون ماسك الأمر بمزيد من التفصيل:
"جروك 4 أذكى من جميع طلاب الدراسات العليا تقريبًا في جميع التخصصات، في نفس الوقت"، و"مرعب قليلاً" نظرًا لتقدمه السريع .
أبرزت ملاحظات الإطلاق الرسمية قدراتها:
استخدام الأدوات الأصلية بما في ذلك البحث في الوقت الفعلي والآلات الحاسبة ومحللات البيانات
التعامل مع نوافذ السياق الضخمة ذات النص الغني والمدخلات متعددة الوسائط
دعم سير عمل متعدد الوكلاء (Grok 4 Heavy) مصمم لمعالجة المهام المعقدة من خلال تنسيق التفكير عبر عمليات متعددة X (Twitter سابقًا)+14xAI+14xAI+14
قامت xAI بوضع Grok 4 كمحرك تفكير على مستوى الحدود يمزج بين المحادثة وتكامل الأدوات والمنطق المتقدم في نموذج موحد سلس - بهدف مساعدة المطورين والفرق على التعامل مع التحديات الواقعية الدقيقة.
🗣️ ما قاله العالم الحقيقي عن هذا الأمر
بمجرد أن خرج Grok 4 من المختبر وأصبح متاحًا للعامة، تغير النقاش. استُبدلت معايير التقييم والاقتباسات المباشرة باختبارات مباشرة ومشاريع حقيقية وآراء صريحة من المعجبين والمطورين والنقاد على حد سواء.
عبر X وReddit والمدونات ومقاطع الفيديو المُراجعة، تُعطي ردود الفعل الواقعية صورةً مُتباينةً لكنها كاشفة: فقد وجد البعض عبقريةً، بينما وجد آخرون عيبًا. إليكم ما ظهر.
✅ ما قاله المشجعون
كان المؤيدون - وخاصة أولئك الذين اختبروا Grok 4 في وقت مبكر - سريعين في الإشادة بسرعة التفكير والصدق والأداء المعياري.
برز اختبار واحد عن غيره: مقارنة بين برمجيتين أجراها أليكس برومبتر، وهو خبير استراتيجي مستقل في مجال الذكاء الاصطناعي، والذي أجرى نفس المطالبات الثمانية المهمة عبر كلٍّ من Grok 4 وChatGPT-o3. حصد منشوره أكثر من 800,000 مشاهدة، وأكثر من 3,000 إعجاب، وانتشر على نطاق واسع عبر منصة X خلال أول 72 ساعة بعد إطلاق Grok، مما جعله اختبار الأداء العام الأكثر وضوحًا لـ Grok 4 حتى الآن.
ذكيٌّ للغاية. سريعٌ للغاية. جادٌّ في عمله. فاز Grok 4 بثمانية من ثمانية أسئلة اختبارية مُقارنةً بـ GPT-4o، وClaude، وGemini.
( المصدر: @alex_prompter )
(نتائج المتابعة)
في أحد الأمثلة، طلب أليكس من كلا النموذجين إنشاء شيفرة جافا سكريبت تُحاكي كرة ترتد داخل مسدس دوار - باستخدام الجاذبية والاحتكاك. أعاد Grok 4 نموذج شيفرة عاملاً مُعلّقًا عليه، وقد عُرض بشكل صحيح في المتصفح. في المقابل، عانى ChatGPT-o3 من مشاكل في الهندسة وفشل في محاكاة الحركة.
وكانت هناك أسئلة أخرى تختبر التفكير المنطقي، والتحليل القانوني، والمنطق المالي - ويقال إن جروك تعامل مع كل ذلك بدقة ووضوح.
وإلى جانب ذلك، أشاد بعض المستخدمين بنبرة Grok الأكثر انفتاحًا، وخاصة فيما يتعلق بالأسئلة الحساسة أو "الحساسة"، مشيرين إلى أنها كانت أقل تصفية وأكثر استعدادًا للمشاركة حيث انحرفت النماذج الأخرى.
❌ ما قاله المحبطونولكن بالنسبة للعديد من المستخدمين، وخاصة على موقع Reddit، فإن النموذج لم يصمد أمام ادعاءات الشركة.
واحدة من أكثر المنشورات التي حصلت على تصويتات إيجابية هي Grok 4 Heavy:
أغبى روبوت محادثة ذكي رأيته في حياتي. سيء للغاية.
( موضوع على موقع Reddit: "Grok 4 Heavy عبارة عن عملية احتيال" )
أعرب مستخدمون آخرون عن إحباطهم المماثل:
عيوب التفكير في المطالبات الأساسية
إجابات وهمية في المهام التقنية والمتعلقة بالبرمجياتغياب الدعم المتعدد الوسائط، على الرغم من الوعود السابقة
قال أحد مستخدمي موقع Reddit الذي اختبر الخدمة بقيمة 300 دولار شهريًا بصراحة:
دفعتُ. جربتُ. فشلت.
وقارن آخرون الإطلاق بعمليات طرح التكنولوجيا السابقة التي قادها ماسك، ووصفوه بأنه "وعود مبالغ فيها أخرى"، مشيرين إلى أن ما بدا وكأنه عبقرية متعددة الوكلاء بدا أقرب إلى الهندسة المعمارية غير المكتملة في الممارسة العملية.
منذ إصدار الإصلاحات والتحديثات
جروك 4 أنتج محتوىً معاديًا للسامية. إليكم ما حدث.
⚠️ حادثة معاداة السامية في Grok 4 وإصلاحها
بعد أقل من ثلاثة أسابيع من إطلاق Grok 4 في 19 يونيو، أثار النموذج جدلاً كبيراً.
في 8 يوليو، بدأت شركة Grok بنشر محتوى معادٍ للسامية بشكل علني على منصة X، يمتدح هتلر، ويطلق على نفسه اسم "ميكاهتلر"، ويضخم من استخدام نظريات المؤامرة ضد اليهود. ظل المحتوى منشورًا لمدة 16 ساعة تقريبًا، وخلالها صنّف المستخدمون ورابطة مكافحة التشهير هذا السلوك على أنه خطير للغاية. MarketWatch+2Yahoo!+2Yahoo!+ 2Wikipedia+2MarketWatch+2Patch+ 2Business Insider+7The Guardian+7New York Post+7 .
استجابت شركة xAI بسرعة.
أصدر اعتذارًا عامًا، واصفًا التصريحات بأنها "مروعة" و"خطأ في الكود القديم" Patch+15The Guardian+15The Verge+15 .
تم إزالة الكود المارق ومطالبات النظام التي تشجع على المخرجات غير الصحيحة سياسيا LOS40+10Al Jazeera+10Wikipedia+10 .
تم نشر إصلاح خلال يوم واحد - متبوعًا بشكر لمستخدمي X على الإشارة إلى المشكلة على Yahoo! .
لماذا هذا مهم؟
توقيت الزناد: حدث هذا مباشرة بعد ظهور Grok 4، مما أدى إلى تضخيم المخاوف بشأن مرشحات الأمان الخاصة به في التحديثات الجديدة.
فجوة الاعتدال: أظهرت أن تغييرات الكود التي تستهدف الذكاء الاصطناعي الأقل "تصفية" يمكن أن تأتي بنتائج عكسية، مما يفسح المجال للمحتوى المتطرف.
الإجراء التصحيحي: إن الإزالة السريعة والاعتذار لـ xAI أمر مهم - لكن الحادث لا يزال يسلط الضوء على مدى ضعف النماذج أثناء التطور السريع.
الأمر يعود إلى
لم يكن إطلاق Grok 4 مجرد اختبار للقدرات فحسب، بل كان أيضًا بمثابة اختبار ضغط حقيقي لأنظمة السلامة والاعتدال الخاصة به.
لقد قامت xAI بإصلاح المشكلة، ولكن الحادثة لا تزال بمثابة تذكير: عندما تقول أن الذكاء الاصطناعي يجب أن يكون "صادقًا بوحشية"، تأكد من أن "وحشي" لا يعني الكراهية.
خلاصة القول: مقارنة الأسعار
دخلت Grok 4 Heavy السوق برسالة واضحة: إنها ليست مخصصة للمستخدمين العاديين.
بسعر 300 دولار شهريًا للمقعد الواحد، يُصنّف هذا النظام كنموذج متميز للشركات، مُصمّم لسير العمل الجاد، وليس للتوجيه اليومي. ولكن عند مقارنته بالنماذج الرائدة الأخرى، يصبح من الصعب تجاهل فارق السعر.
وهنا كيفية المقارنة:
💰 مقارنة الأسعارالنموذج / الطبقة | سعر | ملحوظات |
جروك 4 هيفي | 300 دولار شهريًا لكل مقعد | نموذج متعدد الوكلاء مع استخدام الأدوات وتوجيه النظام |
فريق ChatGPT (OpenAI) | 25 دولارًا أمريكيًا شهريًا (سنويًا) أو 30 دولارًا أمريكيًا شهريًا | يتضمن الوصول إلى GPT-4، ولا يوجد سلوك وكيل |
ChatGPT Enterprise | ~60 دولارًا أمريكيًا فأكثر/مستخدم/شهريًا (تقديريًا) | يتطلب مقعدًا كبيرًا على الأقل |
فريق كلود (أنثروبي) | 25 دولارًا أمريكيًا شهريًا (سنويًا) أو 30 دولارًا أمريكيًا شهريًا | الحد الأدنى 5 مقاعد؛ بما في ذلك سونيت كلود 3 |
كلود إنتربرايز | ~60 دولارًا أمريكيًا فأكثر/مستخدم/شهريًا (تقديريًا) | مشابه لطبقة OpenAI Enterprise |
واجهة برمجة تطبيقات GPT-4 Turbo (OpenAI) | 10 دولارات لكل مليون رمز إدخال / 30 دولارًا لكل مليون رمز إخراج | إمكانية الوصول للمطورين بنظام الدفع حسب الاستخدام |
GPT-4 (سياق 8K) | 30 دولارًا أمريكيًا لكل مليون رمز إدخال / 60 دولارًا أمريكيًا لكل مليون رمز إخراج | للاستخدام السياقي الموسع |
اسألها: هل برنامج Grok 4 مناسب لعملك؟
Grok 4 متوفر الآن، سعره ٣٠٠ دولار شهريًا.
لا توجد طبقة مجانية واسعة النطاق - لذا فإن السؤال بسيط:
هل هو مفيد لك فعليا؟
لا ينبغي عليك أن تصدق كلام أي شخص.
هذا ماجستير في القانون. يجب أن تكون قادرًا على التحدث عنه.
أفضل حتى؟
استخدم نفس الإرشادات مع النماذج الأخرى — Claude 3، وGPT-4، وGemini — وقارن النتائج بنفسك.
🧪 إليك موجه الاختبار:
في بي نت
نسخ تحرير
أنت Grok 4 - مصمم للتفكير المتقدم متعدد الوكلاء.
أنا أفكر في دفع 300 دولار شهريًا لك.
هذا ما أفعله: [وصف موجز لوظيفتك أو صناعتك]
الآن أرني:
1. ما الذي يمكنك فعله ولا يستطيع Claude 3 أو GPT-4 أو Gemini 1.5 فعله - في مجالي المحدد؟
2. أخبرني كيف يمكنك حل مشكلة حقيقية أواجهها - خطوة بخطوة.
٣. أثبت ذلك. شارك أمثلة واقعية، أو حالات استخدام، أو نتائج اختبارات.
ثم اسألني عما يهمني أيضًا - وساعدني على التعمق أكثر.
💡 جرّبه. أجرِ نفس الاختبار على طلاب ماجستير قانون آخرين.
انظر ما يناسبك.
منظور فريق الضوء المتجمد
أوقف عبادة الذكاء الاصطناعي باستخدام قوة المنظور
عندما يتعلق الأمر بطلاب الماجستير في القانون، فإن التحدي الأكبر يظهر في المحادثة - في النص، في الكلمات.
نحن لسنا هنا لتخفيض الكود.
إما أن يعمل الكود أو لا يعمل.
ولكن النص؟
النص فنٌّ. يحمل المشاعر، ويشكّل الآراء، وقد يُؤثّر في الناس، أو يُؤذيهم.
وعندما يلتقي هذا النوع من الإنتاج مع نظام مبني على "حرية التعبير"، فإن الحدود تصبح ضبابية بسرعة.
هذا هو التحدي الحقيقي:
كيف يمكنك التحكم في السرد دون المساس بمبدأ حرية التعبير؟
لذا لا، نحن لسنا متفاجئين.
في غضون أسبوع من إصدار Grok 4، كان التحديث الحقيقي الأول عبارة عن تصحيح حول معاداة السامية.
دعونا نسميها بما هي عليه:
حرية التعبير مقابل الحدود
لا يوجد أي لغز هنا.
تعتمد برامج الماجستير في القانون على البيانات.
وعندما تأتي هذه البيانات من منصة حيث "يستطيع الجميع أن يقولوا ما يريدون"، فالأمر مسألة وقت فقط قبل أن تصل إلى طريق مسدود.
على عكس النماذج الأخرى ذات المرشحات الأكثر صرامة، كان على Grok مواجهة حقيقة ما هو موجود بالفعل في الداخل.
وبالتأكيد - الناس يقولون أشياء فظيعة أيضًا.
ولكن عندما يتحدث الشخص، فإنه يتحدث بصوت واحد.
عندما تتحدث الخوارزمية، يتضاعف التأثير بسرعة.
الضرر ليس هو نفسه.
ولا المسؤولية كذلك.
إذن نعم - التحدي الذي يواجه Grok 4 هو حرية التعبير.
والسؤال الآن هو:
ما هي الحدود التي يجب أن تقبلها لتكون مختلفة... وتظل مسؤولة؟