أطلقت شركة مايكروسوفت للتو ميزة جديدة في برنامج Copilot Studio تسمى "استخدام الكمبيوتر".
إنه يتيح لوكلاء الذكاء الاصطناعي تنفيذ إجراءات على شاشتك - مثل النقر على الأزرار، والكتابة في الحقول، والتمرير عبر صفحات الويب، والتنقل بين التطبيقات.
لذا، إذا كانت عمليتك موجودة عبر مجموعة من مواقع الويب والنوافذ المنبثقة والأدوات التي لا تعمل بشكل جيد بدون واجهة برمجة التطبيقات (API)، فيمكن لبرنامج Copilot التعامل معها الآن.
📣 ما تقوله مايكروسوفت
تصف مايكروسوفت هذا باعتباره ترقية تسمح للوكلاء بالتفاعل مع واجهات المستخدم الرسومية - مما يمكنهم من إكمال المهام عن طريق محاكاة نقرات الماوس ومدخلات لوحة المفاتيح.
يقولون إنها تمنح الوكلاء القدرة على "العمل عبر الأنظمة التي تفتقر إلى واجهات برمجة التطبيقات أو التكامل المباشر".
بعبارة أخرى: إذا كان برنامجك لا يتحدث إلى أي شيء، فسيظل برنامج Copilot قادرًا على إنجاز المهمة.
ويشيرون أيضًا إلى أن النظام يستخدم التفكير العميق لفهم ما يظهر على الشاشة وتحديد كيفية المتابعة - حتى عندما يتغير التخطيط.
💬 بكلمات إنسانية
وهذا يعني أن وكيل Copilot الخاص بك لا يحتاج إلى أن يكون كل شيء مثاليًا.
يمكن:
التعرف على صفحات تسجيل الدخول، حتى لو تم نقل الزر
املأ النموذج، حتى لو كانت العلامات غريبة
إكمال المهام متعددة الخطوات، حتى عندما يظهر شيء غير متوقع
لماذا؟
لأنه تم تدريبه على التعرف على الأنماط - ويمكنه معرفة ما يجب فعله بناءً على ما رآه من قبل.
لا يحفظ الشاشات، بل يقرأها.
وهنا كيفية المقارنة:
مهمة | روبوتات الأتمتة القديمة | ميزة جديدة لمساعد الطيار |
يحتاج إلى تخطيط دقيق | ✅ نعم | ❌ لا |
يتعامل مع التغييرات المرئية | ❌ فترات راحة | ✅ يستمر |
يعمل بدون واجهة برمجة التطبيقات | ❌ لا استطيع | ✅ هل يمكن |
يفهم الأنماط | ❌ لا | ✅ نعم |
يتعامل مع المفاجآت (النوافذ المنبثقة والتأخيرات) | ❌ يعلق | ✅ حاول بطريقة أخرى |
هذا ليس الذكاء الاصطناعي الذي ينتظر تعليمات نظيفة.
إنها تتدحرج مع الفوضى.
🧪 ما لا يقوله أحد بصوت عالٍ: هنا تبدأ خوارزميات البحث العميق في اكتساب أهمية حقيقية
حتى الآن، كانت خوارزميات البحث العميق تُستخدم في الغالب لإنشاء مستندات ذكية - كتابة التقارير، واستخلاص الحقائق، والمساعدة في المحتوى الذي يعتمد بشكل كبير على البحث.
لقد رأينا البائعين يزينونها بعناوين مثل "الذكاء الاصطناعي على المستوى الأكاديمي" أو "روبوت محادثة حاصل على درجة علمية".
لقد بدا هذا مثيرًا للإعجاب - لكنه لم يظهر ما يمكن لهذا النوع من الخوارزمية أن يفعله حقًا.
هذا التحديث يغير ذلك.
لأن هذه المرة، لا يتم استخدامه للكتابة عن شيء ما - بل يتم استخدامه للقيام بشيء ما.
إنه ينقر
إنه أنواع
يتنقل عبر الأنظمة دون تعليمات
إنه يعمل حتى عندما يكون التخطيط مختلفًا في كل مرة
هذا ممكن لأن هذه الخوارزمية تعمل من خلال الأنماط - وليس الأوامر الصارمة.
إنها ليست محادثة من المستوى التالي.
إنه الملاحة.
إنه عمل رقمي.
كانت الروبوتات القديمة بحاجة إلى تسميات مثالية وشاشات ذات بكسل مثالي.
هذا لا يفعل.
هذا هو التأثير الحقيقي .
ماذا يفعل | استخدام الخوارزميات العميقة في المستندات/الدردشة | استخدام جديد من مايكروسوفت لبرنامج Copilot Studio |
كتابة أو تلخيص محتوى البحث | ✅ نعم | ❌ لا |
التنقل بين المواقع والتطبيقات | ❌ لا | ✅ نعم |
العمل بدون بيانات منظمة (API) | ❌ غير مصمم لذلك | ✅ يتعامل معها |
التكيف مع تغييرات الشاشة | ❌ غير ذي صلة | ✅ القدرة الأساسية |
التصرف بناء على المعلومات في الوقت الحقيقي | ❌ لا استطيع | ✅ هل |
وهنا نرى التغيير الحقيقي - لأنه يقوم بالعمل في النهاية، وليس مجرد وصفه.
🔚 خلاصة القول
التكلفة: متضمنة في Microsoft Copilot Studio
التوفر: متاح الآن
اقرأ المزيد.
إذا كان سير عملك اليومي يتضمن برامج قبيحة، وبوابات غريبة، ولحظات "لماذا يوجد هذا الزر هناك؟" - فقد يتمكن Copilot أخيرًا من مساعدتك.
🧊 منظور فريق Frozen Light
الجميع مشغولون بالحديث عن الميزة.
نعم، إنه مفيد.
نعم، ينقر على الأزرار ويرسل الفواتير.
لكننا ننظر إلى الخوارزمية - لأن هذا هو الجزء الذي لا يتحدث عنه أحد بصوت عالٍ بما فيه الكفاية.
هذه خوارزمية بحثية عميقة - وهي تعمل خارج المختبر.
إنه ليس تلخيصًا، وليس كتابةً.
إنه في الواقع يفعل الأشياء التي نكره القيام بها:
إرسال الفواتير
تسجيل الدخول إلى الأنظمة المعقدة
تحميل الملفات عبر البوابات المعطلة
الانتهاء من عملية التوجيه عبر التطبيقات التي لا تتصل
هذا هو التقدم الحقيقي .
ونحن هنا من أجل ذلك.
ولكن هذا هو السبب الذي يجعلنا نولي اهتماما حقيقيا لهذا الأمر:
قبل بضعة أيام، منحت جوجل ناشري مواقع الويب خيارًا -
دعنا ندرب خوارزمية البحث العميقة الخاصة بنا على المحتوى الخاص بك... أو اختر إلغاء الاشتراك.
وتخيل ماذا؟
أغلبهم قالوا لا.
تم إسقاط رمز Google بسرعة.
هذا هو نوع التأثير الذي تحدثه هذه الخوارزميات عندما لا تتمكن من الوصول إليها.
الآن اقلبه.
إن إصدار مايكروسوفت موجود في الميدان، وهو في الحركة، ويتحسن - لأن الناس يستخدمونه.
وهنا الحقيقة غير المريحة:
عندما نستخدم هذه الأدوات، نصبح جزءًا من هذا التدريب.
نحن لا نقول أن هذا جيد أو سيء.
نحن نقول: هذا هو الدور الذي يلعبه المستخدمون في الذكاء الاصطناعي في الوقت الحالي - سواء اعترفنا بذلك أم لا.
لم تقم Microsoft بإسقاط هذا النموذج في Copilot Studio بشكل عشوائي.
ونحن لا نعتقد أنهم تدربوا في عزلة.
إذا كنا مخطئين؟ عذراً، مايكروسوفت.
لكننا لا نعتقد أننا كذلك.
لذا لا - ليس عليك أن توافق.
لا يتوجب عليك المشاركة.
لكننا سنستمر في الإشارة إلى ما لا يقوله أحد آخر:
يأتي التقدم من الخوارزميات المسموح لها باللعب.
وهذا يلعب - بجد.
نحن متحمسون.
لأن هذه ليست زيادة أخرى في الإنتاجية.
هذه طريقة جديدة لإنجاز الأمور.
ونحن نراقب لنرى كيف تتطور هذه الخوارزمية عبر جميع البائعين الرئيسيين.