Microsoft acaba de lanzar una nueva función en Copilot Studio llamada “Uso de computadora”.
Permite que los agentes de IA realicen acciones en su pantalla, como hacer clic en botones, escribir en campos, desplazarse por páginas web y moverse entre aplicaciones.

Entonces, si su proceso se extiende a través de una serie de sitios web, ventanas emergentes y herramientas que funcionan a medias y no tienen API, Copilot ahora puede manejarlo.

📣 Lo que dice Microsoft

Microsoft describe esto como una actualización que permite a los agentes interactuar con interfaces gráficas de usuario, lo que les permite completar tareas simulando clics del mouse y entradas de teclado.

Dicen que brinda a los agentes la capacidad de “operar en sistemas que carecen de API o integraciones directas”.
En otras palabras: si su software no se comunica con nada, Copilot seguirá haciendo el trabajo.

También señalan que el sistema utiliza un razonamiento profundo para comprender lo que hay en la pantalla y decidir cómo proceder, incluso cuando cambia el diseño.

💬 En palabras humanas

Esto significa que su agente Copilot no necesita que todo sea perfecto.
Puede:

  • Reconocer páginas de inicio de sesión, incluso si el botón se mueve

  • Rellene un formulario, incluso si las etiquetas son raras

  • Complete tareas de varios pasos, incluso cuando surja algo inesperado

¿Por qué?
Porque ha sido entrenado para reconocer patrones y puede decidir qué hacer basándose en lo que ha visto antes.
No memoriza pantallas. Las lee.

Aquí se muestra cómo se compara:

Tarea

Bots de automatización antiguos

Nueva función de Copilot

Necesita un diseño exacto

✅ Sí

❌ No

Maneja cambios visuales

❌ Descansos

✅ Sigue adelante

Funciona sin API

❌ No puedo

✅ Puede

Entiende patrones

❌ No

✅ Sí

Maneja sorpresas (ventanas emergentes, retrasos)

❌ Se queda atascado

✅ Prueba de otra manera

Esta no es una IA que espera instrucciones claras.
Rueda con el desorden.

🧪 Lo que nadie dice en voz alta: aquí es donde los algoritmos de investigación profunda realmente empiezan a importar

Hasta ahora, los algoritmos de investigación profunda se utilizaban principalmente para crear documentos inteligentes (redactar informes, extraer datos y ayudar con contenido de gran carga de investigación).
Hemos visto a proveedores disfrazarlo con títulos como "IA de nivel académico" o "un chatbot con un título".

Eso sonaba impresionante, pero no demostraba lo que este tipo de algoritmo podía realmente hacer.

Esta actualización cambia eso.

Porque esta vez no se está utilizando para escribir sobre algo, se está utilizando para hacer algo.

  • Hace clic

  • Escribe

  • Navega por sistemas sin instrucciones.

  • Funciona incluso cuando el diseño es diferente cada vez.

Esto es posible porque este algoritmo funciona a partir de patrones, no de comandos estrictos.
No es un chat de nivel superior.
Es navegación.
Es acción digital.

Los robots antiguos necesitaban etiquetas perfectas y pantallas con píxeles perfectos.
Este no lo hace
Ese es el verdadero impacto.

Qué hace

Uso de algoritmos profundos en documentos y chats

El nuevo uso de Microsoft en Copilot Studio

Escribir o resumir el contenido de la investigación

✅ Sí

❌ No

Navegar por sitios web y aplicaciones

❌ No

✅ Sí

Trabajar sin datos estructurados (API)

❌ No está diseñado para ello

✅ Lo maneja

Adaptarse a los cambios de pantalla

❌ No relevante

✅ Capacidad central

Actuar sobre la información en tiempo real

❌ No puedo

✅ ¿Lo hace?

Aquí es donde vemos un cambio real, porque finalmente se está haciendo el trabajo, no solo describiéndolo.

En resumen

Costo: Incluido en Microsoft Copilot Studio
Disponibilidad: Disponible ahora
Leer más.

Si su flujo de trabajo diario incluye software feo, portales extraños y momentos de "¿por qué está ese botón ahí?", Copilot finalmente podría ayudarlo.

🧊 Perspectiva del equipo Frozen Light

Todo el mundo está ocupado hablando de la función.
Sí, es útil.
Sí, hace clic en botones y envía facturas.
Pero estamos analizando el algoritmo, porque esa es la parte de la que nadie habla lo suficientemente alto.

Se trata de un algoritmo de investigación profunda que funciona fuera del laboratorio.
No es resumir. No es escribir.
En realidad, se trata de hacer las cosas que odiamos hacer:

  • Presentación de facturas

  • Iniciar sesión en sistemas torpes

  • Subir archivos a través de portales rotos

  • Finalizar la incorporación en aplicaciones que no se conectan

Esto es un verdadero progreso.
Y estamos aquí para ello.

Pero aquí está el motivo por el que realmente estamos prestando atención:
Hace unos días, Google les dio a los editores de sitios web una opción :
Permítanos entrenar nuestro algoritmo de investigación profunda en su contenido... o cancele su suscripción.

¿Y adivina qué?
La mayoría de ellos dijeron que no.
El token de Google cayó... ¡rápidamente!

Ese es el tipo de impacto que tienen estos algoritmos cuando no obtienen acceso.
Ahora dale la vuelta.
La versión de Microsoft ya está en el campo, en movimiento y mejorando, porque la gente la está usando.

Y aquí está la verdad incómoda:
Cuando utilizamos estas herramientas, somos parte de ese entrenamiento.
No estamos diciendo que eso sea bueno o malo.
Decimos: este es el papel que desempeñan los usuarios en la IA en este momento, lo admitamos o no.

Microsoft no introdujo este modelo al azar en Copilot Studio.
Y no creemos que lo hayan entrenado de forma aislada.
¿Si nos equivocamos? Lo sentimos, Microsoft.
Pero no creemos que lo seamos.

Así que no, no tienes por qué estar de acuerdo.
No es necesario que participes.

Pero vamos a seguir señalando lo que nadie más está diciendo:
El progreso proviene de los algoritmos a los que se les permite jugar.
Y este está jugando... duro.

Estamos emocionados.
Porque esto no es otro aumento de productividad.
Esta es una nueva forma de hacer las cosas.
Y estamos observando para ver cómo evoluciona este algoritmo entre todos los proveedores principales.

Share Article

Get stories direct to your inbox

We’ll never share your details. View our Privacy Policy for more info.