Microsoft acaba de lanzar una nueva función en Copilot Studio llamada “Uso de computadora”.
Permite que los agentes de IA realicen acciones en su pantalla, como hacer clic en botones, escribir en campos, desplazarse por páginas web y moverse entre aplicaciones.
Entonces, si su proceso se extiende a través de una serie de sitios web, ventanas emergentes y herramientas que funcionan a medias y no tienen API, Copilot ahora puede manejarlo.
📣 Lo que dice Microsoft
Microsoft describe esto como una actualización que permite a los agentes interactuar con interfaces gráficas de usuario, lo que les permite completar tareas simulando clics del mouse y entradas de teclado.
Dicen que brinda a los agentes la capacidad de “operar en sistemas que carecen de API o integraciones directas”.
En otras palabras: si su software no se comunica con nada, Copilot seguirá haciendo el trabajo.
También señalan que el sistema utiliza un razonamiento profundo para comprender lo que hay en la pantalla y decidir cómo proceder, incluso cuando cambia el diseño.
💬 En palabras humanas
Esto significa que su agente Copilot no necesita que todo sea perfecto.
Puede:
Reconocer páginas de inicio de sesión, incluso si el botón se mueve
Rellene un formulario, incluso si las etiquetas son raras
Complete tareas de varios pasos, incluso cuando surja algo inesperado
¿Por qué?
Porque ha sido entrenado para reconocer patrones y puede decidir qué hacer basándose en lo que ha visto antes.
No memoriza pantallas. Las lee.
Aquí se muestra cómo se compara:
Tarea | Bots de automatización antiguos | Nueva función de Copilot |
Necesita un diseño exacto | ✅ Sí | ❌ No |
Maneja cambios visuales | ❌ Descansos | ✅ Sigue adelante |
Funciona sin API | ❌ No puedo | ✅ Puede |
Entiende patrones | ❌ No | ✅ Sí |
Maneja sorpresas (ventanas emergentes, retrasos) | ❌ Se queda atascado | ✅ Prueba de otra manera |
Esta no es una IA que espera instrucciones claras.
Rueda con el desorden.
🧪 Lo que nadie dice en voz alta: aquí es donde los algoritmos de investigación profunda realmente empiezan a importar
Hasta ahora, los algoritmos de investigación profunda se utilizaban principalmente para crear documentos inteligentes (redactar informes, extraer datos y ayudar con contenido de gran carga de investigación).
Hemos visto a proveedores disfrazarlo con títulos como "IA de nivel académico" o "un chatbot con un título".
Eso sonaba impresionante, pero no demostraba lo que este tipo de algoritmo podía realmente hacer.
Esta actualización cambia eso.
Porque esta vez no se está utilizando para escribir sobre algo, se está utilizando para hacer algo.
Hace clic
Escribe
Navega por sistemas sin instrucciones.
Funciona incluso cuando el diseño es diferente cada vez.
Esto es posible porque este algoritmo funciona a partir de patrones, no de comandos estrictos.
No es un chat de nivel superior.
Es navegación.
Es acción digital.
Los robots antiguos necesitaban etiquetas perfectas y pantallas con píxeles perfectos.
Este no lo hace
Ese es el verdadero impacto.
Qué hace | Uso de algoritmos profundos en documentos y chats | El nuevo uso de Microsoft en Copilot Studio |
Escribir o resumir el contenido de la investigación | ✅ Sí | ❌ No |
Navegar por sitios web y aplicaciones | ❌ No | ✅ Sí |
Trabajar sin datos estructurados (API) | ❌ No está diseñado para ello | ✅ Lo maneja |
Adaptarse a los cambios de pantalla | ❌ No relevante | ✅ Capacidad central |
Actuar sobre la información en tiempo real | ❌ No puedo | ✅ ¿Lo hace? |
Aquí es donde vemos un cambio real, porque finalmente se está haciendo el trabajo, no solo describiéndolo.
En resumen
Costo: Incluido en Microsoft Copilot Studio
Disponibilidad: Disponible ahora
Leer más.
Si su flujo de trabajo diario incluye software feo, portales extraños y momentos de "¿por qué está ese botón ahí?", Copilot finalmente podría ayudarlo.
🧊 Perspectiva del equipo Frozen Light
Todo el mundo está ocupado hablando de la función.
Sí, es útil.
Sí, hace clic en botones y envía facturas.
Pero estamos analizando el algoritmo, porque esa es la parte de la que nadie habla lo suficientemente alto.
Se trata de un algoritmo de investigación profunda que funciona fuera del laboratorio.
No es resumir. No es escribir.
En realidad, se trata de hacer las cosas que odiamos hacer:
Presentación de facturas
Iniciar sesión en sistemas torpes
Subir archivos a través de portales rotos
Finalizar la incorporación en aplicaciones que no se conectan
Esto es un verdadero progreso.
Y estamos aquí para ello.
Pero aquí está el motivo por el que realmente estamos prestando atención:
Hace unos días, Google les dio a los editores de sitios web una opción :
Permítanos entrenar nuestro algoritmo de investigación profunda en su contenido... o cancele su suscripción.
¿Y adivina qué?
La mayoría de ellos dijeron que no.
El token de Google cayó... ¡rápidamente!
Ese es el tipo de impacto que tienen estos algoritmos cuando no obtienen acceso.
Ahora dale la vuelta.
La versión de Microsoft ya está en el campo, en movimiento y mejorando, porque la gente la está usando.
Y aquí está la verdad incómoda:
Cuando utilizamos estas herramientas, somos parte de ese entrenamiento.
No estamos diciendo que eso sea bueno o malo.
Decimos: este es el papel que desempeñan los usuarios en la IA en este momento, lo admitamos o no.
Microsoft no introdujo este modelo al azar en Copilot Studio.
Y no creemos que lo hayan entrenado de forma aislada.
¿Si nos equivocamos? Lo sentimos, Microsoft.
Pero no creemos que lo seamos.
Así que no, no tienes por qué estar de acuerdo.
No es necesario que participes.
Pero vamos a seguir señalando lo que nadie más está diciendo:
El progreso proviene de los algoritmos a los que se les permite jugar.
Y este está jugando... duro.
Estamos emocionados.
Porque esto no es otro aumento de productividad.
Esta es una nueva forma de hacer las cosas.
Y estamos observando para ver cómo evoluciona este algoritmo entre todos los proveedores principales.