Microsoft lanza Fara 7B, un modelo de IA capaz de controlar tu ratón y teclado para realizar por ti las tareas más aburridas
por Edgar OteroMicrosoft ha dado un paso muy relevante más allá de los chatbots conversacionales con la presentación de Fara-7B. No se trata de una herramienta diseñada para generar texto o responder preguntas, sino de un Modelo de Lenguaje Pequeño (SLM) creado específicamente para tomar el control físico de la interfaz del ordenador. Su función principal es actuar como un agente autónomo, parecido a OK Computer de Kimi o Computer Use de Google, que maneja el ratón y el teclado para completar tareas en nombre del usuario.
Lo que diferencia a esta tecnología es su forma de trabajar. Fara-7B analiza la pantalla mediante capturas, "viendo" la página web o la aplicación tal y como lo haría un ojo humano, sin depender de códigos de accesibilidad ocultos. El sistema predice coordenadas para hacer clic, desplazarse o escribir texto. Al contar con solo 7.000 millones de parámetros, el modelo es lo suficientemente ligero como para ejecutarse directamente en el dispositivo, lo que reduce la latencia y asegura que los datos del usuario permanezcan en local, mejorando la privacidad.
Un rendimiento eficiente diseñado para la automatización web
A pesar de su tamaño compacto, las pruebas de rendimiento indican que Fara-7B es altamente competitivo. Según los datos técnicos revelados, el modelo ha logrado superar en benchmarks específicos a sistemas mucho más grandes, incluido GPT-4o, cuando se trata de navegar por interfaces. El entrenamiento se ha realizado utilizando un flujo de datos sintéticos que imitan interacciones humanas reales, permitiendo a la IA aprender a realizar acciones complejas como reservar viajes, rellenar formularios o comparar precios entre diferentes tiendas online.
No obstante, Microsoft subraya que se trata de un lanzamiento experimental destinado a la investigación y el desarrollo. Conscientes de los riesgos de una IA que controla el PC, los desarrolladores han implementado un sistema de seguridad basado en "Puntos Críticos". Esta función detiene automáticamente la ejecución y solicita el consentimiento explícito del usuario antes de realizar cualquier acción sensible o irreversible, como enviar un correo o confirmar una compra.
Actualmente, Fara-7B está disponible bajo una licencia abierta MIT en plataformas como Hugging Face y Microsoft Foundry. Además, la compañía ha facilitado una versión optimizada para los nuevos Copilot+ PCs con Windows 11, permitiendo a la comunidad tecnológica empezar a experimentar con la creación de agentes capaces de automatizar la rutina digital diaria. Ahora bien, está por ver hasta qué punto su implementación en escenarios reales puede considerarse un éxito real.
Fin del Artículo. ¡Cuéntanos algo en los Comentarios!



