Microsoft ha vuelto a mover ficha en el campo de la inteligencia artificial con el estreno de una actualización que promete transformar la forma en que usamos nuestros dispositivos móviles. Estamos hablando de Copilot Vision, una función integrada dentro de la aplicación Copilot que ahora llega oficialmente a los sistemas Android e iOS, y que introduce una serie de capacidades visuales que convierten al móvil en un auténtico asistente inteligente de bolsillo.
Esta nueva propuesta busca ampliar los límites de lo que puede hacer una IA en el día a día, permitiendo algo que hasta hace poco parecía ciencia ficción: entender imágenes, leer documentos con la cámara del teléfono y hasta generar recomendaciones personalizadas basadas en lo que el usuario ve en tiempo real. A continuación, te contamos todo lo que necesitas saber sobre esta jugada clave de Microsoft en su carrera por liderar la revolución de la IA móvil.
Copilot Vision: la inteligencia visual llega al móvil
Copilot Vision forma parte del ecosistema de herramientas de IA que Microsoft ha estado desarrollando desde hace tiempo junto a OpenAI. Su lanzamiento oficial como parte de las apps móviles de Copilot permite que los usuarios de Android y iPhone puedan sacar partido a una nueva dimensión de utilidad en su día a día, sobre todo a medida que se busca saber qué dispositivos se pueden usar con Microsoft Copilot.
A través de la cámara del dispositivo o mediante imágenes ya guardadas, Copilot Vision es capaz de analizar visualmente documentos, fotos, esquemas, objetos e incluso escenarios completos para ofrecer respuestas o generar contenido relacionado de forma instantánea. Por ejemplo, uno puede tomar una foto de una hoja de cálculo impresa y pedir a Copilot que la resuma, o bien utilizarlo para identificar una planta, escanear el menú de un restaurante o generar consejos decorativos tras analizar una habitación.
Funciones destacadas de Copilot Vision en Android e iOS
La apuesta de Microsoft con Copilot Vision va mucho más allá de un asistente de texto mejorado. Se trata de una herramienta que aprovecha todo el potencial visual del dispositivo para ofrecer una experiencia más intuitiva, visual y adaptada a las necesidades cotidianas. Estas son algunas de sus funcionalidades clave:
- Reconocimiento de imágenes y OCR: puede leer documentos impresos o escaneados y extraer su contenido textual para procesarlo, resumirlo o traducirlo.
- Recomendaciones visuales: al apuntar con la cámara a un espacio o un objeto, Copilot puede ofrecer sugerencias personalizadas. Por ejemplo, decoración para una habitación, consejos de jardinería o encontrar productos similares online.
- Integración con Office: Copilot Vision no trabaja solo. Se conecta con otros servicios de Microsoft como Word, Excel, Outlook o Teams, lo que permite una interacción fluida entre apps y funcionalidades.
- Compatibilidad completa con dispositivos móviles: la herramienta ya está disponible para descargar gratuitamente desde las tiendas de aplicaciones oficiales, tanto en Android como en iPhone. Algunas funciones podrían estar reservadas a usuarios con suscripción Microsoft 365 Pro en el futuro, aunque no hay confirmación oficial.
Copilot más allá de Vision: novedades generales en la IA de Microsoft
Además de Copilot Vision, Microsoft ha anunciado una batería de nuevas funciones que siguen empujando sus capacidades de IA hacia el futuro. Algunas de ellas no están estrictamente relacionadas con el apartado visual, pero sí representan una evolución significativa en la experiencia con inteligencia artificial.
Entre las novedades más destacadas están:
- Memoria personalizada: Copilot ahora es capaz de recordar las preferencias del usuario, como su edad, aficiones o ubicación, para responder de forma más contextualizada. El usuario mantiene en todo momento el control sobre lo que la IA retiene.
- Acciones automáticas: la IA puede realizar tareas por el usuario, como comprar entradas, hacer reservas o interactuar directamente con sitios web compatibles. Por el momento, esta función está en pruebas en Estados Unidos.
- Copilot Search: incorpora tecnología de búsqueda mejorada en combinación con Bing, capaz de citar las fuentes de donde obtiene la información, ofreciendo así una mayor transparencia. Esto alinea a Copilot con lo que ya hacen sistemas como Perplexity o el nuevo ChatGPT.
- Deep Research: permite llevar a cabo estudios complejos y en múltiples pasos, analizando información desde fuentes online, documentos extensos o imágenes.
- Pages y organización de ideas: una especie de lienzo digital donde el usuario puede ir estructurando contenido, ideas y objetivos de trabajo con ayuda de Copilot.
- Podcasts personalizados: crea contenido de audio adaptado a los gustos del usuario para facilitar el consumo de información en este formato.
- Personal Shopper: Copilot puede informarte sobre ofertas y bajadas de precio, actuar como asistente de compras, e incluso ayudarte a buscar productos de forma más precisa.
Copilot Vision en PC con Windows 11
Además de su presencia en móviles, Microsoft quiere llevar esta visión interactiva también al escritorio. Se ha confirmado que Copilot Vision se encontrará disponible próximamente en PCs con Windows 11, con acceso inicial para los usuarios del programa Windows Insider.
La activación será muy sencilla: con solo pulsar Alt + espacio o utilizar comandos de voz, Copilot se activará y podrá ‘ver’ todo lo que ocurre en pantalla, incluyendo ventanas de navegador, imágenes, documentos o cualquier otro contenido visual. Esto abre un abanico de posibilidades, desde la ayuda para tareas de diseño hasta accesibilidad para personas con necesidades especiales.
Copilot Vision en versión preliminar para navegar con IA
Otra aplicación interesante de Copilot Vision es en el propio navegador. A través de Microsoft Edge y con acceso desde Copilot Labs, algunos usuarios han comenzado a probar una versión preliminar donde la IA actúa como acompañante durante la navegación web.
Con el permiso del usuario, Copilot puede escanear la página actual, comprender el texto que se está viendo y mantener conversaciones basadas en lo que ocurre en pantalla. Esta función permite, por ejemplo, que Copilot ayude a planificar una visita cultural, identificar ofertas o hacer más accesible la lectura de ciertos contenidos web.
Esta funcionalidad ha sido diseñada con mucho cuidado en términos de privacidad y ética. El uso de Vision es completamente opcional y todos los datos se eliminan una vez que la sesión ha finalizado. Microsoft asegura que no se utiliza ningún contenido de los editores para entrenar modelos de IA, y que la privacidad del usuario es una prioridad absoluta.
Aplicación Microsoft 365 Copilot para Android
Dentro del ecosistema móvil de Microsoft, también destaca la aplicación Microsoft 365 Copilot para Android, que ofrece funcionalidades de productividad avanzada. Este servicio permite crear, editar y guardar documentos directamente en la nube al iniciar sesión con una cuenta profesional, educativa o personal de Microsoft.
Algunas de las funcionalidades premium requieren una suscripción activa a Microsoft 365, aunque la mayoría de usos básicos son gratuitos. La app también ofrece compatibilidad con Microsoft Lens, una herramienta de escaneo inteligente que puede convertir imágenes en texto mediante reconocimiento óptico de caracteres (OCR).
Actualmente, la aplicación funciona en teléfonos Android y de forma limitada en tabletas, aunque Microsoft ha confirmado que la compatibilidad completa con todos los tamaños de pantalla llegará en futuras actualizaciones. También se ha cuidado mucho el apartado de ayuda y soporte, ofreciendo múltiples formas de enviar comentarios y sugerencias desde la propia app.
Designer: otra apuesta visual de Microsoft
Si hablamos de IA visual en el ecosistema de Microsoft, no podemos dejar de mencionar Designer, una potente app de diseño gráfico impulsada por inteligencia artificial que ahora también está disponible en Android e iOS.
Gracias a su integración con Copilot, permite a los usuarios crear imágenes, collages, tarjetas y contenido visual describiéndolos con texto. Incluso se pueden generar stickers, emojis, fondos de pantalla y monogramas personalizados. Esta herramienta también está disponible en Word y PowerPoint, facilitando la creación de recursos visuales sin salir de los documentos.
Entre las funciones destacadas se incluyen:
- Transformar imágenes automáticamente con la opción «Restyle image».
- Añadir marcos personalizados o generar collages directamente desde la app.
- Crear tarjetas, avatares e incluso reemplazar fondos en una foto mediante IA.
Todo esto permite que Microsoft refuerce su ecosistema Copilot con múltiples herramientas visuales, intuitivas y accesibles desde cualquier plataforma. Microsoft está dando un paso importante en su estrategia de IA, no solo llevando inteligencia artificial al texto escrito, sino también al terreno visual. Con el despliegue de Copilot Vision en móviles, PCs y navegadores, junto con herramientas como Designer o Microsoft 365 Copilot, la compañía apuesta por una experiencia más completa y envolvente.
El usuario gana en accesibilidad, personalización y productividad, mientras que Microsoft se consolida como un actor clave en el panorama de la IA aplicada al día a día. El futuro ya no se limita a textos: también se ve y se entiende desde el bolsillo de tu móvil. Comparte esta guía y ayuda a que más usuarios conozcan Copilot Vision para Android.