Publicado 20/05/2025 15:46

Google avanza hacia el asistente universal de Proyecto Astra de la mano de Gemini 2.5

Asistente universal con Gemini
Asistente universal con Gemini - GOOGLE

   MADRID, 20 May. (Portaltic/EP) -

   Google ha ampliado las capacidades de su modelo más avanzado hasta la fecha, Gemini 2.5, que se ha actualizado con nuevos modelos que buscan cubrir las necesidades de los desarrolladores, y capacidades extraídas directamente del su proyecto de asistente universal.

    Google ha celebrado este martes su eventual anual de desarrolladores, donde ha compartido las novedades en inteligencia artificial, atendiendo a la actualización de Gemini 2.5 y los avances en sus principales proyectos: Astra, Starline y Marine.

    Gemin 2.5 es actualmente el modelo más avanzado de Google, que lidera en todas las categorías de LMArena y ocupa el primer lugar de WebDevArena, como ha destacado el director ejecutivo de Google, Sundar Pichai durante su intervención.

    Este modelo se ha ampliado con dos versiones: Gemini 2.5 Pro, desarrollado para tareas más complejas y Gemini 2.5 Flash, más eficiente. El primero, además, ofrecerá un modo de pensamiento profundo, con el que tendrá en cuenta distintas hipótesis antes de dar una respuesta.

    Gemini 2.5 Flash, por su parte, ofrece un buen rendimiento a un precio más asequible, con mejoras en razonamiento, programación y longitud de contexto. Estará disponible en julio en vista previa en AI Studio, Vertex y Gemini API.

    Y para que los desarrolladores puedan tener un mayor control sobre los tokens que utilizan, Google ha anunciado Thinking Budgets en Gemin 2.5 Pro. En este modelo, y también en 2.5 Flash, ha anunciado la función experimental Thoughts, que desglosará el proceso de razonamiento de los modelos.

    La compañía también ha mejorado Gemini 2.5 con nuevas capacidades, como 'Native audio output', que introduce el soporte para dos voces, con la posibilidad de cambiar de una a otra, para acceder a tonos diferentes e idiomas distintos.

    Asimismo, ha anunciado los nuevos modelos Gemini Diffusion, para explorar la técnica de la difusión en nuevos modelos de lenguaje que permitan a los usuarios tener más control y creatividad y agilice la generación de texto. A ello se une los llamados World models, modelos que simulan el mundo real a partir de una comprensión profunda de la física de su física para avanzar en robótica.

EL FUTURO DE LA INTERACCIÓN CON LA IA

   Google ha compartido los avances en los tres proyectos con los que busca moldear la interacción con inteligencia artificial. Uno de ellos es Proyecto Starline, una plataforma de videocomunicación que pretende transmitir la sensación de estar físicamente junto a la persona con la se está hablando a través de una pantalla.

    Google Beam es la nueva solución que busca romper las barreras de la comunicación transformando retransmisiones en dos dimensiones en retransmisiones en tres dimensiones, más realistas, con ayuda de un sistema de seis cámaras ubicado estratégicamente a lo largo de toda la pantalla.

    Ademas, la tecnología de traducción en tiempo real de Starline llegará a Google Meet, primero en inglés y español para los suscriptores, con la intención de ampliar los idiomas disponibles.

    En lo que respecta a Astra, el proyecto de crear un asiste de inteligencia artificial universal, la compañía ha destacado las capacidades de Gemini Live, extraidas directamente de esa iniciativa, que utiliza la cámara del móvil para que la IA vea lo que ve el usuario pueda ofrecer información en tiempo real. Esta función está ya disponible para todos los usuarios de Android e iOS.

    Proyecto Mariner, por su parte, introduce un agente con capacidad para navegar por la web y realizar acciones en lugar del usuario. Como novedad, soporta la multitarea, con capacidad para realizar hasta diez acciones de manera simultanea.

    Google también facilitará la comunicación entre agentes con Gemini SDK, que es compatible con las heramientas MCP. A ello se une la llegada del modo agente a la 'app' de Gemini, para que el asistente realice tareas por el usuario, como buscar un apartamento.

    Para los agentes, la personalización es muy importante. Al respecto, Google ha destacado la función de contexto personal, que permite que la IA recopile información del usuario de las aplicaciones propias de la marca. Una novedad son las 'Respuestas inteligentes personalizadas' de Gmail, con las que Gemini capta el tono y el estilo del usuario en sus respuestas.

IMÁGENES Y VÍDEOS DE MEJORAR CALIDAD

   Google también ha actualizado su modelo de generación de imágenes. Imagen 4, que ofrece imágenes más ricas con colores más vivos y más detalles, con atención a los contrates de luz y sombra.

    La herramienta de generacion de vídeo Veo 3, por su parte, mejora la calidad de la imagen del vídeo con un mejor control de las físicas del mundo, e introduce la introducción de generación de audio, para generar efectos de sonidos, de fondo y diálogo.

Contador