Cargando...
Tecnología

Google I/O 2024: esto se sabe de los Agentes con IA capaces de interactuar con el usuario por video

En el más reciente evento global, el gigante tecnológico presentó sus nuevos avances y los agentes con IA se proponen como los asistentes automatizados más completos que se estrenarán.

Es una de las herramientas más novedosas. Foto: Composición LR / Google
Es una de las herramientas más novedosas. Foto: Composición LR / Google

El pasado 14 de mayo se llevó a cabo el Google I/O 2024, el evento más importante de la firma en el que anuncian cuáles son los proyectos más importantes en los que trabajan. Para esta edición, el gigante de Mountain View centró sus novedades en el desarrollo actual de sus propuestas que se basan en la inteligencia artificial, con Gemini como eje central. ¿Qué se sabe sobre los denominados Agentes con IA? Te contamos todos los detalles a los que tuvimos acceso anticipado.

Una IA cada vez más humana

Google reveló a través de un trailer las mejoras que ofrecen sus denominados Agentes, que son capaces de planificar y ejecutar acciones en respuesta a comentarios específicos que emita el usuario. Como tal, es un tipo de asistente que destaca por interactuar con características notablemente 'humanizadas' e incluso puedes interrumpir la conversación para cambiar de tema y la cámara de tu dispositivo es el medio por el cual dicha tecnología puede describir lo que ve y resolver todo tipo de consultas.

Por ejemplo, serás capa de explicar para qué funciona un código de programación específico que aparece en una pantalla que enfocas, qué sabe del lugar que ves frente a ti (un parque, establecimiento y más) e incluso recordarte dónde dejaste objetos desde que empezó la conversación.

El proyecto 'Astra'

La próxima llegada de los agentes desarrollados por Google, forman parte del proyecto de inteligencia artificial denominado como Astra. De forma puntual, se sabe que dicho sistema automatizado e interactivo se basa en el modelo Gemini y otros específicos de tarea, que pueden procesar mucha información con rapidez, desde la codificación continua de imágenes y la mezcla de voz y video en una sola línea temporal de acontecimientos. Dicha propuesta entiende las indicaciones y el contexto, para emitir respuestas con entonaciones muy naturales que se adaptan al escenario.

“Gemini puede mantener una conversación personalizada e interactiva, mezclando y combinando entradas y salidas. Son sistemas inteligentes que muestran razonamiento, planificación y memoria. Son capaces de pensar varios pasos por delante y trabajar en todos los programas y sistemas o de hacer algo en nombre del usuario y, lo que es más importante, con su supervisión", explica el CEO de Google, Sundar Pichai, a raíz de la humanización en la interacción que busca emular una relación cada vez más orgánica.

“Siempre quisimos construir un agente universal que fuera útil en la vida cotidiana. Por eso hicimos que Gemini fuera multimodal desde el inicio. Ahora estamos procesando un flujo de información sensorial diferente. Estos agentes pueden ver y escuchar mejor lo que hacemos, entienden el contexto y responden rápidamente en la conversación, por lo que el ritmo y la calidad de la interacción es más natural”, precisa Demis Hassabis, director de DeepMid en el evento.

Disponibilidad de los Agentes con IA

La herramienta estará disponible próximamente en la app Live para suscriptores del plan Advanced, a través de la grabación que realices en tiempo real. Se utiliza la cámara de tu teléfono para captar todos los detalles del contexto en el que se sumerge el usuario, para que uno emita preguntas en base a lo que se ve y señala. El sistema revisa en las imágenes y responde exactamente lo que se solicita.

“Gemini es mucho más que un robot de chat, se ha diseñado para ser su asistente personal y más que eso. Las respuestas son personalizadas, se puede elegir entre 10 voces y el sistema se ajusta al patrón de habla del usuario para mantener una conversación real de ida y vuelta con el modelo”, comenta Sissie Hsiao, vicepresidenta de Google y directora general de Gemini.

Lo más visto

Servicio de internet tendrá mantenimiento en zonas de San Juan de Lurigancho y otros 4 distritos de Lima este 9, 10 y 11 de septiembre: ¿en qué horarios?

LEER MÁS

¿Qué pasó con Latinchat? El “Tinder” de las personas que nacieron en los noventa

LEER MÁS

No compartas tu código de verificación de WhatsApp con nadie: pueden robar tu cuenta en segundos

LEER MÁS

Ingeniera crea inteligencia artificial capaz de traducir el lenguaje de señas en tiempo real

LEER MÁS

Ofertas

Lo Más Reciente

Tecnología

¿Qué puede hacer el Go2, el perro robot que promete revolucionar la seguridad en el Perú?

El gigante informático HP reducirá hasta 6.000 empleos y adoptará la IA para aumentar productividad

Resistencia al agua, rayaduras y caídas: así hacen teléfonos extremos de OPPO en fábricas de China

Estados Unidos

Elecciones en Nueva York 2025: Zohran Mamdani gana la alcaldía y triunfo le da un fuerte golpe a la era Trump

El 11S el atentado terrorista con más víctimas de la historia: alrededor de 3.000 afectados y cuestionó la seguridad global

Estos son los 5 mejores destinos del mundo para hacer trekking: están en Estados Unidos, España y Perú

Política

Delia Espinoza se salva de la inhabilitación del Congreso: pacto no logra los votos para sancionarla

RMP tras atentado a Belaunde: “Cuentas vinculadas a RLA dicen que fue falso, como si fueran peritos de CSI”

Harvey Colchado confirma su postulación al Congreso con el partido Ahora Nación

Deportes

Prensa internacional elogia a 'Pol Deportes' tras su debut como narrador en el Alianza Lima vs Sporting Cristal: "Los sueños se cumplen"

Paolo Guerrero responde con sarcásticos gestos tras provocación de hinchas de Sporting Cristal

Real Madrid vs Athletic Bilbao EN VIVO por LaLiga de España: alineaciones confirmadas