Tecnología

Google I/O 2024: esto se sabe de los Agentes con IA capaces de interactuar con el usuario por video

En el más reciente evento global, el gigante tecnológico presentó sus nuevos avances y los agentes con IA se proponen como los asistentes automatizados más completos que se estrenarán.

Es una de las herramientas más novedosas. Foto: Composición LR / Google
Es una de las herramientas más novedosas. Foto: Composición LR / Google

El pasado 14 de mayo se llevó a cabo el Google I/O 2024, el evento más importante de la firma en el que anuncian cuáles son los proyectos más importantes en los que trabajan. Para esta edición, el gigante de Mountain View centró sus novedades en el desarrollo actual de sus propuestas que se basan en la inteligencia artificial, con Gemini como eje central. ¿Qué se sabe sobre los denominados Agentes con IA? Te contamos todos los detalles a los que tuvimos acceso anticipado.

Una IA cada vez más humana

Google reveló a través de un trailer las mejoras que ofrecen sus denominados Agentes, que son capaces de planificar y ejecutar acciones en respuesta a comentarios específicos que emita el usuario. Como tal, es un tipo de asistente que destaca por interactuar con características notablemente 'humanizadas' e incluso puedes interrumpir la conversación para cambiar de tema y la cámara de tu dispositivo es el medio por el cual dicha tecnología puede describir lo que ve y resolver todo tipo de consultas.

TE RECOMENDAMOS

TEMU VS. ALIEXPRESS: ¡AQUÍ ESTÁN LOS MEJORES PRECIOS! | TECHMOOD

Por ejemplo, serás capa de explicar para qué funciona un código de programación específico que aparece en una pantalla que enfocas, qué sabe del lugar que ves frente a ti (un parque, establecimiento y más) e incluso recordarte dónde dejaste objetos desde que empezó la conversación.

El proyecto 'Astra'

La próxima llegada de los agentes desarrollados por Google, forman parte del proyecto de inteligencia artificial denominado como Astra. De forma puntual, se sabe que dicho sistema automatizado e interactivo se basa en el modelo Gemini y otros específicos de tarea, que pueden procesar mucha información con rapidez, desde la codificación continua de imágenes y la mezcla de voz y video en una sola línea temporal de acontecimientos. Dicha propuesta entiende las indicaciones y el contexto, para emitir respuestas con entonaciones muy naturales que se adaptan al escenario.

“Gemini puede mantener una conversación personalizada e interactiva, mezclando y combinando entradas y salidas. Son sistemas inteligentes que muestran razonamiento, planificación y memoria. Son capaces de pensar varios pasos por delante y trabajar en todos los programas y sistemas o de hacer algo en nombre del usuario y, lo que es más importante, con su supervisión", explica el CEO de Google, Sundar Pichai, a raíz de la humanización en la interacción que busca emular una relación cada vez más orgánica.

“Siempre quisimos construir un agente universal que fuera útil en la vida cotidiana. Por eso hicimos que Gemini fuera multimodal desde el inicio. Ahora estamos procesando un flujo de información sensorial diferente. Estos agentes pueden ver y escuchar mejor lo que hacemos, entienden el contexto y responden rápidamente en la conversación, por lo que el ritmo y la calidad de la interacción es más natural”, precisa Demis Hassabis, director de DeepMid en el evento.

Disponibilidad de los Agentes con IA

La herramienta estará disponible próximamente en la app Live para suscriptores del plan Advanced, a través de la grabación que realices en tiempo real. Se utiliza la cámara de tu teléfono para captar todos los detalles del contexto en el que se sumerge el usuario, para que uno emita preguntas en base a lo que se ve y señala. El sistema revisa en las imágenes y responde exactamente lo que se solicita.

“Gemini es mucho más que un robot de chat, se ha diseñado para ser su asistente personal y más que eso. Las respuestas son personalizadas, se puede elegir entre 10 voces y el sistema se ajusta al patrón de habla del usuario para mantener una conversación real de ida y vuelta con el modelo”, comenta Sissie Hsiao, vicepresidenta de Google y directora general de Gemini.

Lo más visto
Lo último
Phillip Chu Joy y el éxito de sus sorteos: "Casi todos los premios los compro yo"

Phillip Chu Joy y el éxito de sus sorteos: "Casi todos los premios los compro yo"

LEER MÁS
Revisa los candidatos y sus planes de gobierno

Revisa los candidatos y sus planes de gobierno

LEER MÁS

Recetas

Ofertas

Últimas noticias

Rebeca Scribens revela la razón por la que casi rechaza ser parte de 'América Hoy': "Me rehusaba"

Mastergrama: solucionario del lunes 23 de febrero de 2026

Ralentizar el progreso: la operación pictórica de Iosu Aramburu, por Leyla Aboudayeh

Tecnología

Usuarios reportan caída de YouTube: plataforma muestra error en página principal

¡No es tu celular! Usuarios reportan segunda caída de X (Twitter) en menos de 24 horas: ¿qué fallas tiene la red social de Elon Musk?

Especialistas en IA ganan terreno en Perú con sueldos altamente competitivos, según líder de Coursera para Latinoamérica

Estados Unidos

Elecciones en Nueva York 2025: Zohran Mamdani gana la alcaldía y triunfo le da un fuerte golpe a la era Trump

El 11S el atentado terrorista con más víctimas de la historia: alrededor de 3.000 afectados y cuestionó la seguridad global

Estos son los 5 mejores destinos del mundo para hacer trekking: están en Estados Unidos, España y Perú

Política

Balcázar en expectativa por la situación ministerial: visitas al despacho, presión de partidos y ministros que se posicionan

Nuevas rutas del Metro: Línea 8 conectará El Agustino con el Cercado y Línea 9 unirá San Miguel con el Rímac

Pedro Castillo: Fiscalía busca ampliar prisión por 12 meses contra expresidente por caso organización criminal