Cargando...
Tecnología

Google I/O 2024: esto se sabe de los Agentes con IA capaces de interactuar con el usuario por video

En el más reciente evento global, el gigante tecnológico presentó sus nuevos avances y los agentes con IA se proponen como los asistentes automatizados más completos que se estrenarán.

Es una de las herramientas más novedosas. Foto: Composición LR / Google
Es una de las herramientas más novedosas. Foto: Composición LR / Google

El pasado 14 de mayo se llevó a cabo el Google I/O 2024, el evento más importante de la firma en el que anuncian cuáles son los proyectos más importantes en los que trabajan. Para esta edición, el gigante de Mountain View centró sus novedades en el desarrollo actual de sus propuestas que se basan en la inteligencia artificial, con Gemini como eje central. ¿Qué se sabe sobre los denominados Agentes con IA? Te contamos todos los detalles a los que tuvimos acceso anticipado.

Una IA cada vez más humana

Google reveló a través de un trailer las mejoras que ofrecen sus denominados Agentes, que son capaces de planificar y ejecutar acciones en respuesta a comentarios específicos que emita el usuario. Como tal, es un tipo de asistente que destaca por interactuar con características notablemente 'humanizadas' e incluso puedes interrumpir la conversación para cambiar de tema y la cámara de tu dispositivo es el medio por el cual dicha tecnología puede describir lo que ve y resolver todo tipo de consultas.

Por ejemplo, serás capa de explicar para qué funciona un código de programación específico que aparece en una pantalla que enfocas, qué sabe del lugar que ves frente a ti (un parque, establecimiento y más) e incluso recordarte dónde dejaste objetos desde que empezó la conversación.

El proyecto 'Astra'

La próxima llegada de los agentes desarrollados por Google, forman parte del proyecto de inteligencia artificial denominado como Astra. De forma puntual, se sabe que dicho sistema automatizado e interactivo se basa en el modelo Gemini y otros específicos de tarea, que pueden procesar mucha información con rapidez, desde la codificación continua de imágenes y la mezcla de voz y video en una sola línea temporal de acontecimientos. Dicha propuesta entiende las indicaciones y el contexto, para emitir respuestas con entonaciones muy naturales que se adaptan al escenario.

“Gemini puede mantener una conversación personalizada e interactiva, mezclando y combinando entradas y salidas. Son sistemas inteligentes que muestran razonamiento, planificación y memoria. Son capaces de pensar varios pasos por delante y trabajar en todos los programas y sistemas o de hacer algo en nombre del usuario y, lo que es más importante, con su supervisión", explica el CEO de Google, Sundar Pichai, a raíz de la humanización en la interacción que busca emular una relación cada vez más orgánica.

“Siempre quisimos construir un agente universal que fuera útil en la vida cotidiana. Por eso hicimos que Gemini fuera multimodal desde el inicio. Ahora estamos procesando un flujo de información sensorial diferente. Estos agentes pueden ver y escuchar mejor lo que hacemos, entienden el contexto y responden rápidamente en la conversación, por lo que el ritmo y la calidad de la interacción es más natural”, precisa Demis Hassabis, director de DeepMid en el evento.

Disponibilidad de los Agentes con IA

La herramienta estará disponible próximamente en la app Live para suscriptores del plan Advanced, a través de la grabación que realices en tiempo real. Se utiliza la cámara de tu teléfono para captar todos los detalles del contexto en el que se sumerge el usuario, para que uno emita preguntas en base a lo que se ve y señala. El sistema revisa en las imágenes y responde exactamente lo que se solicita.

“Gemini es mucho más que un robot de chat, se ha diseñado para ser su asistente personal y más que eso. Las respuestas son personalizadas, se puede elegir entre 10 voces y el sistema se ajusta al patrón de habla del usuario para mantener una conversación real de ida y vuelta con el modelo”, comenta Sissie Hsiao, vicepresidenta de Google y directora general de Gemini.

Lo más visto

¿Piensas comprar un celular usado o de segunda? Esto es lo que deberías revisar antes de hacerlo

LEER MÁS

Qué es X TV y cómo descargar gratis la nueva app de Elon Musk que planea superar a Netflix en Estados Unidos

LEER MÁS

¿Qué pasó con Wawa, la primera laptop peruana que apostó por el desarrollo sostenible?: fue diseñada a base de cartón

LEER MÁS

La batería de mi smartphone se ha hinchado: ¿por qué sucede esto y qué tan peligroso es?

LEER MÁS

Recetas

Ofertas

Lo Más Reciente

Tecnología

ChatGPT enfrenta un aumento en las desinstalaciones tras firmar acuerdo con el Pentágono. ¿a qué se debe esta decisión de los usuarios?

Facebook presenta caída global: usuarios reportan problemas al publicar en la plataforma de Mark Zuckerberg

Usuarios reportan caída de YouTube: plataforma muestra error en página principal

Estados Unidos

Elecciones en Nueva York 2025: Zohran Mamdani gana la alcaldía y triunfo le da un fuerte golpe a la era Trump

El 11S el atentado terrorista con más víctimas de la historia: alrededor de 3.000 afectados y cuestionó la seguridad global

Estos son los 5 mejores destinos del mundo para hacer trekking: están en Estados Unidos, España y Perú

Política

CAL: suspenden proceso electoral y retrasan designación de representante de los abogados ante el JNE

César Acuña y José Luna: magnates de la educación debatirán sobre el sector en la última fecha del debate presidencial

Comisión de Ética aprueba iniciar investigación contra congresista Milagros Jáuregui por exponer a menores

Deportes

Atlético Nacional vs Millonarios EN VIVO por Copa Sudamericana 2026 vía ESPN: Contreras anota el 1-0

Miguel Trauco y Carlos Zambrano ficharían por Sport Boys, pero deberían aceptar "condiciones que protejan al club"

Partidos de la Copa Sudamericana 2026: programación y resultados de la primera ronda del torneo