Cargando...
Tecnología

Google I/O 2024: esto se sabe de los Agentes con IA capaces de interactuar con el usuario por video

En el más reciente evento global, el gigante tecnológico presentó sus nuevos avances y los agentes con IA se proponen como los asistentes automatizados más completos que se estrenarán.

Es una de las herramientas más novedosas. Foto: Composición LR / Google
Es una de las herramientas más novedosas. Foto: Composición LR / Google

El pasado 14 de mayo se llevó a cabo el Google I/O 2024, el evento más importante de la firma en el que anuncian cuáles son los proyectos más importantes en los que trabajan. Para esta edición, el gigante de Mountain View centró sus novedades en el desarrollo actual de sus propuestas que se basan en la inteligencia artificial, con Gemini como eje central. ¿Qué se sabe sobre los denominados Agentes con IA? Te contamos todos los detalles a los que tuvimos acceso anticipado.

Una IA cada vez más humana

Google reveló a través de un trailer las mejoras que ofrecen sus denominados Agentes, que son capaces de planificar y ejecutar acciones en respuesta a comentarios específicos que emita el usuario. Como tal, es un tipo de asistente que destaca por interactuar con características notablemente 'humanizadas' e incluso puedes interrumpir la conversación para cambiar de tema y la cámara de tu dispositivo es el medio por el cual dicha tecnología puede describir lo que ve y resolver todo tipo de consultas.

Por ejemplo, serás capa de explicar para qué funciona un código de programación específico que aparece en una pantalla que enfocas, qué sabe del lugar que ves frente a ti (un parque, establecimiento y más) e incluso recordarte dónde dejaste objetos desde que empezó la conversación.

El proyecto 'Astra'

La próxima llegada de los agentes desarrollados por Google, forman parte del proyecto de inteligencia artificial denominado como Astra. De forma puntual, se sabe que dicho sistema automatizado e interactivo se basa en el modelo Gemini y otros específicos de tarea, que pueden procesar mucha información con rapidez, desde la codificación continua de imágenes y la mezcla de voz y video en una sola línea temporal de acontecimientos. Dicha propuesta entiende las indicaciones y el contexto, para emitir respuestas con entonaciones muy naturales que se adaptan al escenario.

“Gemini puede mantener una conversación personalizada e interactiva, mezclando y combinando entradas y salidas. Son sistemas inteligentes que muestran razonamiento, planificación y memoria. Son capaces de pensar varios pasos por delante y trabajar en todos los programas y sistemas o de hacer algo en nombre del usuario y, lo que es más importante, con su supervisión", explica el CEO de Google, Sundar Pichai, a raíz de la humanización en la interacción que busca emular una relación cada vez más orgánica.

“Siempre quisimos construir un agente universal que fuera útil en la vida cotidiana. Por eso hicimos que Gemini fuera multimodal desde el inicio. Ahora estamos procesando un flujo de información sensorial diferente. Estos agentes pueden ver y escuchar mejor lo que hacemos, entienden el contexto y responden rápidamente en la conversación, por lo que el ritmo y la calidad de la interacción es más natural”, precisa Demis Hassabis, director de DeepMid en el evento.

Disponibilidad de los Agentes con IA

La herramienta estará disponible próximamente en la app Live para suscriptores del plan Advanced, a través de la grabación que realices en tiempo real. Se utiliza la cámara de tu teléfono para captar todos los detalles del contexto en el que se sumerge el usuario, para que uno emita preguntas en base a lo que se ve y señala. El sistema revisa en las imágenes y responde exactamente lo que se solicita.

“Gemini es mucho más que un robot de chat, se ha diseñado para ser su asistente personal y más que eso. Las respuestas son personalizadas, se puede elegir entre 10 voces y el sistema se ajusta al patrón de habla del usuario para mantener una conversación real de ida y vuelta con el modelo”, comenta Sissie Hsiao, vicepresidenta de Google y directora general de Gemini.

Lo más visto

Corea del Sur busca fortalecerse en Sudamérica al firmar acuerdo clave con un país para proyectos de tecnología e innovación

LEER MÁS

El HUAWEI P40 Pro mantiene la temperatura ideal gracias a su sistema de enfriamiento

LEER MÁS

WhatsApp: así puedes recuperar cualquier mensajes de audio que se haya borrado

LEER MÁS

Olvídate de tomar fotos a los documentos: Así podrás activar el 'modo escáner' de tu celular

LEER MÁS

Recetas

Ofertas

Lo Más Reciente

Tecnología

Corea del Sur busca fortalecerse en Sudamérica al firmar acuerdo clave con un país para proyectos de tecnología e innovación

Huawei Mate 80 Pro: prueba real de su cámara, zoom y rendimiento en fotografía

Alu: cómo una idea de vender productos gamer terminó siendo una de las tiendas peruanas de licenciados que más rápido crece

Estados Unidos

Elecciones en Nueva York 2025: Zohran Mamdani gana la alcaldía y triunfo le da un fuerte golpe a la era Trump

El 11S el atentado terrorista con más víctimas de la historia: alrededor de 3.000 afectados y cuestionó la seguridad global

Estos son los 5 mejores destinos del mundo para hacer trekking: están en Estados Unidos, España y Perú

Política

EN VIVO Resultados ONPE al 99.949%: sigue minuto a minuto el conteo entre Keiko Fujimori, Roberto Sánchez y Rafael López Aliaga

Keiko realiza campaña en Piura y Roberto Sánchez no sale de Lima a puertas de oficializarse la segunda vuelta

Harvey Colchado lidera lista de los 10 diputados más votados: obtuvo más de 135 mil votos

Deportes

Natalia Málaga responde sobre su hinchaje por Alianza Lima: "No tengo ninguna vergüenza en decir que simpatizo"

¡Empate al último segundo! Al Nassr igualó 1-1 ante Al Hilal y Cristiano Ronaldo deberá esperar para ser campeón de la Liga Pro Saudí 2026

Barcelona estrena su título con una derrota: los culés cayeron 1-0 en su visita a Alavés por LaLiga