Tecnología

Google I/O 2024: esto se sabe de los Agentes con IA capaces de interactuar con el usuario por video

En el más reciente evento global, el gigante tecnológico presentó sus nuevos avances y los agentes con IA se proponen como los asistentes automatizados más completos que se estrenarán.

Es una de las herramientas más novedosas. Foto: Composición LR / Google
Es una de las herramientas más novedosas. Foto: Composición LR / Google

El pasado 14 de mayo se llevó a cabo el Google I/O 2024, el evento más importante de la firma en el que anuncian cuáles son los proyectos más importantes en los que trabajan. Para esta edición, el gigante de Mountain View centró sus novedades en el desarrollo actual de sus propuestas que se basan en la inteligencia artificial, con Gemini como eje central. ¿Qué se sabe sobre los denominados Agentes con IA? Te contamos todos los detalles a los que tuvimos acceso anticipado.

Una IA cada vez más humana

Google reveló a través de un trailer las mejoras que ofrecen sus denominados Agentes, que son capaces de planificar y ejecutar acciones en respuesta a comentarios específicos que emita el usuario. Como tal, es un tipo de asistente que destaca por interactuar con características notablemente 'humanizadas' e incluso puedes interrumpir la conversación para cambiar de tema y la cámara de tu dispositivo es el medio por el cual dicha tecnología puede describir lo que ve y resolver todo tipo de consultas.

TE RECOMENDAMOS

TEMU VS. ALIEXPRESS: ¡AQUÍ ESTÁN LOS MEJORES PRECIOS! | TECHMOOD

Por ejemplo, serás capa de explicar para qué funciona un código de programación específico que aparece en una pantalla que enfocas, qué sabe del lugar que ves frente a ti (un parque, establecimiento y más) e incluso recordarte dónde dejaste objetos desde que empezó la conversación.

El proyecto 'Astra'

La próxima llegada de los agentes desarrollados por Google, forman parte del proyecto de inteligencia artificial denominado como Astra. De forma puntual, se sabe que dicho sistema automatizado e interactivo se basa en el modelo Gemini y otros específicos de tarea, que pueden procesar mucha información con rapidez, desde la codificación continua de imágenes y la mezcla de voz y video en una sola línea temporal de acontecimientos. Dicha propuesta entiende las indicaciones y el contexto, para emitir respuestas con entonaciones muy naturales que se adaptan al escenario.

“Gemini puede mantener una conversación personalizada e interactiva, mezclando y combinando entradas y salidas. Son sistemas inteligentes que muestran razonamiento, planificación y memoria. Son capaces de pensar varios pasos por delante y trabajar en todos los programas y sistemas o de hacer algo en nombre del usuario y, lo que es más importante, con su supervisión", explica el CEO de Google, Sundar Pichai, a raíz de la humanización en la interacción que busca emular una relación cada vez más orgánica.

“Siempre quisimos construir un agente universal que fuera útil en la vida cotidiana. Por eso hicimos que Gemini fuera multimodal desde el inicio. Ahora estamos procesando un flujo de información sensorial diferente. Estos agentes pueden ver y escuchar mejor lo que hacemos, entienden el contexto y responden rápidamente en la conversación, por lo que el ritmo y la calidad de la interacción es más natural”, precisa Demis Hassabis, director de DeepMid en el evento.

Disponibilidad de los Agentes con IA

La herramienta estará disponible próximamente en la app Live para suscriptores del plan Advanced, a través de la grabación que realices en tiempo real. Se utiliza la cámara de tu teléfono para captar todos los detalles del contexto en el que se sumerge el usuario, para que uno emita preguntas en base a lo que se ve y señala. El sistema revisa en las imágenes y responde exactamente lo que se solicita.

“Gemini es mucho más que un robot de chat, se ha diseñado para ser su asistente personal y más que eso. Las respuestas son personalizadas, se puede elegir entre 10 voces y el sistema se ajusta al patrón de habla del usuario para mantener una conversación real de ida y vuelta con el modelo”, comenta Sissie Hsiao, vicepresidenta de Google y directora general de Gemini.

Lo más visto
Lo último
YouTube prepara un nuevo plan Premium más económico y podrás pagarlo entre dos personas

YouTube prepara un nuevo plan Premium más económico y podrás pagarlo entre dos personas

LEER MÁS
iPhone: ¿cómo identificar el nombre de una canción sin instalar ninguna app?

iPhone: ¿cómo identificar el nombre de una canción sin instalar ninguna app?

LEER MÁS
¿Aburrido de Ghibli? ChatGPT te permite crear arte gratuito en decenas de estilos

¿Aburrido de Ghibli? ChatGPT te permite crear arte gratuito en decenas de estilos

LEER MÁS
Revisa los candidatos y sus planes de gobierno

Revisa los candidatos y sus planes de gobierno

LEER MÁS

Recetas

Ofertas

Últimas noticias

Concierto Corazón Serrano 2026 EN VIVO HOY: ¡Qué tal Cumbión! hace bailar a miles de personas en el Estadio San Marcos

China apuesta por modernizar el transporte en este país de América Latina y lo abastece con buses de última tecnología

[Latina, En Vivo] ¿A qué hora ver Alianza Lima vs Olva Latino HOY por la Liga Peruana de Vóley?

Tecnología

Usuarios de ChatGPT y OpenAI API reportan problemas debido a una caída global de los servicios

¿Tu router no funciona? Las mejores soluciones para conectarte a internet en casa

Omnicanalidad estratégica: El motor para reducir costos y erradicar el spam en el Perú

Estados Unidos

Elecciones en Nueva York 2025: Zohran Mamdani gana la alcaldía y triunfo le da un fuerte golpe a la era Trump

El 11S el atentado terrorista con más víctimas de la historia: alrededor de 3.000 afectados y cuestionó la seguridad global

Estos son los 5 mejores destinos del mundo para hacer trekking: están en Estados Unidos, España y Perú

Política

Vladimiro Montesinos, en prisión hasta 2037: PJ anuló compurgación de pena

Ollanta Humala: Fiscalía abre investigación contra jueces que sentenciaron al expresidente y Nadine Heredia

Más del 50% de ciudadanos se siente inseguro en transporte público y en restaurantes, según Imasem