Google compartió un video en sus plataformas de redes sociales el lunes, provocando las nuevas capacidades de su chatbot Gemini impulsado por inteligencia artificial (IA). El vídeo fue lanzado apenas un día antes del evento anual Google I/O centrado en desarrolladores de la compañía. Se cree que el gigante tecnológico está haciendo varios anuncios sobre la IA y revelando nuevas funciones y posiblemente nuevos modelos de IA. Además, lo más probable es que el protagonismo lo acaparen Android 15 y Wear OS 5, que podrían presentarse en el evento.

En un breve vídeo publicado en X (anteriormente conocido como Twitter), la cuenta oficial de Google demostró las nuevas capacidades de su chatbot interno de IA. El vídeo de 50 segundos destaca una marcada mejora en su discurso, dándole a Géminis una voz más emocional y una modulación que lo hace parecer más humano. Además, el vídeo destaca las nuevas capacidades de visión por computadora. La IA puede capturar imágenes en la pantalla y analizarlas.

Gemini también puede acceder a las cámaras de los teléfonos inteligentes, una capacidad que no tiene actualmente. El usuario mueve la cámara por el espacio y le pide a la IA que describa lo que ve. Casi sin demoras, el chatbot puede describir la configuración como una etapa y, cuando se le solicita, puede incluso reconocer el logotipo de Google I/O y compartir información sobre él.

El video no proporciona más detalles sobre la IA y, en cambio, pide a las personas que vean el evento para obtener más información. Hay varias preguntas que pueden responderse durante el evento, como si Google está utilizando un nuevo modelo de lenguaje grande (LLM) para visión por computadora o una versión actualizada de Gemini 1.5 Pro. Además, Google también puede revelar qué más puede hacer la IA con su visión por computadora. En particular, hay rumores de que el gigante tecnológico podría presentar Gem, que se cree que es un agente de chatbot que puede diseñarse para tareas específicas, similar al GPT de OpenAI.

Si bien se esperaba que el evento de Google presentara nuevas funciones para Gemini, OpenAI celebró su evento Spring Update el lunes y presentó su último modelo de IA GPT-4o que agrega funciones a ChatGPT, similar a un video compartido por Google. Los nuevos modelos de IA le permiten realizar conversaciones, visión por computadora, traducción de idiomas en tiempo real y más.

Fuente