Google comparte el desarrollo de funciones de IA generativa en dispositivos Android

Google I/O 2024 destaca las nuevas iniciativas de inteligencia artificial (IA) adoptadas por la empresa y cómo planea integrarlas en su plataforma Android. Durante una sesión celebrada para desarrolladores, el gigante tecnológico profundizó en el desarrollo de la IA en los dispositivos que los creadores de aplicaciones pronto podrán aprovechar. Actualmente ofrece funciones de IA basadas en servidor, así como funciones de IA en el dispositivo, pero estas funciones son utilizadas principalmente por las aplicaciones internas de Google. En particular, la compañía también anunció la actualización de su servicio Google TalkBack impulsado por Gemini Nano con multimodalidad a finales de este año.

Un video de 19 minutos titulado “IA en el dispositivo Android bajo el capó” se publicó en YouTube en el canal de desarrolladores de Android de Google. La sesión centrada en los desarrolladores comenzó con una discusión sobre los beneficios de mantener el procesamiento de IA localizado dentro del dispositivo y sus limitaciones. Algunas de las ventajas destacadas incluyen procesamiento local, disponibilidad fuera de línea, potencial de latencia reducida y sin costos adicionales. Aquí, los gastos generales se refieren al costo de la computación en la nube.

Aunque no se menciona en el vídeo, la IA en el dispositivo también es algo bueno para los usuarios en términos de privacidad. Cuando la computación se realiza en el dispositivo, los datos que la IA utiliza para generar contenido nunca salen del dispositivo y ni siquiera Google ni los desarrolladores de aplicaciones de terceros pueden acceder a ellos. Sin embargo, todos estos beneficios tienen un costo. El mayor es la capacidad informática limitada de los dispositivos del tamaño de un teléfono inteligente. Aunque se introdujeron nuevos conjuntos de chips con unidades de procesamiento neuronal (NPU) y GPU más potentes, no podían competir con la infraestructura basada en la nube.

Esto significa que las capacidades de las funciones de IA serán limitadas. Destacando lo mismo, Google clasifica las funciones de IA en los dispositivos en tres grupos: Consumir, Crear y Clasificar. El consumo incluye acciones como resumir una página o proporcionar una descripción general del correo electrónico. Crear incluye crear texto y reordenarlo y reescribirlo, mientras que Clasificar incluye análisis de sentimientos y verificar el tono de voz del mensaje. En particular, Google no menciona ninguna función de IA multimodal, probablemente porque actualmente es imposible habilitarlas localmente en el dispositivo.

La sesión también se centró en el Gemini Nano, que parece ser la mejor opción del gigante tecnológico para funciones en dispositivos Android. Si bien también se mencionó a Gemma como una posible alternativa, la mayoría de las funciones de inteligencia artificial en los dispositivos actuales de Google, como Magic Compose en Google Messages, Resumir en Pixel Recorder y las respuestas inteligentes de Gboard, están integradas en el Nano. Además, la compañía también ha confirmado que el servicio Google Talkback también se actualizará a finales de este año y será impulsado por Gemini Nano.

Hasta ahora, la elección de aplicaciones que utilizan IA en dispositivos se limita a las aplicaciones internas de Google. Pero la compañía espera que a través de esta interacción pueda atraer a más desarrolladores para que se involucren.

Fuente