Home Tecnología Google DeepMind utiliza SynthID para marcar con agua el contenido generado por...

Tecnología

Google DeepMind utiliza SynthID para marcar con agua el contenido generado por IA de Gemini y Veo

3 June 2024

Google hizo una gran cantidad de anuncios basados en inteligencia artificial (IA) el martes por la noche durante su sesión magistral de I/O 2024. Estos incluyeron nuevos modelos de IA, mejoras a los modelos base existentes, integración de funciones de IA en los productos de Google y más. El gigante tecnológico también se está centrando en la seguridad de la IA y ampliando el uso de su tecnología nativa de marca de agua para contenido generado por IA, llamada SynthID. El nuevo conjunto de herramientas ahora incorporará marcas de agua para el texto generado por las aplicaciones y clientes web de Gemini, así como para los videos generados por Veo.

SynthID fue el primero inaugurado por Google DeepMind en agosto de 2023 como un proyecto beta destinado a etiquetar correctamente el contenido generado por IA. La necesidad de una solución como esta se siente a medida que cada vez más de estos medios creados sintéticamente se comparten como si fueran reales. Se utiliza para difundir información errónea y delitos cibernéticos como el phishing. El gigante tecnológico utilizó esta tecnología por primera vez en noviembre de 2023, cuando se utilizó para marcar con agua el audio generado por IA creado a través de su modelo Lyria. Este conjunto de herramientas agrega una marca de agua como forma de onda al audio para que sea invisible pero detectable.

Ahora, Google está ampliando el uso de SynthID para incluir la creación de texto y vídeo. Ahora agregará una marca de agua al texto generado mediante aplicaciones y sitios web de Gemini. Para ello, el conjunto de herramientas se centrará en el propio proceso de generación. Cada modelo de IA basado en texto utiliza tokens (que pueden ser palabras, sílabas o frases) para entrenar. El proceso de capacitación también incluye comprender el flujo de estos tokens, o la secuencia de tokens que se deben seguir para producir la respuesta más coherente.

SynthID introduce “información adicional en la distribución del token en el momento de la creación al modular la probabilidad de creación del token”. De esta manera asigna números a palabras específicas en el bloque de texto generado. Cuando detecta si se utilizó IA para generar texto, compara esa puntuación con una puntuación de probabilidad ajustada para determinar si la fuente podría ser un modelo de IA. DeepMind se destaca en un correo que esta técnica es útil cuando la IA produce textos creativos largos porque los modelos de probabilidad examinan más fácilmente cómo se generaron. Sin embargo, para respuestas fácticas más breves, la detección puede no ser tan precisa.

La compañía también está ampliando SynthID con el reciente lanzamiento de video generado por Veo AI. Google dice que esta tecnología incorporará una marca de agua directamente en los píxeles de cada cuadro de video que es invisible para el ojo humano pero que aparecerá cuando se use el sistema de detección.

En los próximos meses, Google planea abrir marcas de agua de texto SynthID de código abierto a través de su kit de herramientas de IA generativa responsable. También publicará un artículo de investigación detallado que explica la tecnología de marca de agua de texto.

Fuente