Home Tecnología Google NotebookLM obtiene una función de descripción general de audio que convierte...

Tecnología

Google NotebookLM obtiene una función de descripción general de audio que convierte documentos en debates de audio

6 October 2024

Google NotebookLM recibió una nueva función que puede convertir sus documentos en interesantes debates de audio similares a podcasts. El gigante tecnológico con sede en Mountain View anunció el miércoles una nueva función llamada Audio Overview. Esta función está disponible para todos los usuarios que acepten probar NotebookLM, que todavía está disponible como herramienta experimental. Esta función no es una simple representación de texto a voz, sino que utiliza IA para generar conversaciones completas, incluidos chistes. En particular, la herramienta se introdujo por primera vez en la India y en otras regiones seleccionadas en junio.

Google NotebookLM obtiene la función de descripción general de audio

en un blog correoGoogle detalló la nueva función y destacó que Audio Overview ya se ha implementado. Los miembros del personal de Gadgets 360 pudieron reconocer la función y debería estar disponible para cualquier persona con acceso a la herramienta para tomar notas impulsada por IA.

Esta característica es fácil de usar. Los usuarios primero deben agregar fuentes, que pueden ser archivos PDF, TXT o Markdown, así como texto simple pegado directamente en la plataforma del cuaderno. Una vez agregada la fuente, los usuarios deben hacer clic en el ícono de la Guía del portátil ubicado en la parte inferior. Esto abrirá una interfaz donde se puede ver un resumen del documento, así como instrucciones sugeridas.

En la parte superior derecha, hay una nueva sección para Descripción general de audio. Al tocar Generar, se iniciará el proceso de convertir el contenido en una discusión de audio interesante. El formato incluye presentadores de IA masculinos y femeninos que discuten el tema.

En nuestras pruebas, descubrimos que la conversación era muy similar a la de los humanos, con el anfitrión de IA enfatizando las palabras relevantes, modulando la voz y haciendo pausas para lograr un efecto dramático. Además, los anfitriones de la IA también se interrumpen entre sí para que parezca una conversación real. Se realizan interrupciones para continuar con lo dicho o para contextualizar información adicional. El presentador de AI también bromeó y bromeó. Una vez creados, los archivos de audio también se pueden descargar.

Además, parece que la función utiliza Internet para buscar más información sobre el tema, ya que ocasionalmente vimos resúmenes de audio que contenían más profundidad que el material original. Sin embargo, Google afirma: “Es importante recordar que estas discusiones resultantes no son una visión integral u objetiva de un tema, sino simplemente un reflejo de la fuente que subiste”.

También existen algunas limitaciones para esta función. Google calificó la descripción general de audio como una función experimental y dijo que podría tomar unos minutos generar una sola discusión de audio. Actualmente, la función solo admite inglés, por lo que los usuarios no podrán reproducir audio en otros idiomas. Además, el gigante tecnológico destacó que el host de IA no puede ser manipulado y puede haber imprecisiones.

Fuente