Meta lanza un modelo de IA que puede comprobar el trabajo de otros modelos de IA

19 October 2024

El propietario de Facebook, Meta, dijo el viernes que lanzará una serie de nuevos modelos de inteligencia artificial de su división de investigación, incluido un “evaluador autodidacta” que puede ofrecer un camino hacia la reducción de la participación humana en el proceso de desarrollo de la inteligencia artificial.

El lanzamiento sigue a la introducción de la herramienta por parte de Meta en un artículo de agosto, que detalla cómo se basa en la misma técnica de “cadena de pensamiento” utilizada por el modelo o1 recientemente lanzado de OpenAI para poder hacer juicios confiables sobre la respuesta del modelo.

La técnica implica dividir problemas complejos en pasos lógicos más pequeños y parece mejorar la precisión de las respuestas a problemas desafiantes en materias como ciencias, codificación y matemáticas.

Los metainvestigadores utilizan todos los datos generados por la IA para entrenar el modelo evaluador y también eliminar la aportación humana en esa etapa.

La capacidad de utilizar IA para evaluarla de manera confiable ofrece una idea de un posible camino hacia la construcción de agentes de IA autónomos que puedan aprender de sus propios errores, dijeron a Reuters dos investigadores de Meta detrás del proyecto.

Mucha gente en el campo de la IA imagina agentes como asistentes digitales que sean lo suficientemente inteligentes como para realizar una variedad de tareas sin intervención humana.

Los modelos de evolución automática podrían eliminar la necesidad del proceso, a menudo costoso e ineficiente, que se utiliza hoy en día llamado aprendizaje reforzado a partir de la retroalimentación humana, que requiere aportes de anotadores humanos que deben tener habilidades especializadas para etiquetar datos con precisión y verificar respuestas a preguntas complejas de matemáticas y escritura. Correcto.

“Esperamos que, a medida que la IA se vuelva cada vez más sobrehumana, mejore en la verificación de su trabajo, de modo que sea realmente mejor que el humano promedio”, dijo Jason Weston, uno de los investigadores.

“La idea de ser autodidacta y poder autoevaluarse es esencialmente fundamental para alcanzar niveles sobrehumanos de inteligencia artificial”, afirmó.

Otras empresas, incluidas Google y Anthropic, también han publicado investigaciones sobre el concepto de RLAIF, o aprendizaje reforzado a partir de comentarios de IA. A diferencia de Meta, estas empresas no suelen lanzar sus modelos para uso público.

Otras herramientas de inteligencia artificial lanzadas por Meta el viernes incluyen una actualización del modelo de identificación de imágenes de cualquier segmento de la compañía, una herramienta que acelera los tiempos de generación de respuestas de LLM y un conjunto de datos que puede usarse para ayudar en el descubrimiento de nuevos materiales inorgánicos.

Fuente