Microsoft anuncia modelos de magma que pueden completar la asignación de agentes multimodales

Los investigadores de Microsoft anunciaron el nuevo modelo de Fundación el miércoles pueden hacer funciones de agentes. Magma, modelador de inteligencia artificial (AI) ha sido entrenado en el volumen de datación de datación de datación, imágenes, imágenes, imágenes, así como formato especificado. Tech es un área basada en Bratmond que Magma es una conexión en el idioma de visión (VL) y no solo es posible información multimodal, sino también planificación y actuación. El modo de masas de corona se puede usar en varias tareas que la altura incluye la visión por computadora, la interfaz de Piton) y la giro de manipulas.

Microsoft anuncia modelos de magma

En Github mareaMicrosoft Research se refiere al nuevo modelo de magma. Foundation Oil son diferentes modelos de idiomas (LLM), que consisten en el primero y no en una flota de ningún otro modelo. A menudo se convierten en la base de la clase para otros modelos de esta serie. El magma único en la cereza que el modelo AI está entrenado en algún datoket.

Plerita afirma que el magma de retorno de la arquitectura básica es el modelo AA Llama. Sin embargo, el magma también está equipado con la capacidad de planificar y actuar en el mundo visual-esponual. Esto permite el modelo que no solo se selecciona la naturaleza, como ChatByBot, sino que también realiza la acción.

Se puede usar como un vehículo de visión por computadora que puede ofrecer información sobre el mundo que se muestra cuando los lectores con sensores de cámara. El magma también se puede usar para controlar la herramienta de interfaz de usuario. Pero mayor, también puede controlar el Rodot para una tarea complicada utilizando la capacidad de la agencia.

Los investigadores dicen que la razón principal detrás de la capacidad de una variedad de diversos componentes técnicos y de dos componentes técnicos: la marca y el tron-cena-clac-Of-Sign. Los primeros hacen una acción de acción en la imagen, el video y los datos espaciales al tener un modelo negativo predicto o robot en el espacio de la imagen. Feeds que violan el modelo TemPass y fabrica un marco predefinido antes de necesitar acción. Esto permite que los modelos desarrollen una fuerte comprensión espacial.

Microsoft Research también dividió el puntaje Patchmark del modelo AI basado en pruebas internas. Ha logrado puntajes de la oficina en cada Evpsych of Agent, operando moderación modencial, Aliba y Google. La compañía no ha sido lanzada por magma en un dominio público como ahora.

Fuente

DEJA UNA RESPUESTA

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí