Kyutai Labs lanzó el miércoles Moshi AI, un chatbot de inteligencia artificial (IA) que responde verbalmente en tiempo real. La empresa francesa de inteligencia artificial ha anunciado que todo el modelo de lenguaje de audio de Moshi se desarrolló internamente. El modelo también puede modular la voz para expresar emociones y responder en varios estilos de habla. El público puede acceder al modelo de IA de forma gratuita. Actualmente, el modelo de IA limita las conversaciones a cinco minutos. Curiosamente, OpenAI también anunció una función de voz similar con el lanzamiento de GPT-4o, pero aún no se ha lanzado.

Características de la IA de Moshi

Compañía Estados Este modelo de IA se desarrolló en seis meses con un equipo de ocho personas. Al presentar el modelo de IA en un evento en París, Kyutai Labs dijo que Moshi no es un asistente de IA, sino más bien un prototipo que puede usarse para desarrollar herramientas para diversos casos de uso. También han puesto el chatbot a disposición del público. AquíLos usuarios pueden ingresar su correo electrónico y unirse a la cola, pero el personal de Gadgets 360 puede obtener acceso directo a la plataforma sin tiempo de espera.

La interfaz de esta plataforma es bastante minimalista. Existe un diseño de IA simplificado donde los usuarios pueden comprobar el nivel de volumen de su voz mientras hablan. Hay un cuadro de texto donde solo aparece la respuesta de la IA. Otros cuadros cerca de la parte superior muestran detalles técnicos como la duración del audio, la latencia y el retraso del audio.

En la parte superior hay un botón para finalizar la llamada. Actualmente, la duración máxima de la llamada es de cinco minutos. La página de descripción destaca que Moshi puede pensar, hablar y escuchar al mismo tiempo para maximizar el flujo de la conversación.

Gadgets 360 descubrió que la latencia era muy baja y la IA a menudo respondía instantáneamente. Sin embargo, hay algunos casos en los que el tiempo de respuesta puede exceder los 10 a 15 segundos. Sin embargo, esto puede deberse a una gran carga del servidor. Sin embargo, a veces las órdenes verbales no se registraban en absoluto, incluso después de llenar las tres cuartas partes del medidor de volumen.

Interfaz de IA de Moshi
Crédito de la foto: Laboratorios Kyutai

Gadgets 360 también descubrió que el modelo de IA puede responder con voces emocionales, hablar en varios estilos y utilizar varias modulaciones de voz. Los modelos de IA también están conectados a Internet y pueden recuperar respuestas a preguntas que requieren una búsqueda en la web. En particular, los chatbots no permiten comandos de texto y la voz es el único medio para interactuar con ellos.

Kyutai Labs ha declarado que el modelo de IA será de código abierto. Sin embargo, la empresa de IA no ha alojado los pesos y el código del modelo en el portal. Una vez que esté disponible, los usuarios podrán descargarlo e instalarlo localmente y ejecutarlo en dispositivos no conectados.

Para conocer las últimas noticias y reseñas sobre tecnología, siga Gadgets 360 en XIndonesio: IndonesiaIndonesio: Qué esIndonesio: Hilo Y noticias de GooglePara ver los últimos vídeos sobre gadgets y tecnología, suscríbete a Canal de YoutubeSi quieres saber todo sobre los top influencers, sigue nuestras cuentas internas Quien es360 en Instagram Y YouTube.

Resplandor de lava Según se informa, utiliza el SoC MediaTek Dimensity 7050



Fuente