Copiar enlace

El laboratorio de investigación sin fines de lucro, Kyutai, ha desarrollado en tan solo seis meses y con un equipo de ocho personas, un modelo de inteligencia artificial (IA) que permite, por primera vez, una comunicación suave, natural y expresiva con una IA. Se llama Moshi, un nombre que hace referencia al saludo en japonés cuando se descuelga una llamada telefónica. Igual que en España se dice “¿Diga?” o “¿Sí?” en Japón se dice “Moshi moshi“.

Este prototipo experimental fue presentado públicamente el 3 de julio en París, donde investigadores, desarrolladores, empresarios, inversores y periodistas pudieron interactuar con ella.

A partir de hoy, la demo interactiva de la IA estará disponible en el sitio web de Kyutai, permitiendo su prueba gratuita en línea, un hito mundial para una IA generativa de voz.

Cómo funciona Moshi

Durante la presentación, el equipo de Kyutai mostró el potencial de Moshi como coach o compañero, y su creatividad al encarnar personajes en juegos de rol o utilizar diferentes voces (incluso puede imitar acentos).

Moshi es compacto y puede instalarse localmente, lo que permite su funcionamiento seguro en un dispositivo sin conexión. Con esto, Kyutai busca contribuir a la investigación abierta en IA y al desarrollo del ecosistema. Este laboratorio fue fundado en 2023 por el Grupo Iliad, CMA CGM y Schmidt Sciences.

Pronto, el código y los pesos de los modelos serán compartidos libremente, es decir, será de código abierto. Esto será útil tanto para investigadores como para desarrolladores de productos y servicios basados en voz, permitiendo el estudio, modificación, extensión o especialización de la tecnología según las necesidades.

En su web, los desarrolladores explican que es un modelo experimental y que todo lo que nos responde “lo deberíamos coger con pinzas”, es decir, no debemos dar nada por sentado. Un consejo habitual a la hora de tratar con inteligencias artificiales, ya que pueden tener algunos errores. Las conversaciones con Moshi están limitadas a 5 minutos. Soporta todos los navegadores, aunque admiten que en Chrome es donde mejor funciona.

Para poder utilizarla y unirte a la lista de espera, debes introducir tu email y permitir que utilice el micrófono de tu dispositivo. De hecho, son varios los usuarios que han publicado sus primeras experiencias con Moshi. De ella destacan su rapidez, aunque aún sus capacidades están limitadas.

Esta nueva inteligencia artificial puede convertirse un game-changer del sector a la hora de generar contenidos para tu negocio y optimizar los procesos del mismo.

Imagen: Kyutai

Mantente informado de las noticias más relevantes en nuestro canal de Telegram