Monde Numérique | Actualité Tech & IA podkast

🎤 Gradium : la voix IA en temps réel (Neil Zeghidour, Gradium)

0:00
7:21
Do tyłu o 15 sekund
Do przodu o 15 sekund

Gradium développe des modèles d’intelligence artificielle capables de comprendre, générer et transformer la voix en temps réel. Son cofondateur Neil Zeghidour revient sur une technologie en pleine explosion et ses débouchés concrets.

Interview : Neil Zeghidour, cofondateur de Gradium

Cette interview a été réalisée lors de l’AWS Summit 2026

Punchlines

  • On entraîne des modèles pour retranscrire, générer et traduire la voix.
  • On fournit des briques pour créer des applications vocales interactives.
  • On a eu nos premiers clients en six semaines.
  • Le marché de la voix est en croissance exponentielle.
  • Le défi est de transformer l’avance technologique en succès commercial.

Qu’est-ce que Gradium et à quoi servent vos technologies ?

Gradium développe des modèles d’intelligence artificielle dédiés à la voix. Nous travaillons sur la retranscription, la génération de voix naturelle, la transformation et la traduction vocale.

L’idée est de proposer ces technologies comme des briques pour permettre à d’autres de construire des applications vocales. Cela peut être du secrétariat médical automatisé, des agents de support client, des personnages interactifs dans les jeux vidéo ou encore du contenu généré automatiquement.

Quel lien avec le laboratoire Kyutai ?

Nous sommes à l’origine du laboratoire Kyutai, qui se concentre sur la recherche en open source. Nous y avons développé des modèles de conversation et de traduction en temps réel.

Mais rapidement, des demandes commerciales sont apparues pour des solutions plus robustes et prêtes à l’emploi. Cela a conduit à la création de Gradium, qui se concentre sur les applications commerciales, tandis que Kyutai poursuit la recherche.

Où en êtes-vous aujourd’hui sur le marché ?

Nous avons signé nos premiers clients en seulement six semaines, ce qui est très rapide pour une entreprise qui développe ses propres modèles depuis zéro.

Nos clients sont principalement dans les interactions téléphoniques, où ils cherchent des expériences rapides, fiables et naturelles. Nous travaillons aussi avec les médias, notamment pour créer des contenus à partir de voix spécifiques grâce au clonage vocal.

Notre force principale est notre avance technologique. Nous avons été les premiers à résoudre des problèmes comme la conversation et la traduction vocale en temps réel.

Le défi aujourd’hui n’est plus technologique mais commercial : transformer cette avance en succès durable sur un marché en très forte croissance.

Comment définir une voix IA de qualité ?

La qualité dépend beaucoup du contexte d’usage. Une voix peut être très expressive ou au contraire plus neutre selon la situation.

Il faut aussi une interaction fluide, avec très peu de latence, pour se rapprocher d’une conversation humaine. L’objectif n’est pas de tromper l’utilisateur, mais d’offrir une expérience agréable, tout en indiquant clairement qu’il s’agit d’une IA.

Hébergé par Audiomeans. Visitez audiomeans.fr/politique-de-confidentialite pour plus d'informations.

Więcej odcinków z kanału "Monde Numérique | Actualité Tech & IA"