
ElevenLabs et IBM unissent leurs forces pour des agents IA vocaux
ElevenLabs et IBM ont officialisé le 25 mars un partenariat stratégique visant à intégrer les technologies de synthèse vocale (TTS) et de reconnaissance vocale (STT) d'ElevenLabs à IBM WatsonX Orchestrate, la plateforme unifiée d'IBM dédiée à la création, au déploiement et à la gestion d'agents d'IA. L'objectif affiché : permettre aux entreprises de passer d'agents conversationnels textuels à des expériences vocales naturelles et évolutives.
Ce rapprochement illustre une tendance de fond : l'interface vocale s'impose comme le prochain terrain de bataille des agents IA en entreprise. Là où le texte exige un effort de l'utilisateur, la voix réduit la friction et élargit l'accessibilité — notamment pour les secteurs à fort volume d'interactions humaines comme la banque, la santé, les télécoms ou les services publics. En combinant la puissance d'orchestration d'IBM et la qualité vocale d'ElevenLabs, le partenariat vise directement les déploiements à grande échelle dans des environnements réglementés.
Les chiffres parlent d'eux-mêmes : ElevenLabs, fondée en janvier 2023, revendique plus de 10 millions d'utilisateurs enregistrés à mi-2024, dont plus d'un million d'utilisateurs actifs quotidiens. En dix-huit mois, son portefeuille de clients entreprise est passé d'environ 50 à 500 organisations. L'intégration à WatsonX Orchestrate donne accès à un catalogue de plus de 10 000 voix, avec des garanties de niveau entreprise : conformité PCI, mode « Zéro rétention » pour les données HIPAA et résidence des données configurable. Nick Holda, vice-président des partenariats technologiques IA chez IBM, résume l'ambition : « Nous donnons une voix aux agents d'IA en entreprise. » Mati Staniszewski, cofondateur d'ElevenLabs, abonde : « C'est par la voix que l'IA gagne ou perd la confiance. »
Au-delà du partenariat technique, les deux acteurs cherchent à consolider leur positionnement sur un marché en pleine structuration. IBM apporte la maîtrise de l'orchestration multi-agents et de la gouvernance des données d'entreprise ; ElevenLabs y ajoute une couche vocale réaliste et multilingue, difficile à répliquer rapidement par des concurrents. Ensemble, ils ciblent des cas d'usage concrets : assistance citoyenne multilingue dans les administrations publiques, support client dans la finance et l'énergie, ou encore expérience employé dans les grandes organisations.
Les garanties de conformité (résidence des données configurable, mode zéro rétention) et le support multilingue ouvrent des perspectives pour les entreprises et administrations européennes des secteurs régulés, en cohérence avec les exigences du RGPD.


