Bouygues Telecom devient le premier opérateur à tester la traduction automatique de sous-titres TV par intelligence artificielle. Ce service, intégré au décodeur b.tv, permet de visionner des programmes en direct dans cinq langues différentes, directement depuis son salon.
Traduction automatique sur le site de réservation d’un hôtel hollandais:
Wed (abbréviation de Mercredi en anglais) traduit par Mariage (wedding) !
Ca me rappelle un PC HP avec, dans le bios, « ordre de botte » au lieu de « boot order ».
Ça promet de bons moments de rigolade avec le niveau actuel de la traduction mêmes si de gros progrès ont été faits…
C’est cool, mais ce serait surtout aux diffuseurs de faire des efforts alors qu’ils n’y a même pas de sous-titres VO aujourd’hui. On déploie une puissance démesurée d’IA individuelle pour faire un truc qui demanderait quasiment autant de ressources à faire en amont « une seule fois » pour tout le monde (sachant que c’est même souvent déjà fait ailleurs puisque les contenus sont mondialisés).
Mais au delà de ces considérations écologico-économiques, il y a un problème de principe.
Premier point d’accrochage : on part des subs VF pour traduire, ils ont donc parfois déjà fait l’objet d’une première traduction, subjective et avec des propos retravaillés pour optimiser l’affichage (longueur max des textes, etc.).
Deuxième point, d’ordre technique : d’après mes recherches succinctes sur le sujet (et ChatGPT pour pas me bouffer les 82 pages du PDF sur le sujet), les normes de diffusion live (DVB ou IPTV) ne fonctionnent pas comme les fichiers .SRT ou les sous-titres encapsulés dans un MKV. Le flux ne fourni à l’appareil que le texte en cours, donc l’IA n’a aucun contexte à disposition pour faire une traduction de qualité.
Si je prends un programme en cours de route et que le premier propos qui survient c’est « il vient d’arriver », l’IA n’a que ça à disposition et va devoir arbitrer entre « He » « It » sans savoir si on parle d’une personne ou d’un colis, là où le natif aurait eu la phrase précédente pour identifier le contexte du scénario complet, sachant que la réponse est parfois très en amont dans l’ensemble des dialogues.
Autant dire que la qualité risque d’en pâtir sérieusement. Mais sur des programmes franco-français ou des programmes en direct sous-titrés, pourquoi pas si ça dépanne ceux qui s’en servent.
Une grosse erreur, on pousse l’humanité vers la paresse intellectuelle, la misère sociale.
Mouais, traduire instantanément des phrases courtes sans contexte, on sait faire depuis longtemps. Et il n’y a pas vraiment besoin d’un NPU pour ca.
Par contre ce qui serais intéressant c’est d’embarquer le model whisper.cpp pour générer des sous titres quand des programme n’en fournisse pas.
Mais ils se sont peut être rendu compte que 4Go de ram pour faire tourner tout ca, c’ esr un peu limite.