Put your name here

connexionS'accréditer | S'abonner | Se connecter | Faire un don
> Logo ABP
ABP e brezhoneg | ABP in English |
NLLB-200
NLLB-200
- Chronique -
Langue bretonne et intelligence artificielle
L’intelligence artificielle va bouleverser les rapports que les humains, avec leur petite intelligence humaine, ont avec le savoir, avec la culture, et donc avec leurs identités collectives. L’identité bretonne sera concernée. La traduction automatique par des logiciels d’intelligence artificielle est un de ces bouleversements. Quand tout peut être traduit immédiatement en breton, que demander de mieux à la République française ?
Jean-Pierre Le Mat pour ABP le 7/04/23 19:42

L’intelligence artificielle va bouleverser les rapports que les humains, avec leur petite intelligence humaine, ont avec le savoir, avec la culture, et donc avec leurs identités collectives. L’identité bretonne sera concernée.

La traduction automatique par des logiciels d’intelligence artificielle est un de ces bouleversements qui pourrait délégitimer en profondeur les arguments du "droit à la différence" ou du "droit des minorités". Quand tout peut être traduit immédiatement en breton, que demander de mieux à la République française ? La revendication de "droits" a été jusqu’à présent le camouflage moralisateur d’une arrière-pensée moins avouable et bien plus redoutable, qui est la volonté séparatiste, issue d’une longue tradition historique.

Une technologie révolutionnaire

Le logiciel qui pourrait devenir à la fois symbolique et leader mondial de la traduction automatique est le projet NLLB-200. Drôle de nom, me direz-vous. NLLB veut dire "No Language Left Behind", "aucune langue laissée de côté". Le chiffre 200, c’est pour dire que, pour l'instant, 200 langues sont concernées. J’ai vérifié : la langue bretonne en fait partie. Cette intégration est due à la forte présence de la langue bretonne sur internet. Merci à tous les bretonnants bénévoles qui écrivent sur des sites en ligne, et en particulier à ceux qui écrivent des articles sur Wikipedia.

NLLB-200 pourrait devenir le leader mondial de la traduction instantanée car le porteur du projet n’est pas un marginal. C’est Meta, autrement dit Facebook, Whatsapp, Instagram.

Pourquoi est-ce une révolution ? Les anciens logiciels de traduction étaient assez pauvres techniquement. NLLB-200 travaille sur 54 milliards de paramètres, ce qui en fait un vrai outil d’intelligence artificielle. La traduction serait très proche du langage naturel (mais attendons de voir). La grande différence entre NLLB-200 et les précédents logiciels de traduction est son intégration des "petites langues". La traduction instantanée, qui était un privilège réservé aux langues les plus parlées, se démocratise. Les traductions sur Facebook, Whatsapp et Instagram, mais aussi de tous les articles de Wikipedia, est prévue dans un premier temps.

L’atout du multilinguisme

La traduction automatique ne doit pas être un appel à la paresse. Être capable de comprendre et de parler plusieurs langues reste un atout. Le polyglotte saisit le sens de ce qui est dit ou écrit, bien mieux que la meilleure traduction. En anglais, "home" désigne un lieu, mais le mot est coloré par un sentiment de chaleur et d’appartenance. La traduction par "maison" serait insuffisante, car c’est d’abord un "chez moi". En breton, "glaz" signifie une couleur, et en plus le mot établit un lien avec la nature environnante et non avec le dessin. C’est la couleur de la mer et aussi celle de l’herbe.

La syntaxe, l’accent parlé, la mimique, tout un contexte contribue à la compréhension entre interlocuteurs. Le multilingue est -et sera toujours- à la fois plus cultivé et plus compréhensif, plus tolérant que le monolingue, même si celui-ci bénéficie d’un traducteur intelligent.

Une stratégie bretonne ?

Cela dit, les Bretons, même s’ils sont multilingues, ne peuvent pas se permettre de se replier sur leur patrimoine linguistique et négliger les nouvelles technologies. Les logiciels de traduction donnent une visibilité mondiale à la langue bretonne, sans passer par le filtre de l’administration française. Obtenir des droits dans le cadre de la législation française est une chose. Mais nous ne vivons plus seulement dans cet univers étroit et cadenassé. Nous vivons aussi dans celui de Google, d’Amazon, de Facebook, des GAFAM, de l’internet mondial. Refuser NLLB-200 ou Google Translate par antiaméricanisme, en invoquant je ne sais quelle règle morale ou quel impératif de pureté idéologique, serait une erreur stratégique.

Aujourd’hui, la nation bretonne déborde les frontières des cinq départements. Une communauté humaine ne se définit plus seulement par des autochtones, mais aussi par une diaspora plus ou moins consciente d’appartenir à cette communauté, plus ou moins solidaire, plus ou moins puissante. Le XXe siècle est derrière nous, avec ses rêves de repli sur l’État national ou sur l’État-providence. Les Bretons forment une communauté nationale qui a des ramifications dans le monde entier. Parfois, je me demande si je ne suis pas trop tard pour me dire "nationaliste" et trop tôt pour me dire "communautariste". Quoi qu’il en soit, il faut inventer la revendication bretonne d’aujourd’hui, sans renier celle d’hier et sans mettre en péril celle de demain.

La Bretagne n’est pas assez riche pour vivre de ses rentes et se passer des nouvelles technologies d’origine étrangère. Ces technologies sont même nécessaires pour contourner la stratégie française d’unification. N’ayons aucun scrupule à les utiliser. Mais, pour assurer notre intelligence non artificielle, restons néanmoins multilingues.

Jean Pierre Le Mat

Voir aussi :
11  0  
Jean-Pierre Le Mat est chef d'entreprise (en retraite) et auteur. Il a en particulier réédité et complété l'Histoire de Bretagne de Henri Poisson; Patrick Pearse et l'insurrection irlandaise de 1916; les cent vies de l'hermine; Histoire de Bretagne, le point de vue breton; Enquêtes sur les prophéties de Merlin ; Carnet d'un Bonnet rouge ; Ils ont fait la France. Il anime le site contreculture.org.
Voir tous les articles de de Jean-Pierre Le Mat
Vos 8 commentaires :
KLG Le Vendredi 7 avril 2023 22:23
Votre article et le sujet sont passionnants, mais je pense que vous êtes très./trop optimiste sur votre constat de départ concernant la situation du breton sur Internet.
Sa présence est extrêmement parcellaire, des projets souvent morts-nés. 25 ans après les débuts d'internet au grand public, il n'y a même pas un vrai traducteur automatique en ligne...l'ofis ar brezhoneg avait cet objectif, on en a même pas vu la couleur.
La production, en volume et qualité sur les médias modernes reste beaucoup trop lacunaire et peu accessible alors qu'à la base le potentiel du breton est bien plus important que pour d'autres langues minoritaires.
Je doute fortement qu'une langue bretonne "normale" capable de s'exprimer sur tous sujets soit réellement présente avec l'IA. La vraie question au vu des risques majeurs que peut faire peser l'IA en terme de liberté d'expression notamment c'est : chance ou pas chance pour le breton de ne pas en faire réellement partie à l'avenir ?
Autant je pense que l'Internet aurait du/devrait être une chance pour le breton, autant ne pas être une langue centrale pour l'IA est peut-être une chance, car le breton pourrait rester dans une certaine mesure une forme de refuge, de non-asservissement.
(1) 

Jean Pierre LE MAT Le Samedi 8 avril 2023 09:53
@KLG. J'ai des raisons d'être optimiste à propos du breton sur internet et en voici une : le breton est la 82ème langue de Wikipedia en nombre d'articles (https://meta.wikimedia.org/wiki/List_of_Wikipedias#All_Wikipedias_ordered_by_number_of_articles), avant l'irlandais et d'autres langues officielles comme le swahili. Le breton peut encore progresser. L'occitan (76ème) , le galicien (53ème), le gallois (41ème), le basque (34ème) , le catalan (20ème) font mieux que nous.
(1) 

alan-erwan Le Lundi 10 avril 2023 10:24
Article passionnant car l'IA appliquée aux langues et donc à la langue bretonne nous donne une visibilité à l'international et nous fait sortir du carcan français. Notre Pays a toujours été ouvert sur le Monde et l'évolution de l'humanité sera plurielle. Notre Nation et notre Peuple y ont toute leur place.
Ensuite, la question que soulève JPLM est celle de la gouvernance. Quelle sera notre liberté politique ? Au sein d'un parlement mondial ? C'est maintenant que la stratégie doit être clairement définie, à l'heure où un État obsolète comme la France peut imploser. Petra vo an dazont evit Breizh?
(0) 

Gweltaz DG Le Lundi 10 avril 2023 17:01
J'ai bien peur que le Breton ait été laissé de côté par le projet NLLB de Facebook (contrairement à ce qui a été dit dans l'article)
Vous pourrez le vérifier dans l'article du projet à cette adresse (la liste des langues prises en charge sont listées à partir de la page 12) :
https://research.facebook.com/publications/no-language-left-behind/
Vous pouvez toutefois conserver votre optimisme : au moins deux équipes travaillent parallèlement à la traduction automatique du Breton : Loïc Grobol et Mélanie Jouitteau (Univ. d'Orléans, CNRS) ainsi que Alan Entem et Bredan-Budok Durand-Le Dudec (OPLB).
(0) 

Jean Pierre LE MAT Le Lundi 10 avril 2023 20:12
@Gweltaz DG La langue bretonne figure bien. Voir https://huggingface.co/models?other=text2text-generation&sort=downloads
(0) 
De Gweltaz DG à Jean Pierre LE MATLe Samedi 15 avril 2023 10:38
Désolé, je ne vois toujours pas. Le lien donné pointe vers un résultat de recherche de tous les modèles de types text2text qu'on peut trouver sur la plateforme "huggingface". Il y en a plus de 14000 (dont plusieurs variants de NLLB-200). Une fois entraînés, NLLB-200 a été évalué à l'aune du corpus FLORES-200, qui reflète (normalement) les données trouvées dans le corpus d'entrainement. Là non plus le breton n'y figure pas : Voir le site Le corpus d'entraînement utilisé pour NLLB-200 n'a, à priori, pas été partagé par FB. S'il est possible que de nouveaux modèles basés sur NLLB-200 aient été augmentés avec le breton, je ne les ai pas trouvés.
(0)

Ar Guyader Le Mardi 11 avril 2023 11:12
Le breton aurait tout intérêt à ne pas subir un traitement de traduction instantanée. La langue perdrait alors tout ses atouts qui font d'elle un outil de communication hors "radars". Malheureusement la tendance est à l'absorption totale de la volonté humaine et de ses ressources par l'IA. Le breton risque à terme de rejoindre toutes ces autres langues, numérisées archivées, muséifiées et donc de fait dévitalisées.
Pourvu que cette numérisation se fasse le plus tard possible, et dans l'idéal, jamais.
(0) 

P. Argouarch Le Samedi 12 août 2023 02:04
heuuh... le breton n'est plus dans NLLB !
(0) 

Commenter :
Votre email est optionnel et restera confidentiel. Il ne sera utilisé que si vous voulez une réponse d'un lecteur via email. Par exemple si vous cherchez un co-voiturage pour cet évènement ou autre chose.
ANTI-SPAM : Combien font 8 multiplié par 4 ?

ABP

Publier

Nous suivre

2003-2024 © Agence Bretagne Presse, sauf Creative Commons