Une version de cet article a été initialement publiée [en anglais] sur r12n.
Fondateurs et directeurs de Wikitongues, Daniel Bogre Udell et Frederico Andrade s'adonnent à l'ambitieuse mission de documenter — et enseigner — chaque langue du monde. Et par « chaque langue », ils entendent véritablement chaque langue, sans oublier les plus de 3.000, selon les estimations, langues non écrites, et même les langues construites (conlangs) comme l’Espéranto et le Lojban.
On a le droit d'être sceptique devant des prétentions aussi grandioses, mais cela vaut la peine de retracer le travail entrepris par le projet dans les dernières années, et capable de justifier un tel optimisme. Je me suis entretenu récemment avec eux sur le développement de leur documentation des langues, et leur plate-forme d'apprentissage, appelée Poly.
Wikitongues
Wikitongues est une structure à but non lucratif installée à Brooklyn, et qui est née de l'intérêt de l'intérêt que partagent Bogre Udell et Andrade pour les langues et l'informatique. Bogre Udell, par ailleurs aussi contributeur de Global Voices, a grandi dans un foyer monolingue en anglais, mais son intérêt pour les langues a été déclenché par le fait de vivre dans une communauté à langue minoritaire. Il a passé du temps en Espagne, d'abord en Aragon puis en Catalogne. Apprendre le catalan a grandement influencé son point de vue sur les langues, et sur le monde : « J'ai commencé à avoir un rapport à l'Espagne très différent de celui de la plupart des étrangers, et un rapport à l'Europe que n'ont pas la plupart des Européens ». Andrade a quant à lui grandi dans un foyer bilingue anglais-portugais, et a ultérieurement appris plusieurs langues. Les deux fondateurs partageaient un profond respect de la valeur de la diversité linguistique, et regrettaient que cette question n'occupe pas plus de place dans la sphère publique.
«On enseigne aux enfants combien il y a de pays, et les régions de leur propre pays », relève Bogre Udell. « On n'apprend à personne qu'il existe 7.000 langues. On voit encore aujourd'hui dans les médias que la discrimination linguistique reste toujours très banale ». Cette passion commune des langues — conjuguée à leur formation en informatique et design— fournit l'élan théorique et le fondement pratique de Wikitongues.
Au printemps 2012, Bogre Udell a commencé à enregistrer en vidéos de brèves témoignages oraux de ses voisins à Brooklyn, en demandant à ses sujets de parler dans leur langue maternelle. New York est peut-être la ville la plus linguistiquement diverse au monde, avec plus de 700 langues qui y sont parlées. Bogre Udell n'a pas tardé à acquérir une vaste collection de vidéos qu'il a commencé à mettre en ligne sur une chaîne YouTube : « En quelques semaines à peine nous avons pu enregistrer une quarantaine de langues différentes ». A son étonnement, il a constaté que sa chaîne attirait rapidement un auditoire mondial.
Au printemps suivant, l'ami de Bogre Udell (et ancien condisciple de la Parsons School of Design) Andrade a rejoint l'opération, et ils ont continué à enregistrer des vidéos à New York, tout en voyageant pour collecter des enregistrements de collectivités à travers les États-Unis. A mesure que le projet gagnait en attention et en succès, les offres de collaboration ont commencé à affluer du monde entier. Wikitongues a fini par s'établir en association, et coordonne un travail soigneux de documentation des langues par de brèves vidéos, avec la priorité mise sur les langues menacées de disparition. Au moment d'écrire cet article, la chaîne YouTube de Wikitongues s'enorgueillit de 347 vidéos de langues de toutes les régions habitées par les humains sur la planète.
La vidéo la plus récente, par exemple, montre des locuteurs du mirandais, une langue minoritaire (mais co-officielle) du Portugal pratiquée par quelques milliers de personnes.
Si le travail de documentation est une étape essentielle du processus de revitalisation d'une langue, le chemin de la documentation à la production de nouveaux locuteurs est rarement direct. A la fin de l'été 2014, les fondateurs de Wikitongues tombèrent sur un article décrivant l'oeuvre de Marie Wilcox. Cette femme, née en 1933, est la dernière personne à parler couramment le Wukchumni, l'une des nombreuses langues en danger d'extinction de l'actuelle Californie. Pendant plus de dix ans, Wilcox a travaillé avec sa fille Jennifer Malone et d'autres personnes pour documenter sa langue, griffonnant au début des mots dans des cahiers et sur des dos d'enveloppes. Bogre Udell et Andrade furent profondément émus de sa persévérance.
Leurs rencontres avec des personnes comme Wilcox ont aussi fait comprendre au duo que peu de locuteurs de langues en danger seraient disposés à, ou capables de participer à un projet similaire d'élaboration de dictionnaire. « Ce processus extrêmement laborieux, sur des années et des années », comme le décrit Andrade, était simplement hors de portée pour la plupart des gens.
Pour que Wikitongues saute le pas de l'initiative de documentation des langues vers une initiative de revitalisation des langues, il allait leur falloir aider des locuteurs comme Wilcox, et ceux de leurs vidéos, à se connecter plus délibérément avec des apprenants de langues. « Nous avons un peu brainstormé et essayé d'imaginer une interaction utile, légère, simple, qui pourrait vraiment aboutir à un peu de réelle progression » vers les objectifs autant de documentation que de revitalisation, explique Andrade. Ils ont conçu une solution accessible, conviviale, et utilisable par les personnes désireuses de documenter leur langue et la transmettre à de nouveaux locuteurs. Le travail sur la solution de Wikitongues pour ce défi, Poly, a démarré fin 2014.
Poly
Avec le soutien d'une campagne Kickstarter couronnée de succès l'année dernière, Poly est en développement rapide, et a récemment tenu sa promesse de sortir une version opérationnelle de l'application pour la Journée internationale de la langue maternelle. Poly est orienté vers la création de « livres » qui peuvent comporter du vocabulaire, des locutions et expressions pour un couple arbitraire de langues. S'il vous prend la fantaisie de créer un guide de conversation Lakota-Italien (ou Dothraki-Klingon), quelques clics sur Poly peuvent fournir un environnement de développement adéquat. Dans la démo ci-dessous, on peut voir Andrade créer un guide de conversation anglais-portugais du Brésil.
L'interface est simple, réactive, et facile d'usage. Si Poly peut être utilisé par les enseignants et apprenants en tous genres et pour n'importe quelle langue, l'espoir d'Andrade et Bogre Udell est qu'il serve d'outil utile aux personnes comme Marie Wilcox, en permettant un processus facile de documentation pouvant être directement orienté vers l'apprentissage.
Open source, open data, et open organization
Poly est un projet open source depuis l'origine, « simplement parce que les dépôts privés [sur Github] coûtent de l'argent », plaisante Andrade. Poly est construit sur une base de technologies open-source : le front-end est React, le back-end est Rails et PostgreSQL. Si Andrade laisse entendre que se dire open source est plutôt symbolique à ce stade précoce, Poly a déjà attiré des « centaines de milliers de dollars de temps de développement » de la part d'une communauté grandissante de développeurs. « Parce que nous sommes une association, qui plus est très très engagée » explique Andrade, « nous avons pu recueillir l'appui d'un grand nombre de développeurs. » Il dit que piloter un processus collaboratif de développement a quelque chose de « magique ».
Wikitongues a aussi développé une approche ouverte des data qu'ils compilent. Avec les conseils de la co-directrice de Wikitongues (et militante de l’ « open source, open standards, open data et contenu localisé ») Alolita Sharma, l'organisation travaille à rendre tout ses contenus disponibles sous des licences ouvertes de type Creative Commons, même pour les vidéos mises en ligne, les métadata des vidéos et les data langues de Poly.
Il existe des difficultés pour les data produites par les membres de maintes communautés — certaines communautés de langues menacées se méfient de leur possible exploitation, et les conceptions divergent souvent sur la propriété culturelle ou intellectuelle de leurs langues. « Le problème avec certains gros projets open source des mouvements de libre savoir, c'est qu'il y a une forme de dogmatisme autour des besoins d'octroi de licences », dit Bogre Udel. Wikitongues garde l'ouverture comme objectif, mais admet qu'une approche sur mesure de licence de data peut être nécessaire dans certains cas. L'organisation s'applique activement à naviguer dans les complexités de cet espace éthique, juridique et culturel. « Si nous arrivons à démontrer que des communautés ont prospéré à l'intérieur de notre modèle [open data], nous pourrons nous adresser à d'autres gens qui sont réticents, et leur dire : ‘regardez, voilà les avantages’ », explique Andrade.
La philosophie du projet va au-delà du code et des data. Bogre Udell relève que l'ampleur de ce qu'essaie d'accomplir Wikitonges — œuvrer avec chaque communauté linguistique du monde — requiert un degré d'ouverture. Selon Andrade, « Une de nos philosophies les plus ancrées en tant qu'organisation est que nous travaillons avec des communautés. Si nous y allons et enregistrons des vidéos, ce n'est pas pour ‘rapporter’ ». Dans chacune de ces centaines de vidéos, Wikitongues espère communiquer qu'il y a une personne réelle qui parle et souhaite parler de son vécu dans sa langue.
Toutes les langues du monde
Les initiatives comme Wikitongues sont vitales dans la course à la revitalisation des langues menacées. Comme je l'ai déjà relevé, développer les ressources numériques linguistiques pour une langue peut assurer que la génération suivante y aura accès, et nul doute que la plus grande partie de la tâche se trouvera à l'extérieur (ou au mieux, aux côtés) des autoroutes de l'informatique commerciale. Dans ses échanges avec les principales compagnies des technologies, Bogre Udell a rencontré un enthousiasme tiède pour s'impliquer dans les langues à petit nombre de locuteurs. « L'important pour eux, c'est d'atteindre les quelques 400 langues les plus pratiquées », note-t-il. « Nous avons discuté avec quelqu'un de Google.org et on nous a clairement fait comprendre que les langues parlées par moins de 10.000 personne ne les intéressaient pas ». Avec Poly, Wikitongues poursuit sa route pour développer une communauté mondiale ouverte centrée sur les langues.
« Dans l'action de documentation des langues, nous sommes les seuls à essayer d'être exhaustifs sur les langues du monde », insiste Bogre Udell. « Nul autre n'a cet intérêt ».Une orientation et mission qui façonnent directement le développement de Poly. « Nous voulons créer des outils qui sont utiles au public », défend-il. « Nous voulons êtres plus utiles aux locuteurs qu'aux linguistes, parce que ceux qui en ont besoin, ce sont les locuteurs ».