- Global Voices en Français - https://fr.globalvoices.org -

CLC 2014 : Coder pour les langues sous représentées sur Internet

Catégories: Médias citoyens, Rising Voices

[Tous les liens renvoient vers des pages en anglais.]

Cet article est reproduit avec l'autorisation du blog Global Native Networks [1].

Il y a 26 ans déjà, Gayatri Chakravorty Spivak questionnait la politique de représentativité dans son essai post-colonialiste emblématique, Can the Subaltern Speak? [2][“Les subalternes peuvent-is parler ?] . J'ai relu l'essai lorsque j'ai appris qu'un atelier allait avoir lieu pour offrir aux locuteurs de langues sous-représentées des outils permettant que leurs langues soient reconnues par les technologies numériques. Au moment où l'université d'été 2014 “Coder pour les communautés linguistiques” représente une chance importante de créer un espace numérique plus inclusif, peut-il éviter les paradigmes d'expression et d'égocentrisme occidentaux datés qui gouvernent l'Internet ? Paraphrasant Spivak, je demande : les subalternes peuvent-ils coder ? 

Ce n'est pas un secret qu'une poignée de langues dominent l'espace en ligne. Un billet publié en octobre dernier par András Kornai dans le journal PLOSOne (judicieusement intitulé “Digital Language Death” [3] [la mort numérique de la langue]) relevait que moins de cinq pour cent des langues mondiales actuelles sont utilisées en ligne.

Hors ligne, environ 7 776 langues sont usitées quotidiennement. Afin d'établir combien étaient présente en ligne, Kornai a développé un programme pour délimiter les domaines principaux [4] du web et lister le nombre de mots dans chaque langue. Les résultats reflètent, d'après Kornai, “la preuve d'une extinction massive, causée par la fracture numérique.”

Confronté aux chiffres, il est difficile de ne pas conclure que les nouveaux outils numériques perpétuent l'altération structurelle des peuples indigènes. Alors que les nouvelles technologies apportent souvent d'immenses bénéfices aux communautés locales pour leur quotidien, santé et préservation de leur culture, leurs interfaces sont définies dans d'autres langues, lois de propriété intellectuelle, normes culturelles de partage et de communication. Ainsi, l'Internet — et ceux qui le développent — perpétue cette violence épidémique, qui accélère la destruction des manières non occidentales de voir le monde.

Assistez à l'université d'été 2014 CIDLeS : Coder pour les communautés linguistiques, une conférence qui vise à donner à chacun la capacité de s'impliquer dans les espaces numériques dans sa propre langue. D'après le site [5] du CIDLes, la conférence réunira trois groupes de participants :

L'université d'été, qui aura lieu du 11 au 15 aout au sein du “Parque Natural das Serras de Aire e Candeeiros [6]” [PT] près de Minde, au Portugal, rassemble certains grands noms du domaine émergent de la diversité linguistique en ligne. Ces experts feront office de mentors [7] pour les participants à l'université d'été.

Par exemple, Kevin Scannell, mieux connu pour son projet Indigenous Tweets [8], aidera les étudiants à “transformer un corpus de données en correcteurs orthographiques.” Les étudiants vont apprendre comment trouver, clarifier et coder les données à partir du web, ensuite créer des listes de fréquence, ajouter la morphologie, afin de produire des extensions Firefox/OpenOffice.

Bruce Birch, un linguiste travaillant sur les langues de la famille linguistique Iwaidjan parlée en terre d'Arnhem [Territoire du Nord, en Australie], travaillera sur une application mobile pour la collecte et la publication collaboratives des données. Parmi ses idées figurent des applications pour données lexicales, recueils d'expressions, histoires et autres données issues des langues menacées d'extinction. Vous apprendrez comment développer une base de données pour le contenu et comment permettre aux utilisateurs de publier et partager leur contenu.

Un collègue ingénieur informatique à San Francisco m'a dit un jour “coder nous rendra libres.” Spivak — qui arrivait à la conclusion que les subalternes ne pouvaient pas prendre la parole — ne serait probablement pas d'accord. Elle avançait l'argument que même les tentatives les plus bienveillantes des intellectuels pour “donner une voix aux sans-voix” s'inscrivaient nécessairement dans le cadre d'un projet colonial élargi. Spivak pourrait faire des critiques similaires au sujet d'interventions même bien intentionnées des génies de la technologie pour concevoir des espaces de représentation en ligne pour les personnes marginalisées. En utilisant les méthodes proposées par le CLC 2014, pouvons-nous instiller dans la Silicon Valley des contre-discours qui s'opposent aux discours dominants sur le numérique ?

Nombre de pratiques populaires sur Internet (email, Facebook, Twitter, etc) demeurent des pratiques essentiellement textuelles ; cependant, quelques langues indigènes et minoritaires trouvent leur expression principalement à travers le mot prononcé (voir un article récent [9] sur l'Inuktitut et Twitter). Comment peut-on concevoir un espace numérique plus inclusif laissant place autant aux langues parlées qu'écrites ? 

Enfin, CLC 2014 m'apparaît être une première étape pratique dans la création d'un embryon de locuteurs de langues minoritaires équipés pour élaborer des outils numériques qui s'adaptent à ces langues. Face à cette imminente “disparition linguistique de masse,” mieux vaudrait mettre Spivak de côté pour l'instant et agir pour étudier quelques codes sources.

Alors, les subalternes peuvent-ils coder ? Je vous encourage à vous inscrire au CLC 2014 et à en tirer vos conclusions.

Cliquez ici [10] pour en savoir davantage sur l'université d'été “Coder pour les communautés linguistiques” ou remplissez le formulaire de participation [11]maintenant. Pour plus d'informations, veuillez contacter clc2014@cidles.eu [12].