CLC 2014 : Coder pour les langues sous représentées sur Internet

[Tous les liens renvoient vers des pages en anglais.]

Cet article est reproduit avec l'autorisation du blog Global Native Networks.

Il y a 26 ans déjà, Gayatri Chakravorty Spivak questionnait la politique de représentativité dans son essai post-colonialiste emblématique, Can the Subaltern Speak?[“Les subalternes peuvent-is parler ?] . J'ai relu l'essai lorsque j'ai appris qu'un atelier allait avoir lieu pour offrir aux locuteurs de langues sous-représentées des outils permettant que leurs langues soient reconnues par les technologies numériques. Au moment où l'université d'été 2014 “Coder pour les communautés linguistiques” représente une chance importante de créer un espace numérique plus inclusif, peut-il éviter les paradigmes d'expression et d'égocentrisme occidentaux datés qui gouvernent l'Internet ? Paraphrasant Spivak, je demande : les subalternes peuvent-ils coder ? 

Ce n'est pas un secret qu'une poignée de langues dominent l'espace en ligne. Un billet publié en octobre dernier par András Kornai dans le journal PLOSOne (judicieusement intitulé “Digital Language Death” [la mort numérique de la langue]) relevait que moins de cinq pour cent des langues mondiales actuelles sont utilisées en ligne.

Hors ligne, environ 7 776 langues sont usitées quotidiennement. Afin d'établir combien étaient présente en ligne, Kornai a développé un programme pour délimiter les domaines principaux du web et lister le nombre de mots dans chaque langue. Les résultats reflètent, d'après Kornai, “la preuve d'une extinction massive, causée par la fracture numérique.”

Confronté aux chiffres, il est difficile de ne pas conclure que les nouveaux outils numériques perpétuent l'altération structurelle des peuples indigènes. Alors que les nouvelles technologies apportent souvent d'immenses bénéfices aux communautés locales pour leur quotidien, santé et préservation de leur culture, leurs interfaces sont définies dans d'autres langues, lois de propriété intellectuelle, normes culturelles de partage et de communication. Ainsi, l'Internet — et ceux qui le développent — perpétue cette violence épidémique, qui accélère la destruction des manières non occidentales de voir le monde.

Assistez à l'université d'été 2014 CIDLeS : Coder pour les communautés linguistiques, une conférence qui vise à donner à chacun la capacité de s'impliquer dans les espaces numériques dans sa propre langue. D'après le site du CIDLes, la conférence réunira trois groupes de participants :

  • Les locuteurs de langues actuellement non reconnues par les technologies linguistiques et souhaitant utiliser leur langue sur les appareils électroniques ;

  • Les étudiants en linguistique et disciplines connexes qui veulent apprendre le développement de logiciel ;

  • Les développeurs de logiciels et étudiants en informatique intéressés pour soutenir les langues peu présentes en ligne par les outils technologiques.

L'université d'été, qui aura lieu du 11 au 15 aout au sein du “Parque Natural das Serras de Aire e Candeeiros” [PT] près de Minde, au Portugal, rassemble certains grands noms du domaine émergent de la diversité linguistique en ligne. Ces experts feront office de mentors pour les participants à l'université d'été.

Par exemple, Kevin Scannell, mieux connu pour son projet Indigenous Tweets, aidera les étudiants à “transformer un corpus de données en correcteurs orthographiques.” Les étudiants vont apprendre comment trouver, clarifier et coder les données à partir du web, ensuite créer des listes de fréquence, ajouter la morphologie, afin de produire des extensions Firefox/OpenOffice.

Bruce Birch, un linguiste travaillant sur les langues de la famille linguistique Iwaidjan parlée en terre d'Arnhem [Territoire du Nord, en Australie], travaillera sur une application mobile pour la collecte et la publication collaboratives des données. Parmi ses idées figurent des applications pour données lexicales, recueils d'expressions, histoires et autres données issues des langues menacées d'extinction. Vous apprendrez comment développer une base de données pour le contenu et comment permettre aux utilisateurs de publier et partager leur contenu.

Un collègue ingénieur informatique à San Francisco m'a dit un jour “coder nous rendra libres.” Spivak — qui arrivait à la conclusion que les subalternes ne pouvaient pas prendre la parole — ne serait probablement pas d'accord. Elle avançait l'argument que même les tentatives les plus bienveillantes des intellectuels pour “donner une voix aux sans-voix” s'inscrivaient nécessairement dans le cadre d'un projet colonial élargi. Spivak pourrait faire des critiques similaires au sujet d'interventions même bien intentionnées des génies de la technologie pour concevoir des espaces de représentation en ligne pour les personnes marginalisées. En utilisant les méthodes proposées par le CLC 2014, pouvons-nous instiller dans la Silicon Valley des contre-discours qui s'opposent aux discours dominants sur le numérique ?

Nombre de pratiques populaires sur Internet (email, Facebook, Twitter, etc) demeurent des pratiques essentiellement textuelles ; cependant, quelques langues indigènes et minoritaires trouvent leur expression principalement à travers le mot prononcé (voir un article récent sur l'Inuktitut et Twitter). Comment peut-on concevoir un espace numérique plus inclusif laissant place autant aux langues parlées qu'écrites ? 

Enfin, CLC 2014 m'apparaît être une première étape pratique dans la création d'un embryon de locuteurs de langues minoritaires équipés pour élaborer des outils numériques qui s'adaptent à ces langues. Face à cette imminente “disparition linguistique de masse,” mieux vaudrait mettre Spivak de côté pour l'instant et agir pour étudier quelques codes sources.

Alors, les subalternes peuvent-ils coder ? Je vous encourage à vous inscrire au CLC 2014 et à en tirer vos conclusions.

Cliquez ici pour en savoir davantage sur l'université d'été “Coder pour les communautés linguistiques” ou remplissez le formulaire de participation maintenant. Pour plus d'informations, veuillez contacter clc2014@cidles.eu.

Commentez

Merci de... S'identifier »

Règles de modération des commentaires

  • Tous les commentaires sont modérés. N'envoyez pas plus d'une fois votre commentaire. Il pourrait être pris pour un spam par notre anti-virus.
  • Traitez les autres avec respect. Les commentaires contenant des incitations à la haine, des obscénités et des attaques nominatives contre des personnes ne seront pas approuvés.