- Global Voices en Français - https://fr.globalvoices.org -

Huit défis pour les Wikipédias indiens

Catégories: Asie du Sud, Inde, Idées, Langues, Médias citoyens, Technologie, The Bridge
From language input to Unicode standards, Indian-language Wikipedias need a sustained effort from the community. Credit: Johann Dréo CC BY 2.0/Flickr

De la saisie au clavier à la norme Unicode, les communautés des Wikipedias en langues indiennes doivent fournir un effort soutenu. Image : Johann Dréo CC BY 2.0/Flickr

Une version de ce billet [1] a été publiée sur The Wire [2].

Même après dix ans d'existence, les Wikipédias en langues indiennes [3] ne sont encore guère connus de leurs locuteurs. Wikipédia, la plus importante encyclopédie [4] réalisée dans l'histoire humaine, est ce qu'elle est aujourd'hui grâce à des milliers de rédacteurs bénévoles. Mais bien que certaines versions natives de Wikipédia soient en train de changer la donne dans plusieurs régions du monde, l'Inde reste à la traîne. Voici, selon moi, quelques uns des défis auxquels les wikipédias indiens font face.

1. Les communautés linguistiques

La plupart des locuteurs des nombreuses langues de l'Inde ne savent pas comment chercher des informations sur internet dans leur système d'écriture. Certains groupes pensent même que si la page de Google n'existe pas dans leur langue, celle-ci est absente d'internet. Pourtant, après avoir offert sa page en cinq langues indiennes [5], Google en a maintenant neuf. Ceci ne devrait pas non plus arrêter un internaute parlant santal [6] ou manipuri [7] d'effectuer ses recherches en utilisant l’Unicode Ol chiki [8] (pour le santali) ou l’Unicode Meithei [9] (pour le manipuri). Google, et en fait n'importe quel moteur de recherche, affiche tout ce qui est disponible sur internet dans n'importe quel système d'écriture. Mais l'apparente absence de ces alphabets maintient de nombreuses personnes à distance d'internet en général, et de Wikipédia en particulier.

2. Les rédacteurs de Wikipédia

Wikipédia est écrit par des gens comme vous et moi. De l'écriture à l'édition, tout est accompli par des bénévoles. N'importe qui peut corriger les erreurs et les imprécisions qui existent dans beaucoup d'articles. Malgré cela, et bien que les différentes langues indiennes soient parlées par des millions de personnes, les équipes d'éditeurs pour ces langues sont réduites et seule une poignée de rédacteurs [10] contribuent à ces versions de Wikipédia. Par exemple en janvier 2016, Wikipédia en hindi [11] n'avait que 89 éditeurs pour plus de 550 millions de locuteurs.

3. La saisie sur ordinateur

Une grande majorité d'Indiens ne sait pas [12] comment taper [13] à l'ordinateur dans sa langue. Il y a peu d'instructions pour expliquer la saisie d'une langue donnée à un utilisateur. Bien que l'utilisation des ordinateurs et l'accès à internet se développent dans de nombreuses écoles publiques [14] indiennes, la saisie dans les langues natives et d'autres compétences basiques essentielles [15] ne sont pas communément enseignées dans tous les états indiens. C'est dommage, car l'offre de logiciels gratuits permettant de saisir une langue native est variée, et les difficultés [16] qui existaient il y a quelques années pour saisir dans une langue indienne ont maintenant presque disparu.

4. La saisie sur les appareils portables

Avec plus d’un milliard [17] d'utilisateurs de téléphones portables, le taux de pénétration d'internet indien de 15% va bientôt augmenter encore plus rapidement. Ceci va à son tour aider beaucoup d'Indiens à accéder à internet, de même que la concurrence entre les fournisseurs d'accès va réduire davantage les coûts de connexion [18]. Si ces futurs utilisateurs ne sont pas formés à la saisie dans leur langue, ils deviendront victimes [19] d'un internet purement anglophone [20] et ne pourront pas profiter des avantages que pourrait leur offrir “leur” internet. Les possesseurs de smartphones ont besoin d'un support technique et linguistique complet et surtout de méthodes de saisie intégrées, pour être en mesure de contribuer à Wikipédia dans leurs langues.

5. La rareté des contenus en langues indiennes

L'absence relative de contenus dans ces langues [21] est un autre problème majeur dans l'adoption des Wikipédias natifs. D'après une enquête menée en 2012 par l'Association de l'internet et du portable d'Inde, plus de 6% de la population a éte laissée à l'écart au moment de rejoindre le monde d'internet seulement à cause de la pauvreté des contenus dans leurs langues. Prenons l'exemple de mon Etat natal, l'Odisha : alors que le portail officiel du tourisme [22] du Kérala est disponible en Oriya [langue officielle de l'Odisha, NdT] et en d'autres langues, à la rédaction de cet article, celui de l'Odisha ne présentait aucune information [23] sur sa propre langue. Il est vraiment dommage que nos langues soient aussi négligées jusque dans nos Etats.

6. L'incompatibilité entre anciennes et nouvelles normes dans les médias

Au lieu d'utiliser la norme Unicode [24], de nombreux médias traditionels continuent d'utiliser les variantes non-standards des systèmes ASCII [25]/ISCII [26]. La norme Unicode est un standard universel et peut servir pour la saisie des langues indiennes depuis presque vingt-cinq ans [27], mais la plupart des journaux vernaculaires imprimés indiens ne l'ont pas adoptée. Du coup, de nombreux journaux populaires indiens ne sont pas disponibles en Unicode sur internet.

7. L'absence d'accès libre de droit

La majorité des informations publiées sur internet, et en particulier par le gouvernement [28] indien, est protégée par le droit d'auteur. Ce jardin barricadé de restrictions limite l'accès à l'information et empêche à la fois apprentissage et partage. En revanche, Wikipédia est distribué sous une licence Creative Commons Share-Alike [29], qui autorise tout un chacun à utiliser et même distribuer le contenu à des fins commerciales. Ouvrir l'information libre de droit pourrait rendre les informations facilement accessibles à des millions de gens.

8. L'absence de d'outils pour les utilisateurs handicapés

Beaucoup en Inde ne savent ni lire, écrire ou parler : il y a dans le pays plus de soixante millions de malentendants [30]. Les handicapés ont un besoin désespéré de traducteurs automatiques écrit/audio [31] et audio/écrit de bonne qualité. Ces produits sont disponibles gratuitement pour que ceux qui ne peuvent pas s'offrir de coûteux logiciels propriétaires comme JAWS puissent contribuer à Wikipédia dans leurs langues. La plupart des outils de traduction écrit/audio disponibles actuellement dans les langues indiennes ont un son tellement artificiel que le locuteur moyen ne peut les utiliser qu'avec difficultés.

Subhashish Panigrahi est un éducateur et milite pour le savoir libre de droit. Il travaille à la Fondation Wikimédia dans l'équipe Communications, Program Capacity & Learning, ainsi qu'au Centre pour l'internet et la société dans le groupe Accès au savoir. Certaines parties de cet article sont issues d'un exposé donné par Subhashish à BHASHA : le Festival numérique des langues indiennes, à New Delhi.