- Global Voices en Français - https://fr.globalvoices.org -

L'État indien de l'Odisha a mis en ligne 21 dictionnaires de langues autochtones

Catégories: Inde, Education, Langues, Médias citoyens, Peuples indigènes, Technologie, Communiqué, Rising Voices
[1]

Capture d'écran du site de l'Odisha Virtual Academy (Académie virtuelle de l'Odisha)

[Sauf mention contraire, tous les liens renvoient vers des pages en anglais, ndlt]

En 2018, le gouvernement de l’État indien de l'Odisha a publié [2] des dictionnaires [3] pour les 21 langues autochtones parlées dans la région. Ces dictionnaires ont été élaborés en collaboration avec des communautés de locuteurs natifs afin de préparer le terrain pour la mise en place de programmes d'éducation multilingue dans les écoles primaires. Les dictionnaires trilingues, qui comprennent des traductions en anglais et en odia (la langue officielle de l'Odisha), ont été mis à la disposition du public en août 2019 sur un portail éducatif [4] géré par le gouvernement.

Le 17 octobre, tous les dictionnaires hébergés sur le portail de l'Odisha Virtual Academy (Académie virtuelle de l'Odisha) ont été placés sous licence CC-BY 4.0 [5] [fr].

Nous apprécions les efforts de @Saileshpat [6] pour appliquer une licence CC (Creative Commons) afin de permettre à ces précieuses ressources de toucher un plus large public.

Sailesh Patnaik, relecteur bénévole pour le groupe Odia Wikimedians (affilié à Creative Commons et à Wikimedia), a apporté une importante contribution au projet en travaillant en étroite collaboration avec différents ministères pour que le projet voie le jour. Précédemment, Patnaik s'était déjà impliqué dans les efforts de migration de contenu régi par le droit d'auteur vers des licences Creative Commons pour différents comptes de médias sociaux ainsi que des sites web gérés par le gouvernement.

Ce n'est pas la première fois que le gouvernement de l'Odisha partage gratuitement des ressources en ligne sous licence Creative Commons. En 2017, l'Odisha avait fait la une des journaux [8], devenant le premier gouvernement d'un État indien à apposer une licence ouverte sur huit de ses comptes de médias sociaux. Cela a permis l'utilisation de ce contenu sur des plateformes telles que Wikipedia ainsi que ses projets affiliés Wikimedia Commons (bibliothèque multimédia), Wikisource (bibliothèque gratuite en ligne), et Wiktionary (dictionnaire gratuit en ligne). Ensuite, Jnanaranjan Sahu, un membre de Wikimedia, a créé un outil [9]pour faciliter la migration d'images sous licence libre depuis les comptes de médias sociaux vers Wikimedia Commons, afin qu'elles puissent être utilisées sur Wikipedia.

Huitième annexe de la Constitution indienne

La huitième annexe [10] (pdf) de la Constitution stipule les principes de base de l'usage des 22 langues indiennes dans les domaines de l'administration, de l'éducation et du développement culturel. Elle prévoit également des recommandations pour l'évaluation des candidats à la fonction publique dans ces langues. La liste officielle est la suivante : assamais, bengali, bodo, dogri, gujarati, hindi, kannada, kashmiri, konkani, maithili, malayalam, meitei, marathi, nepali, odia, punjabi, sanskrit, santali, sindhi, tamil, telugu et urdu. Les langues répertoriées sur cette liste sont plus facilement adoptées comme langues officielles de l'éducation et de l'administration dans les régions où elles sont parlées. Des demandes concernant 38 langues supplémentaires sont actuellement en cours de traitement.

Subhashish Panigrahi s'est entretenu avec Ranjana Chopra, qui dirige le service du gouvernement de l'Odisha [11] dédié au développement des castes et ethnies répertoriées et au bien-être des minorités (en anglais: Scheduled Caste and Scheduled Tribe Development, Minorities and Backward Classes Welfare Department [11]).

En guise d'introduction au contexte de création des dictionnaires, Chopra a évoqué le fait que la nécessité des dictionnaires bilingues pour la mise en place d'un enseignement multilingue avait été le moteur de ce travail. Comme il existe 21 langues autochtones différentes parlées dans l’État et que le personnel de terrain doit être opérationnel dans trois langues, le manque de ressources linguistiques les a amenés à faire face à de nombreux obstacles. Parmi les organismes qui ont joué un rôle important dans la compilation de ces dictionnaires, on trouve l'Académie des langues et cultures ethniques (ATLC [12]), l'Institut de recherche et formation sur les castes et ethnies répertoriées (Scheduled Castes and Scheduled Tribes Research and Training Institute, SCSTRTI [13]) et les Comités spéciaux de développement (SDC) — qui sont toutes des instances publiques d’État. Le Musée d'art et d'artisanat ethniques [14] situé dans la capitale de l'Odisha, Bhubaneswar, reste une référence pour les visiteurs désireux d'en savoir plus sur les peuples autochtones de l'Odisha ainsi que leurs langues et leurs cultures.

Rising Voices (RV): De nombreuses langues ne sont pas bien documentées. Comment avez-vous collaboré avec les communautés de locuteurs pour collecter et compiler les mots ? En quoi les dictionnaires existants ont-ils été utiles dans ce processus ?

Ranjana Chopra (RC): It is a fact that the indigenous languages have not been properly documented in the [Odisha] state although some sporadic attempts have been made over the years. Indigenous languages are full of dialectical variations. However, despite the variations, there are ‘nucleus’ areas where the “core language” is referred/spoken, although with some mixtures. While preparing bilingual dictionaries and trilingual proficiency modules, resource persons from the various nucleus areas were invited to work on the texts with a well-organized non-overlapping time plan. The ‘nucleus’ area and the relevant resource persons were identified through conducting workshops in respective language localities.

De fait, les langues autochtones ne sont pas correctement documentées dans l'Odisha, bien que quelques tentatives sporadiques aient été faites au fil des années. Les langues autochtones présentent énormément de variation dialectale. Malgré cela, il existe des zones centrales, où la langue “de référence” est parlée, avec toutefois quelques mélanges. Pendant la préparation des dictionnaires bilingues et des modules pédagogiques trilingues, des personnes référentes des diverses zones centrales ont été invitées à travailler sur le texte, suivant un emploi du temps bien organisé pour éviter les chevauchements. La zone dite centrale et les personnes référentes ont été identifiées suite à des ateliers menés dans les régions linguistiques concernées.

RV: Certaines langues, comme le bonda (remosam) [15], sont parlées par seulement 8 000 personnes. La moitié de la population bonda réside dans des villages reculés. Comment assurez-vous les préparatifs pour la mise en place d'une éduction multilingue dans leurs langues maternelles en général, et plus particulièrement, comment comptez-vous mettre ces ouvrages à leur disposition ?

RC: As stated earlier, the texts prepared on the indigenous languages are meant to strengthen ongoing interventions in multingual education including such activities in the Bonda language. Language teachers engaged from the same language speaking communities are supposed to facilitate formal education through their native languages. These language texts (bi-lingual dictionaries and trilingual proficiency modules) would help them in delivering the requirements.

As Academy of Tribal Languages and Culture was in charge of developing these dictionaries and trilingual proficiency modules, it has already dispatched copies of these resources to relevant authorities and pockets where different development activities are going on. Copies are also provided to native-language teachers and front-line workers of line departments including the Accredited Social Health Activist [16] (ASHA) who work in creating awareness among citizens for health planning and use of existing health services, and the Anganwadi Workers [17] who educate people living in rural areas about basic health education including contraception and nutrition, also provide pre-school education.

Comme je l'ai indiqué précédemment, les documents élaborés à propos des langues autochtones sont destinés au renforcement des dispositifs en cours d'éducation multilingue, y compris en bonda. Des professeurs issus des communautés linguistiques respectives ont été embauchés afin de permettre l'enseignement dans leurs langues maternelles. Ces dictionnaires bilingues et manuels trilingues sont censés servir de support pour atteindre les objectifs pédagogiques.

Comme l'Académie des langues et cultures ethniques a pris en charge le développement de ces ressources, certains exemplaires ont déjà été distribués aux institutions concernées ainsi que dans les endroits où des actions de développement sont menées. Les enseignants de langue et les travailleurs sociaux ont aussi reçu ce matériel, parmi eux l’Accredited Social Health Activist [16] (ASHA), qui sensibilise le public à la prévention en matière de santé ainsi qu'à l'accès aux services existants, ainsi que les Anganwadi Workers [17], qui proposent des formations d'éducation à la santé en milieu rural (par exemple sur la contraception ou la nutrition) ainsi que des cours de maternelle.

L'auteur a également pris contact avec le Secrétaire du service informatique [18] du gouvernement de l'Odisha, Manoj Kumar Mishra [19], à propos du projet de mise à disposition de ces ressources linguistiques en format Unicode [20]. Avant l'adoption du standard international, de nombreux alphabets et systèmes d'écriture, tout particulièrement en Inde, étaient traités suivant un encodage informatique sur mesure qui rendait les recherches sur le Web quasiment impossibles. En revanche, les textes saisis en format Unicode permettent de rechercher et partager des textes facilement.

RC: Comme vous avez sûrement pu le constater, le contenu des dictionnaires est disponible à la lecture mais ne peut pas encore faire l'objet d'une recherche. Avez-vous prévu de diffuser ce contenu sous format Unicode afin que tout un chacun puisse y avoir accès, quel que soit l'appareil ou le système d'exploitation utilisé?

Manoj Kumar Mishra: We are committed to bringing all the resources available on any of the [Odisha] government websites under Unicode, so that the content would be searchable on the web and will reach to every single citizen of the state, residing anywhere. Currently, we are working to improve the infrastructure required to make the text and the Odia font to be compatible and readable on different devices. Over the coming months, we will work to bring the dictionaries searchable on the Internet. We are also exploring to add these files to Odia Wikisource, where the community resource will convert it to Unicode, and will automatically become searchable on the web and thereby making the rich treasure of our written heritage accessible to all.

Nous nous sommes engagés à transférer l'intégralité des ressources disponibles sur les sites du gouvernement de l'Odisha en format Unicode, afin que le contenu puisse être consulté grâce à une recherche en ligne et puisse toucher chaque citoyen, peu importe son lieu de résidence. En ce moment, nous travaillons à l'amélioration de l'infrastructure nécessaire pour rendre les ouvrages et les polices de caractère compatibles et lisibles sur différents dispositifs. Dans les mois à venir, nous allons encoder les dictionnaires pour qu'ils puissent faire l'objet d'une recherche en ligne. Nous sommes aussi en discussion avec Odia Wikisource, en espérant bénéficier de la participation de la communauté pour convertir ces ouvrages en format Unicode, pour qu'ils soient consultables en ligne et que la richesse de notre héritage écrit soit accessible à toutes et à tous.

Les dictionnaires sont utiles pour les linguistes et les ethnographes souhaitant développer d'autres ressources pour les langues sans forme écrite. Ils seront aussi employés dans la création de contenu multimédia destiné à inciter les jeunes générations à davantage utiliser ces langues. Plus de 780 langues [21] sont parlées en Inde, mais 220 à 250 d'entre elles ont disparu au cours des 50 dernières années.