Ces mordus de technologie veulent que votre téléphone vous parle en swahili

Photo by Eli Duke via Flickr (CC BY-SA 2.0)

Avec environ 100 millions de locuteurs, le swahili est la deuxième langue la plus largement répandue sur le continent africain, après l'arabe. Pourtant, des services tels que la reconnaissance automatique de la parole (ASR) ne sont pas commercialement disponibles dans cette langue, refusant leur accès à de nombreux utilisateurs avec des handicaps et à ceux qui ne savent pas lire les informations dont ils ont désespérément besoin dans leur vie quotidienne. Cela pourrait changer très bientôt cependant, car des recherches universitaires et des startups dans le domaine des technologies conjuguent leurs efforts pour fournir des technologies localisées en swahili.

Recherche sur Internet sur un simple téléphone portable

Une de ces innovations très prometteuses est sur le point d'être lancée au Kenya. Uliza (qui signifie “poser une question” en swahili) est une interface vocale qui permet aux utilisateurs d'accéder à l'information à partir d'Internet à l'aide d'un téléphone portable premier prix.

Tout ce que les utilisateurs ont besoin de faire est d'appeler et de poser une question en swahili. Dans les 15 à 90 minutes, un “agent de réponse” (une personne réelle qui travaille dans les coulisses) répond vocalement. Pour le moment, une “troupe” d'environ 50 agents traite les requêtes en transcrivant les enregistrements vocaux, en recherchant des réponses en ligne en plusieurs langues, en traduisant les informations et en les renvoyant à l'appelant en swahili.

Au cours du projet pilote mené dans la capitale kényane Nairobi et dans l'ouest du Kenya, quelque 600 utilisateurs bêta ont posé des questions concernant leurs représentants locaux, demandant de l'aide pour leurs devoirs en swahili et ont demandé des informations médicales trop délicates pour être posées en personne.

Au cours du projet pilote d'Uliza, voici les mots inclus dans les questions les plus fréquemment posées par les utilisateurs (traduit du swahili en anglais).

L'interface Uliza va résoudre un autre problème pour ses futurs utilisateurs : le manque d'accès à l'information hébergée sur Internet. Il existe de nombreuses raisons qui se chevauchent : des volumes de données portables inabordables, la distance jusqu'au cybercafé le plus proche, l'analphabétisme dans les langues de communication les plus répandues, aggravés par l'indisponibilité de contenus dans les langues locales.

Il ne s'agit pas d'un problème de technologie

Le modèle de crowdsourcing d'Uliza est certes très exigeant en main-d'œuvre, mais il a un avantage majeur : en traitant les transcriptions et les traductions par des êtres humains, il contourne temporairement l'absence de grands volumes de données vocales qui limitent généralement les efforts pour la reconnaissance vocale dans les langues africaines, tout en collectant des données simultanément de locuteurs réels dans une variété d’accents et dialectes. Le fondateur d'Uliza, Grant Bridgman, prévoit d'utiliser cette base de données de courts enregistrements et transcriptions pour construire une machine pour l'apprentissage ainsi que pour l'automatisation entière du système à l'avenir. Dans ce discours à l'université de Tufts, Bridgman a présenté le concept à la base du projet :

Une bonne quantité de recherches a déjà été consacrée à la mise au point d'un logiciel automatique de reconnaissance vocale pour le swahili et d'autres langues africaines très répandues, mais il faut un certain temps pour que la technologie trouve son chemin pour arriver jusqu'aux utilisateurs. Dans un entretien avec Global Voices, Bridgman a expliqué:

La technologie existe et tout ceci est déjà disponible pour les langues du premier monde, maintenant nous devons trouver un modèle commercial pour le rendre viable pour les langages à faible ressources.

Les entreprises qui cherchent à créer à moindre coût des lignes d'assistance pour une clientèle rurale sont des clientes potentielles pour la phase initiale de la croissance d'Uliza. Finalement, un service complet permettant aux utilisateurs de téléphones portables sans accès à Internet de trouver des réponses à leurs questions et de télécharger leurs propres contenus vocaux sera mis en œuvre. Le coût pour l'utilisateur serait minimal – proche du prix d'un SMS.

Le modèle d'Uliza pourrait être viable pour d'autres langues avec un assez grand nombre de locuteurs. Mais pour la grande majorité des 2 000 langues parlées sur le continent africain, ce n'est pas le cas. Cependant, des solutions pourraient provenir d'un projet de recherche mené par Preethi Jyothi à l'Institut Beckman, où une équipe de scientifiques a utilisé une méthode probabiliste pour les transcriptions crowdsourcées de non-locuteurs natifs. Une fois peaufinée, la transcription probabiliste pourrait ouvrir la voie de la reconnaissance vocale pour les langues moins représentées, espérons-le à un coût raisonnable.

Commentez

Merci de... S'identifier »

Règles de modération des commentaires

  • Tous les commentaires sont modérés. N'envoyez pas plus d'une fois votre commentaire. Il pourrait être pris pour un spam par notre anti-virus.
  • Traitez les autres avec respect. Les commentaires contenant des incitations à la haine, des obscénités et des attaques nominatives contre des personnes ne seront pas approuvés.