Google Translate ajoute 110 langues dans sa plus grande expansion à ce jour

Google Translate ajoute 110 langues dans sa plus grande expansion à ce jour

Assistance en traduction pour plus d’un demi-milliard de personnes

Des langues comme le cantonais et le qʼeqchiʼ rejoignent désormais Google Translate, représentant plus de 614 millions de locuteurs, soit environ 8 % de la population mondiale. Certaines de ces langues sont parlées par des centaines de millions de personnes, tandis que d’autres sont utilisées par de petites communautés autochtones ou sont en cours de revitalisation. Environ un quart des nouvelles langues ajoutées proviennent d’Afrique, marquant notre plus grande expansion de langues africaines à ce jour, avec des ajouts tels que le fon, le kikongo, le luo, le ga, le swati, le venda et le wolof.

Voici quelques-unes des langues nouvellement prises en charge dans Google Translate :

  • Au loin est une langue tonale parlée à Djibouti, en Érythrée et en Éthiopie. Elle a bénéficié du plus grand nombre de contributions bénévoles de la communauté parmi les nouvelles langues ajoutées.
  • Cantonais est l’une des langues les plus demandées pour Google Translate. La recherche de données et l’entraînement des modèles sont compliqués par son chevauchement avec le mandarin dans l’écriture.
  • Mannois est la langue celtique de l’île de Man. Bien qu’elle ait failli disparaître en 1974 avec la mort de son dernier locuteur natif, un mouvement de renouveau a permis à des milliers de personnes de la parler aujourd’hui.
  • NKo est une forme standardisée des langues mandingues d’Afrique de l’Ouest, unifiant de nombreux dialectes. Son alphabet unique, inventé en 1949, est soutenu par une communauté de recherche active.
  • Pendjabi (Shahmukhi) est la variante du pendjabi écrite en écriture perso-arabe (Shahmukhi), la langue la plus parlée au Pakistan.
  • Tamazight (Amazigh) est une langue berbère parlée en Afrique du Nord. Bien qu’il existe de nombreux dialectes, la forme écrite est généralement compréhensible de manière mutuelle et est prise en charge en écritures latine et Tifinagh par Google Translate.
  • Tok Pisin est un créole basé sur l’anglais, utilisé comme lingua franca en Papouasie-Nouvelle-Guinée. Les anglophones peuvent essayer de traduire en Tok Pisin et en comprendre le sens.

Comment nous choisissons les variétés linguistiques

De nombreux facteurs sont pris en compte lors de l’ajout de nouvelles langues à Google Translate, des variétés que nous proposons aux orthographes spécifiques que nous utilisons.

Les langues présentent une immense variation : variétés régionales, dialectes, normes orthographiques différentes. De nombreuses langues n’ont pas de forme standard unique, il est donc impossible de choisir la « bonne » variété. Nous privilégions les variétés les plus couramment utilisées. Par exemple, pour le romani, nos modèles produisent un texte proche du romani vallax du sud, tout en intégrant des éléments d’autres dialectes comme le Vlax du Nord et le romani des Balkans.

PaLM 2 a joué un rôle crucial, aidant Translate à apprendre plus efficacement des langues étroitement liées, comme l’Awadhi et le Marwadi proches de l’hindi, et les créoles français comme le créole seychellois et le créole mauricien. Avec les avancées technologiques et la collaboration continue avec des linguistes et des locuteurs natifs, nous prendrons en charge encore plus de variétés linguistiques et de conventions orthographiques à l’avenir.

Visitez le Centre d’aide pour en savoir plus sur ces langues nouvellement prises en charge. Commencez à traduire sur translate.google.com ou sur l’application Google Translate sur Android et iOS.

Source