Le cas des grands modèles de langage locaux

The Case of Homegrown Large Language Models


La plupart des LLM notables maîtrisent les langues largement parlées telles que l’anglais, mais ne couvrent pas la diversité linguistique qui peut servir efficacement les nuances culturelles et régionales mondiales.

chugh_case_homegrown_large_language_models_1 Le cas des grands modèles de langage locaux Intelligence artificielle
Image par auteur

Construire des LLM locaux est une étape technologique importante et mérite son mérite. Avant tout, cela crée un précédent pour que chacun fasse partie de cette transformation numérique, ce qui est gagnant-gagnant pour les deux – en permettant une plus grande portée auprès des clients et en permettant aux entreprises d’étendre leur portée, de se connecter et de servir des bases de clients diverses à travers le monde. .

L’IA trouve des cas d’utilisation attrayants dans de nombreuses applications tout en gérant la surcharge cognitive, en facilitant l’accès à l’information et en améliorant l’expérience client.

Les LLM formés sur une diffusion linguistique diversifiée couvrent les trois domaines, offrant un accès facile et rapide à l’information. Une telle facilitation de la connaissance à portée de main peut aider de nombreuses communautés locales à obtenir l’aide et le soutien indispensables pour résoudre leurs demandes.

Même si nous avons parcouru de nombreux points en faveur de la construction de tels modèles, il est tout aussi important de souligner que le développement de tels modèles nécessite un accès aux données dans les langues locales. Inutile de dire que cela peut paraître difficile au premier abord, mais ce n’est pas irréalisable.

En fait, cela devient rapidement une aubaine pour les communautés locales sous la forme d’étiquetage des données (plus d’informations à ce sujet dans la section suivante), lorsque les processus de collecte de données sont construits efficacement à grande échelle.

chugh_case_homegrown_large_language_models_2 Le cas des grands modèles de langage locaux Intelligence artificielle chugh_case_homegrown_large_language_models_2 Le cas des grands modèles de langage locaux Intelligence artificielle
Image par auteur

De plus, le développement de LLM nécessite une infrastructure informatique haute performance, telle que des GPU et des services de cloud computing, qui sont coûteux et nécessitent un sponsor/partenaire pour fournir un soutien financier.

Inévitablement, le succès de toute nation dépend de la construction de puces moins chères et plus économes en énergie pour construire la prochaine génération de modèles d’IA. Il a également besoin d’un financement accru en R&D pour faciliter la création d’une plate-forme permettant aux cerveaux de se rassembler grâce à une collaboration approfondie entre le monde universitaire, l’industrie et le gouvernement.

Les données ne sont plus le nouveau pétrole, mais celles qui savent comment traiter des ensembles de données aussi volumineux, augmentant ainsi le besoin de puces économes en énergie.

Outre les logiciels, le développement de modèles formés dans les langues locales nécessite de financer la R&D dans les technologies de pointe et de renforcer l’autosuffisance en matière de matériel. De plus, les grands modèles dépendent fortement des centres de données qui nécessitent une puissance importante, ce qui augmente le besoin de puces économes en énergie.

Cela donne un sentiment d’unité dans lequel nous incluons tout le monde pour faire partie de cette percée technologique et, ce faisant, ils peuvent également faire partie de ce monde numérique, à savoir les données, de sorte que la prochaine vague de nouveaux modèles les inclut également, résolvant le cas de fausse déclaration à l’avenir.

Les LLM formés dans les langues locales domineraient non seulement les données, mais joueraient également un rôle important dans la promotion de diverses cultures.

Même si la plupart pensent que les LLM pourraient avoir un impact négatif sur le secteur de l’emploi, ils présentent également un côté positif. C’est une situation gagnant-gagnant car elle offre des opportunités d’emploi aux développeurs de technologies ainsi qu’à l’ensemble des participants à l’ensemble de la chaîne de valeur d’une telle pile technologique.

De plus, supprimer les obstacles à la manière dont les non-anglophones peuvent utiliser la technologie peut conduire à améliorer leur vie de manière significative. Cela peut ouvrir la porte à des opportunités et faire d’eux des participants actifs à la manière dont le monde fonctionne aujourd’hui.

Davantage d’emplois seront créés. À première vue, la création de données diversifiées peut sembler un défi pour certains. Pourtant, une fois réalisé efficacement à grande échelle, cela peut rapidement devenir une opportunité d’offrir des opportunités salariales aux contributeurs. Les communautés locales peuvent participer à de telles initiatives de génération de données et participer à cette révolution au niveau fondamental tout en étant reconnues pour leur rôle sous forme de salaires et de redevances pour leur contribution.

L’accès au savoir constitue le principal levier, et la numérisation constitue un facteur d’égalisation important. Le ratio « soutien des enseignants, des avocats et des médecins » par rapport à la « population » serait faible dans les pays en développement par rapport aux pays développés, ce qui met clairement en évidence l’écart qui peut être efficacement comblé par des applications aidant les clients à résoudre les problèmes dès les premiers stades ou à recevoir des conseils. aux prochaines étapes. Cela devient réalisable si l’utilisateur est à l’aise avec le langage conversationnel des chatbots basés sur l’IA.

chugh_case_homegrown_large_language_models_3 Le cas des grands modèles de langage locaux Intelligence artificielle chugh_case_homegrown_large_language_models_3 Le cas des grands modèles de langage locaux Intelligence artificielle
Image par auteur

Pensez à des secteurs comme l’agriculture où les LLM peuvent aider les agriculteurs sans aucune barrière linguistique. Les agriculteurs peuvent obtenir des conseils sur les meilleures pratiques d’irrigation et améliorer l’utilisation efficace de l’eau.

Prenons un autre exemple du secteur de la santé. Comprendre les termes complexes spécifiques à un domaine dans ces polices d’assurance est un défi pour nous tous. Ouvrir un chatbot capable de tirer parti de son style de tutorat adaptatif pour éduquer toutes les communautés dans la langue qu’elles comprennent constitue un gros effort pour instaurer la parité.

Les modèles d’IA qui incluent des langages variés contribuent à réduire la fracture numérique et à mettre tout le monde à la portée des opportunités offertes par de telles avancées technologiques. Plus important encore, une telle inclusivité met l’accent, indispensable, sur les sections marginalisées et fait d’elles des acteurs clés de ce changement révolutionnaire. Il tient compte des considérations éthiques en offrant également un accès équitable aux groupes locaux.

Vidhi Chugh est un stratège en IA et un leader de la transformation numérique travaillant à l’intersection des produits, des sciences et de l’ingénierie pour créer des systèmes d’apprentissage automatique évolutifs. Elle est une leader de l’innovation primée, une auteure et une conférencière internationale. Elle a pour mission de démocratiser l’apprentissage automatique et de briser le jargon pour que chacun fasse partie de cette transformation.



Source link