10 ressources gratuites pour apprendre les LLM

10 ressources gratuites pour apprendre les LLM.

free-llm-resources 10 ressources gratuites pour apprendre les LLM NEWS

Image par auteur

Dans un article précédent, j’ai expliqué comment L’IA est la compétence du futur avec des rôles offrant des salaires allant jusqu’à 375 000 $ par an.

Les grands modèles linguistiques (LLM) sont devenus un pilier central de l’IA, et presque tous les rôles centrés sur les données nécessitent désormais une compréhension fondamentale de ces algorithmes.

Que vous soyez un développeur cherchant à élargir vos compétences, un praticien des données ou un professionnel souhaitant faire la transition vers le domaine de l’IA, il est essentiel de se familiariser avec les LLM sur le marché du travail actuel.

Dans cet article, je vais vous présenter 10 ressources gratuites pour approfondir vos connaissances sur les grands modèles linguistiques.

1. Introduction aux grands modèles de langage par Andrej Karpathy

Si vous êtes un débutant complet dans le domaine de l’IA, je vous recommande de commencer par ce tutoriel YouTube d’une heure qui explique le fonctionnement des LLM.

À la fin de cette vidéo, vous comprendrez le fonctionnement des LLM, les lois de mise à l’échelle des LLM, le réglage fin des modèles, la multimodalité et la personnalisation des LLM.

2. GenAI pour les débutants par Microsoft

IA générative pour les débutants est un cours de 18 leçons qui vous apprendra tout ce que vous devez savoir sur la création d’applications d’IA générative.

Le cours commence par les bases : vous serez d’abord introduit au concept d’IA générative et de LLM, puis vous progresserez vers des sujets tels que l’ingénierie rapide et la sélection de LLM.

Ensuite, vous apprendrez à créer des applications basées sur LLM à l’aide d’outils low-code, de RAG et d’agents IA.

Le cours vous apprendra également à affiner les LLM et à sécuriser vos applications LLM.

Vous êtes libre de sauter des modules et de sélectionner les leçons les plus pertinentes par rapport à vos objectifs d’apprentissage.

3. GenAI avec les LLM de Deeplearning.AI

IA générative avec LLM est un cours sur les modèles linguistiques qui prendra environ 3 semaines d’études à temps plein.

Cette ressource d’apprentissage couvre les bases des LLM, de l’architecture des transformateurs et de l’ingénierie rapide.

Vous apprendrez également à affiner, optimiser et déployer des modèles de langage sur AWS.

4. Cours de PNL « Câlins du visage »

Hugging Face est une société leader en PNL qui fournit des bibliothèques et des modèles permettant de créer des applications d’apprentissage automatique. Ils permettent aux utilisateurs quotidiens de créer facilement des applications d’IA.

Piste d’apprentissage PNL de Hugging Face couvre l’architecture du transformateur, le fonctionnement des LLM et les bibliothèques d’ensembles de données et de tokenizer disponibles au sein de leur écosystème.

Vous apprendrez à affiner les ensembles de données et à effectuer des tâches telles que le résumé de texte, la réponse aux questions et la traduction à l’aide de la bibliothèque Transformers et du pipeline de Hugging Face.

5. Université LLM par Cohere

Université LLM est une plateforme d’apprentissage qui couvre les concepts liés à la PNL et aux LLM.

Semblable aux cours précédents de cette liste, vous commencerez par découvrir les bases des LLM et leur architecture, puis progresserez vers des concepts plus avancés tels que l’ingénierie rapide, le réglage fin et les RAG.

Si vous avez déjà des connaissances en PNL, vous pouvez simplement ignorer les modules de base et suivre les didacticiels plus avancés.

6. IA générative fondamentale par iNeuron

IA générative fondamentale est un cours gratuit de 2 semaines qui couvre les bases de l’IA générative, de Langchain, des bases de données vectorielles, des modèles de langage open source et du déploiement LLM.

Chaque module prend environ deux heures et il est recommandé de terminer chaque module en une journée.

À la fin de ce cours, vous apprendrez à mettre en œuvre un chatbot médical de bout en bout à l’aide d’un modèle de langage.

7. Traitement du langage naturel par Krish Naik

Cette playlist PNL sur YouTube couvre des concepts tels que la tokenisation, le prétraitement de texte, les RNNS et les LSTM.

Ces sujets sont des conditions préalables pour comprendre le fonctionnement actuel des grands modèles de langage.

Après avoir suivi ce cours, vous comprendrez les différentes techniques de traitement de texte qui constituent l’épine dorsale de la PNL.

Vous comprendrez également le fonctionnement des modèles PNL séquentiels et les défis rencontrés lors de leur mise en œuvre, ce qui a finalement conduit au développement de LLM plus avancés comme la série GPT.

Ressources d’apprentissage LLM supplémentaires

Voici quelques ressources supplémentaires pour apprendre les LLM :

1. Papiers avec code

Papiers avec code est une plate-forme qui combine des documents de recherche en ML avec du code, ce qui vous permet de vous tenir plus facilement au courant des derniers développements dans le domaine ainsi que des applications pratiques.

2. L’attention est tout ce dont vous avez besoin

Pour mieux comprendre l’architecture du transformateur (le fondement des modèles de langage de pointe comme BERT et GPT), je vous recommande de lire le document de recherche intitulé « L’attention est tout ce dont vous avez besoin ».

Cela vous permettra de mieux comprendre le fonctionnement des LLM et pourquoi les modèles basés sur des transformateurs fonctionnent nettement mieux que les modèles de pointe précédents.

3. LLM-PowerHouse

C’est un Dépôt GitHub qui organise des didacticiels LLM, les meilleures pratiques et le code.

Il s’agit d’un guide complet du modèle de langage — avec des explications détaillées de l’architecture LLM, des didacticiels sur le réglage et le déploiement du modèle, ainsi que des extraits de code qui peuvent être utilisés directement dans vos propres applications LLM.

10 ressources gratuites pour apprendre les LLM – Points clés à retenir

Il existe une multitude de ressources disponibles pour apprendre les LLM, et j’ai compilé les plus utiles dans cet article.

La plupart des supports d’apprentissage cités dans cet article nécessitent des connaissances en codage et en apprentissage automatique. Si vous n’avez pas d’expérience dans ces domaines, je vous recommande de consulter les ressources suivantes :

 
 

Natasha Selvaraj est une data scientist autodidacte passionnée par l’écriture. Natassha écrit sur tout ce qui concerne la science des données, une véritable maîtrise de tous les sujets liés aux données. Vous pouvez la contacter sur LinkedIn ou regarder sa Chaîne YouTube.

Source