Image par auteur
Il devient de plus en plus important de maîtriser le MLOps (Machine Learning Operations) pour ceux qui souhaitent déployer, surveiller et maintenir efficacement leurs modèles ML en production. MLOps est un ensemble de pratiques qui visent à fusionner le développement du système ML (Dev) et l’exploitation du système ML (Ops). Heureusement, la communauté open source a créé de nombreuses ressources pour aider les débutants à maîtriser ces concepts et outils.
Voici dix référentiels GitHub essentiels pour quiconque cherche à maîtriser le MLOps :
Lien GitHub : gravure/MLOps-Bases
Il s’agit d’un plan d’étude de 9 semaines conçu pour vous aider à maîtriser divers concepts et outils liés à la surveillance des modèles, aux configurations, à la gestion des versions des données, au packaging de modèles, à Docker, aux actions GitHub et au cloud AWS. Vous apprendrez à construire un projet MLOps de bout en bout et chaque semaine vous vous concentrerez sur un sujet spécifique pour vous aider à atteindre cet objectif.
Lien GitHub : Microsoft/MLOps
Le référentiel fournit des exemples et des solutions MLOps de bout en bout. Une collection d’exemples montrant différents scénarios de bout en bout opérationnalisant les workflows ML avec Azure Machine Learning, intégrés à GitHub et à d’autres services Azure tels que Data Factory et DevOps.
Lien GitHub : GokuMohandas/Made-With-ML
Si vous recherchez des exemples et des solutions MLOps de bout en bout, ce référentiel est là pour vous. Il contient une collection diversifiée de scénarios qui montrent comment opérationnaliser les workflows de ML à l’aide d’Azure Machine Learning. De plus, il est intégré à d’autres services Azure tels que Data Factory et DevOps, ainsi qu’à GitHub.
Lien GitHub : Pythondeveloper6/Awesome-MLOPS
Le référentiel contient des liens vers diverses ressources gratuites disponibles en ligne pour MLOps. Ces ressources comprennent des vidéos YouTube, des feuilles de route de carrière, des comptes LinkedIn à suivre, des livres, des blogs, des cours gratuits et payants, des communautés, des projets et des outils. Vous pouvez trouver presque tout ce qui concerne MLOps en un seul endroit, donc au lieu de rechercher diverses choses en ligne, vous pouvez simplement visiter le référentiel et apprendre.
Lien GitHub : mlops-guide/mlops-guide.github.io
Le référentiel vous mènera à un site statique hébergé sur GitHub qui aidera les projets et les entreprises à créer un environnement MLOps plus fiable. Il couvre les principes des MLOP, les guides de mise en œuvre et le flux de travail du projet.
Lien GitHub : kelvins/géniaux-mlops
Le référentiel contient une liste d’outils MLOps qui peuvent être utilisés pour AutoML, CI/CD pour l’apprentissage automatique, la surveillance des tâches Cron, le catalogue de données, l’enrichissement des données, l’exploration des données, la gestion des données, le traitement des données, la validation des données, la visualisation des données, la détection de dérive, Ingénierie des fonctionnalités, magasin de fonctionnalités, réglage des hyperparamètres, partage des connaissances, plate-forme d’apprentissage automatique, équité et confidentialité des modèles, interprétabilité des modèles, cycle de vie des modèles, service de modèles, tests et validation de modèles, outils d’optimisation, outils de simplification, analyse visuelle et débogage.
Lien GitHub : ShaftNicki/dtu_mlops
Ceci est un référentiel pour le DTU cours 02476, qui comprend des exercices et du matériel supplémentaire pour le cours sur les opérations d’apprentissage automatique. Le cours s’étend sur trois semaines et couvre des sujets tels que les pratiques de développement, la reproductibilité, l’automatisation, les services cloud, le déploiement et des sujets avancés tels que la surveillance et la mise à l’échelle des applications d’apprentissage automatique.
Lien GitHub : GokuMohandas/mlops-cours
Le cours se concentre sur l’enseignement aux étudiants sur la conception, le développement, le déploiement et l’itération sur des applications ML de production en utilisant les meilleures pratiques, la mise à l’échelle des charges de travail ML, l’intégration de composants MLOps et la création de flux de travail CI/CD pour une amélioration continue et un déploiement transparent.
Lien GitHub : DataTalksClub/mlops-zoomcamp
Un de mes cours préférés pour apprendre un nouveau concept en construisant un projet. Le cours MLOps de DataTalks.Club enseigne les aspects pratiques de la mise en production des services d’apprentissage automatique, de la formation et de l’expérimentation au déploiement et à la surveillance de modèles. Il est conçu pour les data scientists, les ingénieurs ML, les ingénieurs logiciels et les ingénieurs de données qui souhaitent apprendre à opérationnaliser les flux de travail d’apprentissage automatique.
Lien GitHub : featurestoreorg/serverless-ml-course
Ce cours se concentre sur le développement de systèmes complets d’apprentissage automatique avec des capacités sans serveur. Il permet aux développeurs de créer des services prédictifs sans nécessiter d’expertise en Kubernetes ou en cloud computing. Ils peuvent le faire en écrivant des programmes Python et en utilisant des fonctionnalités sans serveur, des pipelines d’inférence, des magasins de fonctionnalités et des registres de modèles.
La maîtrise du MLOps est essentielle pour garantir la fiabilité, l’évolutivité et l’efficacité des projets de machine learning en production. Les référentiels répertoriés ci-dessus offrent une richesse de connaissances, d’exemples pratiques et d’outils essentiels pour vous aider à comprendre et à appliquer efficacement les principes MLOps. Que vous soyez un débutant souhaitant débuter ou un praticien expérimenté souhaitant approfondir ses connaissances, ces ressources fournissent des informations et des conseils précieux sur votre parcours vers la maîtrise du MLOps.
Veuillez consulter la plateforme d’apprentissage de l’IA appelée Travis, qui peut vous aider à maîtriser MLOps et ses concepts plus rapidement. Travis génère des explications sur le sujet et vous pouvez poser des questions de suivi. De plus, vous pouvez effectuer vos propres recherches car il fournit des liens vers des blogs et des tutoriels publiés par les meilleures publications sur Medium, Substacks, des blogs indépendants, de la documentation officielle et des livres.
Abid Ali Awan (@1abidaliawan) est un professionnel certifié en data scientist qui adore créer des modèles d’apprentissage automatique. Actuellement, il se concentre sur la création de contenu et rédige des blogs techniques sur les technologies d’apprentissage automatique et de science des données. Abid est titulaire d’une maîtrise en gestion technologique et d’un baccalauréat en ingénierie des télécommunications. Sa vision est de créer un produit d’IA utilisant un réseau neuronal graphique pour les étudiants aux prises avec une maladie mentale.