Image de l’éditeur | Idéogramme
L’analyse des séries chronologiques consiste à étudier des points de données collectés au fil du temps pour identifier des tendances et des modèles. Cette méthode est précieuse dans des domaines tels que l’économie, la finance et les sciences de l’environnement. R est un outil populaire pour réaliser des analyses de séries chronologiques grâce à ses puissants packages et fonctions. Cet article explore comment effectuer une analyse de séries chronologiques avec R.
Nos 5 meilleures recommandations de cours gratuits
1. Certificat de cybersécurité Google – Accédez rapidement à une carrière dans la cybersécurité.
2. Traitement du langage naturel dans TensorFlow – Construire des systèmes PNL.
3. Python pour tout le monde – Développer des programmes pour collecter, nettoyer, analyser et visualiser les données.
4. Certificat professionnel d’assistance informatique Google
5. Architecte de solutions cloud AWS – Certificat Professionnel.
Charger les bibliothèques
La première étape de l’analyse des séries chronologiques dans R consiste à charger les bibliothèques nécessaires. La bibliothèque ‘forecast’ fournit des fonctions pour la prévision de séries chronologiques, tandis que la bibliothèque ‘tseries’ propose des tests statistiques et des outils d’analyse de séries chronologiques.
library(forecast)
library(tseries)
Importer des données de séries chronologiques
Importez les données de séries chronologiques d’un fichier CSV dans R. Dans cet exemple, nous utilisons un ensemble de données utilisé pour l’analyse financière, qui suit l’évolution des prix au fil du temps.
data <- read.csv("timeseries.csv", header = TRUE)
head(data)
Créer un objet de série chronologique
Convertissez les données en un objet de série chronologique à l’aide de la fonction ‘ts’. Cette fonction convertit vos données dans un format de série chronologique.
ts_data <- ts(data$Price)
Tracer la série chronologique
Visualisez les données de la série chronologique pour identifier les tendances, la saisonnalité et les anomalies. Les tendances montrent des augmentations ou des diminutions à long terme des données, la saisonnalité révèle des modèles réguliers qui se répètent à intervalles fixes, et les anomalies mettent en évidence des valeurs inhabituelles qui se démarquent du modèle normal.
Modèles ARIMA
Le modèle ARIMA est utilisé pour prévoir les données de séries chronologiques. Il combine trois composants : l'autorégression (AR), la différenciation (I) et la moyenne mobile (MA). La fonction 'auto.arima' sélectionne automatiquement le meilleur modèle ARIMA en fonction des données.
fit <- auto.arima(ts_data)
Fonction d'autocorrélation (ACF)
La fonction d'autocorrélation (ACF) mesure la manière dont une série chronologique est corrélée à ses valeurs passées, aidant à identifier les modèles et les retards dans les données. Le tracé ACF permet de déterminer l'ordre de la moyenne mobile (MA) ('q').
Fonction d'autocorrélation partielle (PACF)
La fonction d'autocorrélation partielle (PACF) mesure la corrélation d'une série chronologique avec ses valeurs passées en excluant les effets des décalages intermédiaires. Le tracé PACF permet d'identifier l'ordre auto-régressif (AR) ('p').
Test de Ljung-Box
Le test de Ljung-Box vérifie l'autocorrélation dans les résidus d'un modèle de série chronologique pour tester si les résidus sont aléatoires. Une valeur p faible suggère une autocorrélation significative, indiquant que le modèle pourrait ne pas convenir.
Box.test(fit$residuals, lag = 20, type = "Ljung-Box")
Analyse résiduelle
L'analyse résiduelle examine les différences entre les valeurs observées et prédites à partir d'un modèle de série chronologique pour vérifier si le modèle correspond bien aux données.
plot(fit$residuals, main="Residuals of ARIMA Model", ylab="Residuals")
abline(h=0, col="red")
Prévision
La prévision consiste à prédire les valeurs futures sur la base de données historiques. Utilisez la fonction 'forecast' pour générer ces prédictions.
forecast_result <- forecast(fit)
Visualisation des prévisions
Visualisez les valeurs prévues avec les données historiques pour les comparer. La fonction 'autoplot' aide à créer ces visualisations.
autoplot(forecast_result)
Précision du modèle
Évaluez la précision du modèle ajusté à l’aide de la fonction 'accuracy'. Elle fournit des mesures de performances telles que l'erreur absolue moyenne (MAE) et l'erreur quadratique moyenne (RMSE).
Conclusion
L'analyse des séries chronologiques dans R commence par charger des données et créer des objets de séries chronologiques. Ensuite, effectuez une analyse exploratoire pour trouver des tendances et des modèles. Ajustez les modèles ARIMA pour prévoir les valeurs futures. Diagnostiquez les modèles et visualisez les résultats. Ce processus permet de prendre des décisions éclairées à l’aide de données historiques.
Jayita Gulati est une passionnée d'apprentissage automatique et une rédactrice technique motivée par sa passion pour la création de modèles d'apprentissage automatique. Elle est titulaire d'une maîtrise en informatique de l'Université de Liverpool.