Objectifs de la formation
R est un logiciel open source dans le domaine des statistiques disponible sur toutes les plateformes. Il propose toutes les fonctions utiles pour la statistique courante ainsi que de nombreuses extensions (paquets). Cette formation Logiciel R vous apprend à programmer avec R ainsi qu’avec les extensions proposées (paquets)
À l’issue de cette formation Logiciel R, vous aurez acquis les compétences et connaissances nécessaires pour :
- Installer et utiliser l’environnement R
- Manipuler des données et des objets
- Programmer avec R
- Appliquer des méthodes d’analyses statistiques courantes
À qui s’adresse cette formation ?
Public :
Ce cours s’adresse à tout développeur en environnement statistique et aux personnes voulant découvrir le datamining et l’appliquer.
Prérequis :
Pour suivre cette formation, il est demandé d’avoir des connaissances de base en statistiques (régression linéaire, échantillonnage) ainsi que des connaissances de base en programmation (variables, boucles, etc.).
Contenu du cours
Présentation du logiciel R
Introduction au logiciel R
Découvrir le langage R
Le langage R et la concurrence
Mettre en oeuvre le téléchargement et l’installationPremière prise en main du logiciel R
Les Objets
Les Vecteurs
Les Tableaux
Les Listes
Les Matrices
Les Data Frames
Les Tables de contingencesLes Fonctions et programmation R
Fonctions mathématiques
Fonction de manipulation des objets
Opérations ensemblistes
Fonctions dates et chaînesGénération, gestion et visualisation des données
Analyses statistiques
Régressions linéaires
Analyse en composante principale (ACP)
Classification ascendante hiérarchiqueBilan
Objectifs de la formation
Cette formation Logiciel R Perfectionnement propose de vous transmettre le savoir-faire d’un développeur R professionnel au niveau de son organisation (à tous les niveaux des bonnes pratiques) et de ses choix techniques. Concrètement, la formation suit le « scénario idéal » qu’il faudrait mettre en œuvre pour livrer le plus rapidement possible un programme efficace et facile à maintenir.
À l’issue de cette formation, vous aurez acquis les connaissances et les compétences nécessaires pour :
- Savoir organiser son environnement de travail pour fluidifier son processus d’analyse
- Connaître les packages utilisés dans la plupart des projets professionnels
- Savoir utiliser les bonnes structures de données pour les manipuler efficacement
- Savoir visualiser de façon élégante et rapide les données
- Maîtriser la manipulation des données avec les package dplyr, forecast, stringr, lubridate, etc.
- Savoir assembler les données (jointure)
- Savoir représenter graphiquement les données avec le package ggplot2
- Savoir générer dynamiquement son rapport d’analyse avec rmarkdown
- Comprendre la programmation fonctionnelle (purrr)
À qui s’adresse cette formation ?
Public :
Ce cours Logiciel R perfectionnement cible les utilisateurs du logiciel R qui souhaitent approfondir leurs connaissances et maîtriser les bonnes pratiques du logiciel R.
Prérequis :
Pour suivre cette formation Logiciel R Perfectionnement, il est important d’avoir des connaissances de base sur le logiciel R : création et manipulation des objets sous R, importation des données, utilisation simple de R en mode console, création de graphiques simples.
Contenu du cours
Organiser son travail sous R
Travailler en projet R : notion de working directory, workspace, history
Architecture de son projet R : data, plots, images, scripts, etc..
Bonnes pratiques pour la création de fichiers de données
Importation et exportation de fichiers avec le package here
Mettre à jour ses packages
Mettre à jour R et R StudioManipuler facilement ses données avec le package dplyr
Introduction au package tidyverse et à la notion de pipe
Filtrer des lignes avec la fonction filter()
Sélectionner des colonnes (variable) avec la fonction select()
Création de nouvelles variables avec la fonction mutate()
Renommer ses variables avec la fonction rename()
Calcul de paramètres par sous-groupes : fonctions group_by() et summarise()
Passage du format wide au format longExercices
Manipulation des variables catégorielles avec le package forecats
Inspecter les variables catégorielles avec les fonctions levels(), fct_count et fct_unique
Modifier l’ordre des modalités
Modifier le nom des modalitésExercices
Manipuler les chaînes de caractères avec le package stringr
Détection de patterns
Découpage
Gestion des longueurs
RemplacementExercices
Manipuler des données de date : utilisation du package lubridate
Convertir les données au format YYYY-MM-DD et HH:MM:SS
Décomposer les éléments d’année, de mois et de jour
Calculer des différences de dates et les exprimer en jours, ou heuresExercices
Assemblage de tables
Les différentes jointures (par colonne): left join, right join, inner join et full join
Assemblage par lignes
Exemple d’applications pour l’analyse de donnéesExercices
Réaliser des représentations graphiques performantes avec le package ggplot2
Le principe des couches successives de ggplot2
Réalisation des graphiques de base : scatterplot, barplots, line plot, boxplots
Gestion des couleurs, titres, axes et légendes
Représentation des séries temporelles
Utilisation du format long et facetting
Ajouter du texte sur un graphique (ex : équation)
Exporter son graphique : format et résolution
Utilisation des addins esquisse et Colour PickerGénérer dynamiquement son rapport d’analyse avec R Markdown
Principe, formats de sorties (html, docx, pdf)
Les différents éléments d’un fichier Rmd : en-tête, chunk, etc. . .
Gestion des éléments de texte : gras, italique, titre
Gestion des tables
Gestion des images
Gestion des graphiques
Gestion des options des éléments de code
Gestion de la table des matières et numérotation
Les rapports paramétrés : automatisation des rapports d’analyse par sous groupeIntroduction à la programmation fonctionnelle avec le package purrr
Les list
Les fonctions map()
Nested dataExercices
Objectifs de la formation
Cette formation Maîtriser le logiciel R vous apprend dans un premier temps à programmer avec R ainsi qu’avec les extensions proposées. Elle vous propose ensuite de vous transmettre le savoir-faire d’un développeur R professionnel au niveau de son organisation (à tous les niveaux des bonnes pratiques) et de ses choix techniques.
À l’issue de cette formation, vous aurez acquis les connaissances et les compétences nécessaires pour :
- Installer et utiliser l’environnement R
- Manipuler des données et des objets
- Programmer avec R
- Appliquer des méthodes d’analyses statistiques courantes
- Organiser son environnement de travail pour fluidifier son processus d’analyse
- Connaître les packages utilisés dans les projets professionnels
- Manipulaer des données avec les package dplyr, forecast, stringr, lubridate, etc.
- Assembler les données (jointure)
- Représenter graphiquement les données avec le package ggplot2
- Générer dynamiquement un rapport d’analyse avec rmarkdown
- Comprendre la programmation fonctionnelle (purrr)
À qui s’adresse cette formation ?
Public :
Ce cours Maîtriser le logiciel R s’adresse à tout développeur en environnement statistique ainsi qu’aux utilisateurs futurs du logiciel R, souhaitant tout à la fois le découvrir et en connaître les bonnes pratiques.
Prérequis :
Pour suivre cette formation Maîtriser le logiciel R, il est demandé d’avoir des connaissances préalables de base en statistiques (régression linéaire, échantillonnage) ainsi que des connaissances de base en programmation (variables, boucles, etc.)
Contenu du cours
Présentation du logiciel R
Introduction au logiciel R
Découvrir le langage R
Le langage R et la concurrence
Mettre en oeuvre le téléchargement et l’installationPremière prise en main du logiciel R
Les Objets
Les Vecteurs
Les Tableaux
Les Listes
Les Matrices
Les Data Frames
Les Tables de contingencesLes Fonctions et programmation R
Fonctions mathématiques
Fonction de manipulation des objets
Opérations ensemblistes
Fonctions dates et chaînesGénération, gestion et visualisation des données
Analyses statistiques
Régressions linéaires
Analyse en composante principale (ACP)
Classification ascendante hiérarchiqueOrganiser son travail sous R
Travailler en projet R : notion de working directory, workspace, history
Architecture de son projet R : data, plots, images, scripts, etc..
Bonnes pratiques pour la création de fichiers de données
Importation et exportation de fichiers avec le package here
Mettre à jour ses packages
Mettre à jour R et R StudioManipuler facilement ses données avec le package dplyr
Introduction au package tidyverse et à la notion de pipe
Filtrer des lignes avec la fonction filter()
Sélectionner des colonnes (variable) avec la fonction select()
Création de nouvelles variables avec la fonction mutate()
Renommer ses variables avec la fonction rename()
Calcul de paramètres par sous-groupes : fonctions group_by() et summarise()
Passage du format wide au format longExercices
Manipulation des variables catégorielles avec le package forecats
Inspecter les variables catégorielles avec les fonctions levels(), fct_count et fct_unique
Modifier l’ordre des modalités
Modifier le nom des modalitésExercices
Manipuler les chaînes de caractères avec le package stringr
Détection de patterns
Découpage
Gestion des longueurs
RemplacementExercices
Manipuler des données de date : utilisation du package lubridate
Convertir les données au format YYYY-MM-DD et HH:MM:SS
Décomposer les éléments d’année, de mois et de jour
Calculer des différences de dates et les exprimer en jours, ou heuresExercices
Assemblage de tables
Les différentes jointures (par colonne): left join, right join, inner join et full join
Assemblage par lignes
Exemple d’applications pour l’analyse de donnéesExercices
Réaliser des représentations graphiques performantes avec le package ggplot2
Le principe des couches successives de ggplot2
Réalisation des graphiques de base : scatterplot, barplots, line plot, boxplots
Gestion des couleurs, titres, axes et légendes
Représentation des séries temporelles
Utilisation du format long et facetting
Ajouter du texte sur un graphique (ex : équation)
Exporter son graphique : format et résolution
Utilisation des addins esquisse et Colour PickerGénérer dynamiquement son rapport d’analyse avec R Markdown
Principe, formats de sorties (html, docx, pdf)
Les différents éléments d’un fichier Rmd : en-tête, chunk, etc. . .
Gestion des éléments de texte : gras, italique, titre
Gestion des tables
Gestion des images
Gestion des graphiques
Gestion des options des éléments de code
Gestion de la table des matières et numérotation
Les rapports paramétrés : automatisation des rapports d’analyse par sous groupeIntroduction à la programmation fonctionnelle avec le package purrr
Les list
Les fonctions map()
Nested dataExercices
Objectifs de la formation
La Data Science avec R repose sur la maîtrise de techniques d’exploration de données fondamentales : statistiques descriptives, prédictives ou exploratoires.
Cette formation Logiciel R vous présentera les méthodes indispensables en Data Science sous RStudio.
À l’issue de cette formation, vous aurez acquis les connaissances et les compétences nécessaires pour :
- Savoir utiliser des méthodes d’exploration de données
- Comprendre le principe de la modélisation statistique
- Choisir entre la régression et la classification
Mettre en œuvre une évaluation des performances prédictives d’un modèle
À qui s’adresse cette formation ?
Public :
Cette formation Data Science avec R s’adresse aux responsables infocentres (Datamining, Marketing, Qualité…), aux utilisateurs et gestionnaires métiers de bases de données, ainsi qu’aux futurs Data Scientists.
Prérequis :
Pour suivre cette formation à la Data Science avec R, il est nécessaire d’avoir des connaissances de base du logiciel R ainsi qu’en statistiques
Contenu du cours
Rappels du langage R
Les types de données dans R
Importation et exportation de données
Techniques pour tracer des courbes et des graphiquesAnalyse en composantes
Analyse en composantes principales
Analyse factorielle des correspondances
Analyse des correspondances multiplesExercices
La modélisation
Les algorithmes supervisés et non supervisés
Le choix entre la régression et la classification
Les étapes de construction d’un modèleLes algorithmes non supervisés
Le clustering hiérarchique
Le clustering non hiérarchique
Les approches mixtesExercices
Les algorithmes supervisés
Le principe de régression linéaire univariée
La régression multivariée
La régression polynomiale
La régression logistique
Le Naive Bayes
L’arbre de décision
Les K plus proches voisinsExercices
Procédures d’évaluation de modèles
Les techniques de ré-échantillonnage en jeu d’apprentissage, de validation et de test
Mesures de performance des modèles prédictifs
Matrice de confusion, de coût et la courbe ROC et AUCExercices
Analyse de donnees textuelles
Quelques packages utiles
Cas de la régression linéaire multiple
Cas de l’analyse en composantes principales ACP
Cas de la classification CAHExercices
Objectifs de la formation
R est un logiciel statistique qui dispose d’outils graphiques de qualité pour présenter les données. Afin de bénéficier de cette richesse, il faut être capable de préparer ces données, de les transformer et de les exploiter avec R
À l’issue de cette formation, vous aurez acquis les connaissances et les compétences nécessaires pour :
- Constituer des jeux de données à analyser à partir de multiples sources
- Manipuler les données pour les transformer à partir de fonctions diverses
- Savoir construire des graphiques avec R
- Être capable de calculer des indicateurs statistiques
À qui s’adresse cette formation ?
Public :
Ce cours Manipulation de données avec R est destinée aux statisticiens, analystes, ingénieurs, développeurs, ainsi qu’à toute personne ayant à manipuler des données, à traiter numériquement et représenter graphiquement des données, ou encore à réaliser des statistiques sous R.
Prérequis :
Pour suivre cette formation sur la manipulation de données avec R, il est conseillé de posséder des connaissances de base du logiciel R.
Contenu du cours
Rappels des éléments de base de R
L’environnement RStudio
Les types de données dans R, les listes, les DataFrames, les facteurs et les variables
Principes algorithmiques avec les boucles, les structures conditionnelles et les fonctionsExercices
Importation et exportation de données
Lecture d’un jeu de données en mémoire
Lecture d’un fichier externe
Exporter et charger un fichierExercices
Manipulation de données avec R
Opérations logiques et relationnelles
Opérations sur les matrices ou les DataFrame
Les fonctions outer, apply, lapply, sapply et mapply
Manipulation de chaînes de caractères
Manipulation de dates et séries temporellesExercices
Construire des graphiques avec R
Les fenêtres graphiques
Les fonctions de tracé de bas niveau
Personnaliser des éléments graphiques
Type de graphique
Diagrammes empilés ou circulaire
Boîte à moustaches
Histogramme en densité à amplitudes de classes égales ou inégales
Polygone des fréquences
Représentations graphiques dans un cadre bivariéExercices
Statistique inférentielle
Mesures d’association
Notions sur la génération de nombres au hasard et de variable aléatoire
Loi de probabilité
Loi des grands nombres et théorème de la limite centrale
Intervalles de confiance
Tests d’hypothèses
Analyse de la variance à un facteur, deux facteursExercices
Objectifs de la formation
Dans R, les rapports dynamiques désignent des fichiers générés automatiquement (automatisés) écrits dans un format déterminé : R Markdown. Ce format, qui comprend des balises, permet d’inclure du texte, des commentaires, du code R ou encore les sorties de ces codes R.
À l’issue de cette formation, vous aurez acquis les connaissances et les compétences nécessaires pour :
- Produire de façon automatisée des documents de travail contenant du texte, du code R, et les sorties de ces codes R
- Inscrire ces documents dans une démarche de travail reproductible
Générer ces documents en format HTML, word ou PDF
À qui s’adresse cette formation ?
Public :
Ce cours cible les utilisateurs du logiciel R qui souhaitent apprendre à créer des rapports automatisés avec R.
Prérequis :
Pour suivre cette formation R Markdown & Bookdown, le participant doit avoir des connaissances de base sur le logiciel R : création et manipulation des objets sous R, importation des données, utilisation simple de R en mode console, création de graphiques simples…
Contenu du cours
Introduction à R Markdown
Programmation lettrée
Crise de la reproductibilité
Principe de R MarkdownScript R Markdown
Structure : en-tête, texte, chunk
Formats de sortie : html, word, pdf
Premier rapport dynamique : bouton knitGestion des éléments de texte
Formatage : gras, italique, insertion de ligne
Les listes : numérotées, non numérotées
Les titres et leur numérotation
La table des matièresExercices
Insertion d’éléments
Les images
Les tables
Les liens hypertexte
Les notes de bas de page
Les équations
Les références bibliographiquesExercices
Gestion du code R
Options d’affichage du code
Options d’affichage des sorties
Les graphiques
Les tables de données
Les options par défaut
Exercices
Amélioration des rendus simples
Ajouter un modèle Word
Options pour le pdf
Les modèles htmlExercices
Amélioration des rendus simples
Ajouter un modèle Word
Options pour le PDF
Les modèles HTMLExercices
Paramétrisation des scripts rmd (rapports répétés)
Principe
ExemplesExercices
Réalisation de documents contenant plusieurs chapitres
Principe du package bookdown
Les différents fichiers nécessaires
Compilation des chapitres
Les différents formats de sortie
Debuggage
Déploiement du document html sur https://bookdown.org/
Mise en application
Objectifs de la formation
Le framework R Shiny permet aux data scientists de communiquer leurs analyses au travers d’une application web dynamique et interactive écrite entièrement à partir de R, sans avoir besoin de connaître les langages HTML, CSS, ou JavaScript.
À l’issue de cette formation, vous aurez acquis les connaissances et les compétences nécessaires pour :
- Optimiser la performance de vos applications
- Personnaliser l’apparence de vos applications
À qui s’adresse cette formation ?
Public :
Ce cours R Shiny cible principalement les développeurs R et les administrateurs de déploiement.
Prérequis :
Pour suivre cette formation R Shiny, il est nécessaire d’avoir des bases de programmation avec R et de posséder une certaine culture sur l’analyse de données et la datavisualisation.
Contenu du cours
Introduction au framework R Shiny
Présentation du package shiny
Exemples d’applications
Présentation de Shiny Server Open Source
Installation et prise en mainCréer votre première application Shiny
Structure de base des fichiers
Outils de conception de l’interface
Les widgets disponibles et le package shinyWidgets
Créer des sorties graphiques
Règles de portée lexicaleConcevoir des applications professionnelles et performantes
Comprendre la réactivité en Shiny
Les fonctions de réactivité : reactive(), observe(), isolate(), …
Bonnes pratiques et cas d’usage
Mesurer la performance d’une application
Accélérer les traitements de données
Organisation d’un projet Shiny
Modularisation d’une applicationAméliorer l’apparence d’une applications
Présentation du langage CSS
Le framework Bootstrap
Personnaliser les classes Bootstrap
Dashboards clef en main avec shinydashboard
Effets dynamiques avec JavaScriptDéployer une application Shiny en production
Le service shinyapps.io
Shiny Server Open Source
Gestion d’utilisateurs simultanésDevenir un développeur Shiny autonome
Outils de débuggage
Comment trouver de l’aide
Continuer à évoluer en Shiny
