FORMATION LOGICIEL R

  • Home
  • FORMATION LOGICIEL R

Objectifs de la formation

R est un logiciel open source dans le domaine des statistiques disponible sur toutes les plateformes. Il propose toutes les fonctions utiles pour la statistique courante ainsi que de nombreuses extensions (paquets). Cette formation Logiciel R vous apprend à programmer avec R ainsi qu’avec les extensions proposées (paquets)

 

À l’issue de cette formation Logiciel R, vous aurez acquis les compétences et connaissances nécessaires pour :

  • Installer et utiliser l’environnement R
  • Manipuler des données et des objets
  • Programmer avec R
  • Appliquer des méthodes d’analyses statistiques courantes

À qui s’adresse cette formation ?

Public :

Ce cours s’adresse à tout développeur en environnement statistique et aux personnes voulant découvrir le datamining et l’appliquer.

Prérequis :

Pour suivre cette formation, il est demandé d’avoir des connaissances de base en statistiques (régression linéaire, échantillonnage) ainsi que des connaissances de base en programmation (variables, boucles, etc.).

 Contenu du cours

  1. Présentation du logiciel R

    Introduction au logiciel R
    Découvrir le langage R
    Le langage R et la concurrence
    Mettre en oeuvre le téléchargement et l’installation

    Première prise en main du logiciel R

    Les Objets

    Les Vecteurs
    Les Tableaux
    Les Listes
    Les Matrices
    Les Data Frames
    Les Tables de contingences

    Les Fonctions et programmation R

    Fonctions mathématiques
    Fonction de manipulation des objets
    Opérations ensemblistes
    Fonctions dates et chaînes

    Génération, gestion et visualisation des données

    Analyses statistiques

    Régressions linéaires
    Analyse en composante principale (ACP)
    Classification ascendante hiérarchique

    Bilan

Objectifs de la formation

Cette formation Logiciel R Perfectionnement propose de vous transmettre le savoir-faire d’un développeur R professionnel au niveau de son organisation (à tous les niveaux des bonnes pratiques) et de ses choix techniques. Concrètement, la formation suit le « scénario idéal » qu’il faudrait mettre en œuvre pour livrer le plus rapidement possible un programme efficace et facile à maintenir.

À l’issue de cette formation, vous aurez acquis les connaissances et les compétences nécessaires pour :

  • Savoir organiser son environnement de travail pour fluidifier son processus d’analyse
  • Connaître les packages utilisés dans la plupart des projets professionnels
  • Savoir utiliser les bonnes structures de données pour les manipuler efficacement
  • Savoir visualiser de façon élégante et rapide les données
  • Maîtriser la manipulation des données avec les package dplyr, forecast, stringr, lubridate, etc.
  • Savoir assembler les données (jointure)
  • Savoir représenter graphiquement les données avec le package ggplot2
  • Savoir générer dynamiquement son rapport d’analyse avec rmarkdown
  • Comprendre la programmation fonctionnelle (purrr)

À qui s’adresse cette formation ?

Public :

Ce cours Logiciel R perfectionnement cible les utilisateurs du logiciel R qui souhaitent approfondir leurs connaissances et maîtriser les bonnes pratiques du logiciel R.

Prérequis :

Pour suivre cette formation Logiciel R Perfectionnement, il est important d’avoir des connaissances de base sur le logiciel R : création et manipulation des objets sous R, importation des données, utilisation simple de R en mode console, création de graphiques simples.

 Contenu du cours

  1. Organiser son travail sous R

    Travailler en projet R : notion de working directory, workspace, history
    Architecture de son projet R : data, plots, images, scripts, etc..
    Bonnes pratiques pour la création de fichiers de données
    Importation et exportation de fichiers avec le package here
    Mettre à jour ses packages
    Mettre à jour R et R Studio

    Manipuler facilement ses données avec le package dplyr

    Introduction au package tidyverse et à la notion de pipe
    Filtrer des lignes avec la fonction filter()
    Sélectionner des colonnes (variable) avec la fonction select()
    Création de nouvelles variables avec la fonction mutate()
    Renommer ses variables avec la fonction rename()
    Calcul de paramètres par sous-groupes : fonctions group_by() et summarise()
    Passage du format wide au format long

    Exercices

    Manipulation des variables catégorielles avec le package forecats

    Inspecter les variables catégorielles avec les fonctions levels(), fct_count et fct_unique
    Modifier l’ordre des modalités
    Modifier le nom des modalités

    Exercices

    Manipuler les chaînes de caractères avec le package stringr

    Détection de patterns
    Découpage
    Gestion des longueurs
    Remplacement

    Exercices

    Manipuler des données de date : utilisation du package lubridate

    Convertir les données au format YYYY-MM-DD et HH:MM:SS
    Décomposer les éléments d’année, de mois et de jour
    Calculer des différences de dates et les exprimer en jours, ou heures

    Exercices

    Assemblage de tables

    Les différentes jointures (par colonne): left join, right join, inner join et full join
    Assemblage par lignes
    Exemple d’applications pour l’analyse de données

    Exercices

    Réaliser des représentations graphiques performantes avec le package ggplot2

    Le principe des couches successives de ggplot2
    Réalisation des graphiques de base : scatterplot, barplots, line plot, boxplots
    Gestion des couleurs, titres, axes et légendes
    Représentation des séries temporelles
    Utilisation du format long et facetting
    Ajouter du texte sur un graphique (ex : équation)
    Exporter son graphique : format et résolution
    Utilisation des addins esquisse et Colour Picker

    Générer dynamiquement son rapport d’analyse avec R Markdown

    Principe, formats de sorties (html, docx, pdf)
    Les différents éléments d’un fichier Rmd : en-tête, chunk, etc. . .
    Gestion des éléments de texte : gras, italique, titre
    Gestion des tables
    Gestion des images
    Gestion des graphiques
    Gestion des options des éléments de code
    Gestion de la table des matières et numérotation
    Les rapports paramétrés : automatisation des rapports d’analyse par sous groupe

    Introduction à la programmation fonctionnelle avec le package purrr

    Les list
    Les fonctions map()
    Nested data

    Exercices

Objectifs de la formation

Cette formation Maîtriser le logiciel R vous apprend dans un premier temps à programmer avec R ainsi qu’avec les extensions proposées. Elle vous propose ensuite de vous transmettre le savoir-faire d’un développeur R professionnel au niveau de son organisation (à tous les niveaux des bonnes pratiques) et de ses choix techniques.

À l’issue de cette formation, vous aurez acquis les connaissances et les compétences nécessaires pour :

  • Installer et utiliser l’environnement R
  • Manipuler des données et des objets
  • Programmer avec R
  • Appliquer des méthodes d’analyses statistiques courantes
  • Organiser son environnement de travail pour fluidifier son processus d’analyse
  • Connaître les packages utilisés dans les projets professionnels
  • Manipulaer des données avec les package dplyr, forecast, stringr, lubridate, etc.
  • Assembler les données (jointure)
  • Représenter graphiquement les données avec le package ggplot2
  • Générer dynamiquement un rapport d’analyse avec rmarkdown
  • Comprendre la programmation fonctionnelle (purrr)

À qui s’adresse cette formation ?

 Public :

Ce cours Maîtriser le logiciel R s’adresse à tout développeur en environnement statistique ainsi qu’aux utilisateurs futurs du logiciel R, souhaitant tout à la fois le découvrir et en connaître les bonnes pratiques.

Prérequis :

Pour suivre cette formation Maîtriser le logiciel R, il est demandé d’avoir des connaissances préalables de base en statistiques (régression linéaire, échantillonnage) ainsi que des connaissances de base en programmation (variables, boucles, etc.)

 Contenu du cours

  1. Présentation du logiciel R

    Introduction au logiciel R
    Découvrir le langage R
    Le langage R et la concurrence
    Mettre en oeuvre le téléchargement et l’installation

    Première prise en main du logiciel R

    Les Objets

    Les Vecteurs
    Les Tableaux
    Les Listes
    Les Matrices
    Les Data Frames
    Les Tables de contingences

    Les Fonctions et programmation R

    Fonctions mathématiques
    Fonction de manipulation des objets
    Opérations ensemblistes
    Fonctions dates et chaînes

    Génération, gestion et visualisation des données

    Analyses statistiques

    Régressions linéaires
    Analyse en composante principale (ACP)
    Classification ascendante hiérarchique

    Organiser son travail sous R

    Travailler en projet R : notion de working directory, workspace, history
    Architecture de son projet R : data, plots, images, scripts, etc..
    Bonnes pratiques pour la création de fichiers de données
    Importation et exportation de fichiers avec le package here
    Mettre à jour ses packages
    Mettre à jour R et R Studio

    Manipuler facilement ses données avec le package dplyr

    Introduction au package tidyverse et à la notion de pipe
    Filtrer des lignes avec la fonction filter()
    Sélectionner des colonnes (variable) avec la fonction select()
    Création de nouvelles variables avec la fonction mutate()
    Renommer ses variables avec la fonction rename()
    Calcul de paramètres par sous-groupes : fonctions group_by() et summarise()
    Passage du format wide au format long

    Exercices

    Manipulation des variables catégorielles avec le package forecats

    Inspecter les variables catégorielles avec les fonctions levels(), fct_count et fct_unique
    Modifier l’ordre des modalités
    Modifier le nom des modalités

    Exercices

    Manipuler les chaînes de caractères avec le package stringr

    Détection de patterns
    Découpage
    Gestion des longueurs
    Remplacement

    Exercices

    Manipuler des données de date : utilisation du package lubridate

    Convertir les données au format YYYY-MM-DD et HH:MM:SS
    Décomposer les éléments d’année, de mois et de jour
    Calculer des différences de dates et les exprimer en jours, ou heures

    Exercices

    Assemblage de tables

    Les différentes jointures (par colonne): left join, right join, inner join et full join
    Assemblage par lignes
    Exemple d’applications pour l’analyse de données

    Exercices

    Réaliser des représentations graphiques performantes avec le package ggplot2

    Le principe des couches successives de ggplot2
    Réalisation des graphiques de base : scatterplot, barplots, line plot, boxplots
    Gestion des couleurs, titres, axes et légendes
    Représentation des séries temporelles
    Utilisation du format long et facetting
    Ajouter du texte sur un graphique (ex : équation)
    Exporter son graphique : format et résolution
    Utilisation des addins esquisse et Colour Picker

    Générer dynamiquement son rapport d’analyse avec R Markdown

    Principe, formats de sorties (html, docx, pdf)
    Les différents éléments d’un fichier Rmd : en-tête, chunk, etc. . .
    Gestion des éléments de texte : gras, italique, titre
    Gestion des tables
    Gestion des images
    Gestion des graphiques
    Gestion des options des éléments de code
    Gestion de la table des matières et numérotation
    Les rapports paramétrés : automatisation des rapports d’analyse par sous groupe

    Introduction à la programmation fonctionnelle avec le package purrr

    Les list
    Les fonctions map()
    Nested data

    Exercices

Objectifs de la formation

La Data Science avec R repose sur la maîtrise de techniques d’exploration de données fondamentales : statistiques descriptives, prédictives ou exploratoires.

Cette formation Logiciel R vous présentera les méthodes indispensables en Data Science sous RStudio.

À l’issue de cette formation, vous aurez acquis les connaissances et les compétences nécessaires pour :

  • Savoir utiliser des méthodes d’exploration de données
  • Comprendre le principe de la modélisation statistique
  • Choisir entre la régression et la classification

Mettre en œuvre une évaluation des performances prédictives d’un modèle

À qui s’adresse cette formation ?

Public :

Cette formation Data Science avec R s’adresse aux responsables infocentres (Datamining, Marketing, Qualité…), aux utilisateurs et gestionnaires métiers de bases de données, ainsi qu’aux futurs Data Scientists.

Prérequis :

Pour suivre cette formation à la Data Science avec R, il est nécessaire d’avoir des connaissances de base du logiciel R ainsi qu’en statistiques

 Contenu du cours

  1. Rappels du langage R

    Les types de données dans R
    Importation et exportation de données
    Techniques pour tracer des courbes et des graphiques

    Analyse en composantes

    Analyse en composantes principales
    Analyse factorielle des correspondances
    Analyse des correspondances multiples

    Exercices

    La modélisation

    Les algorithmes supervisés et non supervisés
    Le choix entre la régression et la classification
    Les étapes de construction d’un modèle

    Les algorithmes non supervisés

    Le clustering hiérarchique
    Le clustering non hiérarchique
    Les approches mixtes

    Exercices

    Les algorithmes supervisés

    Le principe de régression linéaire univariée
    La régression multivariée
    La régression polynomiale
    La régression logistique
    Le Naive Bayes
    L’arbre de décision
    Les K plus proches voisins

    Exercices

    Procédures d’évaluation de modèles

    Les techniques de ré-échantillonnage en jeu d’apprentissage, de validation et de test
    Mesures de performance des modèles prédictifs
    Matrice de confusion, de coût et la courbe ROC et AUC

    Exercices

    Analyse de donnees textuelles

    Quelques packages utiles
    Cas de la régression linéaire multiple
    Cas de l’analyse en composantes principales ACP
    Cas de la classification CAH

    Exercices

Objectifs de la formation

R est un logiciel statistique qui dispose d’outils graphiques de qualité pour présenter les données. Afin de bénéficier de cette richesse, il faut être capable de préparer ces données, de les transformer et de les exploiter avec R

À l’issue de cette formation, vous aurez acquis les connaissances et les compétences nécessaires pour :

  • Constituer des jeux de données à analyser à partir de multiples sources
  • Manipuler les données pour les transformer à partir de fonctions diverses
  • Savoir construire des graphiques avec R
  • Être capable de calculer des indicateurs statistiques

À qui s’adresse cette formation ?

Public :

Ce cours Manipulation de données avec R est destinée aux statisticiens, analystes, ingénieurs, développeurs, ainsi qu’à toute personne ayant à manipuler des données, à traiter numériquement et représenter graphiquement des données, ou encore à réaliser des statistiques sous R.

Prérequis :

Pour suivre cette formation sur la manipulation de données avec R, il est conseillé de posséder des connaissances de base du logiciel R.

 Contenu du cours

  1. Rappels des éléments de base de R

    L’environnement RStudio
    Les types de données dans R, les listes, les DataFrames, les facteurs et les variables
    Principes algorithmiques avec les boucles, les structures conditionnelles et les fonctions

    Exercices

    Importation et exportation de données

    Lecture d’un jeu de données en mémoire
    Lecture d’un fichier externe
    Exporter et charger un fichier

    Exercices

    Manipulation de données avec R

    Opérations logiques et relationnelles
    Opérations sur les matrices ou les DataFrame
    Les fonctions outer, apply, lapply, sapply et mapply
    Manipulation de chaînes de caractères
    Manipulation de dates et séries temporelles

    Exercices

    Construire des graphiques avec R

    Les fenêtres graphiques
    Les fonctions de tracé de bas niveau
    Personnaliser des éléments graphiques
    Type de graphique
    Diagrammes empilés ou circulaire
    Boîte à moustaches
    Histogramme en densité à amplitudes de classes égales ou inégales
    Polygone des fréquences
    Représentations graphiques dans un cadre bivarié

    Exercices

    Statistique inférentielle

    Mesures d’association
    Notions sur la génération de nombres au hasard et de variable aléatoire
    Loi de probabilité
    Loi des grands nombres et théorème de la limite centrale
    Intervalles de confiance
    Tests d’hypothèses
    Analyse de la variance à un facteur, deux facteurs

    Exercices

Objectifs de la formation

Dans R, les rapports dynamiques désignent des fichiers générés automatiquement (automatisés) écrits dans un format déterminé : R Markdown. Ce format, qui comprend des balises, permet d’inclure du texte, des commentaires, du code R ou encore les sorties de ces codes R.

À l’issue de cette formation, vous aurez acquis les connaissances et les compétences nécessaires pour :

  • Produire de façon automatisée des documents de travail contenant du texte, du code R, et les sorties de ces codes R
  • Inscrire ces documents dans une démarche de travail reproductible

Générer ces documents en format HTML, word ou PDF

À qui s’adresse cette formation ?

Public :

Ce cours cible les utilisateurs du logiciel R qui souhaitent apprendre à créer des rapports automatisés avec R.

Prérequis :

Pour suivre cette formation R Markdown & Bookdown, le participant doit avoir des connaissances de base sur le logiciel R : création et manipulation des objets sous R, importation des données, utilisation simple de R en mode console, création de graphiques simples…

 Contenu du cours

  1. Introduction à R Markdown

    Programmation lettrée
    Crise de la reproductibilité
    Principe de R Markdown

    Script R Markdown

    Structure : en-tête, texte, chunk
    Formats de sortie : html, word, pdf
    Premier rapport dynamique : bouton knit

    Gestion des éléments de texte

    Formatage : gras, italique, insertion de ligne
    Les listes : numérotées, non numérotées
    Les titres et leur numérotation
    La table des matières

    Exercices

    Insertion d’éléments

    Les images
    Les tables
    Les liens hypertexte
    Les notes de bas de page
    Les équations
    Les références bibliographiques

    Exercices

    Gestion du code R

    Options d’affichage du code
    Options d’affichage des sorties
    Les graphiques
    Les tables de données
    Les options par défaut
    Exercices
    Amélioration des rendus simples
    Ajouter un modèle Word
    Options pour le pdf
    Les modèles html

    Exercices

    Amélioration des rendus simples

    Ajouter un modèle Word
    Options pour le PDF
    Les modèles HTML

    Exercices

    Paramétrisation des scripts rmd (rapports répétés)

    Principe
    Exemples

    Exercices

    Réalisation de documents contenant plusieurs chapitres

    Principe du package bookdown
    Les différents fichiers nécessaires
    Compilation des chapitres
    Les différents formats de sortie
    Debuggage
    Déploiement du document html sur https://bookdown.org/
    Mise en application

Objectifs de la formation

Le framework R Shiny permet aux data scientists de communiquer leurs analyses au travers d’une application web dynamique et interactive écrite entièrement à partir de R, sans avoir besoin de connaître les langages HTML, CSS,  ou JavaScript.



À l’issue de cette formation, vous aurez acquis les connaissances et les compétences nécessaires pour :

  • Optimiser la performance de vos applications
  • Personnaliser l’apparence de vos applications

À qui s’adresse cette formation ?

Public :

Ce cours R Shiny cible principalement les développeurs R et les administrateurs de déploiement.

Prérequis :

Pour suivre cette formation R Shiny, il est nécessaire d’avoir des bases de programmation avec R et de posséder une certaine culture sur l’analyse de données et la datavisualisation.

 Contenu du cours

  1. Introduction au framework R Shiny

    Présentation du package shiny
    Exemples d’applications
    Présentation de Shiny Server Open Source
    Installation et prise en main

    Créer votre première application Shiny

    Structure de base des fichiers
    Outils de conception de l’interface
    Les widgets disponibles et le package shinyWidgets
    Créer des sorties graphiques
    Règles de portée lexicale

    Concevoir des applications professionnelles et performantes

    Comprendre la réactivité en Shiny
    Les fonctions de réactivité : reactive(), observe(), isolate(), …
    Bonnes pratiques et cas d’usage
    Mesurer la performance d’une application
    Accélérer les traitements de données
    Organisation d’un projet Shiny
    Modularisation d’une application

    Améliorer l’apparence d’une applications

    Présentation du langage CSS
    Le framework Bootstrap
    Personnaliser les classes Bootstrap
    Dashboards clef en main avec shinydashboard
    Effets dynamiques avec JavaScript

    Déployer une application Shiny en production

    Le service shinyapps.io
    Shiny Server Open Source
    Gestion d’utilisateurs simultanés

    Devenir un développeur Shiny autonome

    Outils de débuggage
    Comment trouver de l’aide
    Continuer à évoluer en Shiny