{"id":13026,"date":"2022-07-13T20:32:06","date_gmt":"2022-07-13T20:32:06","guid":{"rendered":"http:\/\/705consulting.com\/?page_id=13026"},"modified":"2022-07-13T20:46:34","modified_gmt":"2022-07-13T20:46:34","slug":"formation-data-science","status":"publish","type":"page","link":"https:\/\/705consulting.com\/index.php\/formation-data-science\/","title":{"rendered":"FORMATION DATA SCIENCE"},"content":{"rendered":"\t\t<div data-elementor-type=\"wp-page\" data-elementor-id=\"13026\" class=\"elementor elementor-13026\">\n\t\t\t\t\t\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-b0d6fb2 elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"b0d6fb2\" data-element_type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-50 elementor-top-column elementor-element elementor-element-aac3e30\" data-id=\"aac3e30\" data-element_type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t\t\t<div class=\"elementor-element elementor-element-c5fbe52 elementor-widget elementor-widget-toggle\" data-id=\"c5fbe52\" data-element_type=\"widget\" data-widget_type=\"toggle.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t<style>\/*! elementor - v3.7.8 - 02-10-2022 *\/\n.elementor-toggle{text-align:left}.elementor-toggle .elementor-tab-title{font-weight:700;line-height:1;margin:0;padding:15px;border-bottom:1px solid #d4d4d4;cursor:pointer;outline:none}.elementor-toggle .elementor-tab-title .elementor-toggle-icon{display:inline-block;width:1em}.elementor-toggle .elementor-tab-title .elementor-toggle-icon svg{-webkit-margin-start:-5px;margin-inline-start:-5px;width:1em;height:1em}.elementor-toggle .elementor-tab-title .elementor-toggle-icon.elementor-toggle-icon-right{float:right;text-align:right}.elementor-toggle .elementor-tab-title .elementor-toggle-icon.elementor-toggle-icon-left{float:left;text-align:left}.elementor-toggle .elementor-tab-title .elementor-toggle-icon .elementor-toggle-icon-closed{display:block}.elementor-toggle .elementor-tab-title .elementor-toggle-icon .elementor-toggle-icon-opened{display:none}.elementor-toggle .elementor-tab-title.elementor-active{border-bottom:none}.elementor-toggle .elementor-tab-title.elementor-active .elementor-toggle-icon-closed{display:none}.elementor-toggle .elementor-tab-title.elementor-active .elementor-toggle-icon-opened{display:block}.elementor-toggle .elementor-tab-content{padding:15px;border-bottom:1px solid #d4d4d4;display:none}@media (max-width:767px){.elementor-toggle .elementor-tab-title{padding:12px}.elementor-toggle .elementor-tab-content{padding:12px 10px}}.e-container>.elementor-widget-toggle{width:var(--container-widget-width,100%)}<\/style>\t\t<div class=\"elementor-toggle\" role=\"tablist\">\n\t\t\t\t\t\t\t<div class=\"elementor-toggle-item\">\n\t\t\t\t\t<div id=\"elementor-tab-title-2071\" class=\"elementor-tab-title\" data-tab=\"1\" role=\"tab\" aria-controls=\"elementor-tab-content-2071\" aria-expanded=\"false\">\n\t\t\t\t\t\t\t\t\t\t\t\t<span class=\"elementor-toggle-icon elementor-toggle-icon-left\" aria-hidden=\"true\">\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t<span class=\"elementor-toggle-icon-closed\"><i class=\"fas fa-caret-right\"><\/i><\/span>\n\t\t\t\t\t\t\t\t<span class=\"elementor-toggle-icon-opened\"><i class=\"elementor-toggle-icon-opened fas fa-caret-up\"><\/i><\/span>\n\t\t\t\t\t\t\t\t\t\t\t\t\t<\/span>\n\t\t\t\t\t\t\t\t\t\t\t\t<a href=\"\" class=\"elementor-toggle-title\">FORMATION CURSUS DATA SCIENTIST <\/a>\n\t\t\t\t\t<\/div>\n\n\t\t\t\t\t<div id=\"elementor-tab-content-2071\" class=\"elementor-tab-content elementor-clearfix\" data-tab=\"1\" role=\"tabpanel\" aria-labelledby=\"elementor-tab-title-2071\"><h2>Objectifs de la formation<\/h2><p>Le m\u00e9tier de Data Scientist est apparu ces derni\u00e8res ann\u00e9es pour faire face \u00e0 la multiplication des donn\u00e9es, \u00e0 la diversit\u00e9 de leurs formes et de leurs sources : le Big Data. Le r\u00f4le du Data Scientist : rendre les donn\u00e9es exploitables, les traiter pour leur donner du sens et ainsi permettre \u00e0 la direction g\u00e9n\u00e9rale d&#8217;adapter la strat\u00e9gie de l&#8217;entreprise.<\/p><p>\u00a0<\/p><p>\u00c0 l&#8217;issue de ce\u00a0<strong>cursus Data Scientist<\/strong>, vous serez \u00e0 m\u00eame de ma\u00eetriser tous les tenants et aboutissants du Big Data gr\u00e2ce \u00e0 l&#8217;assimilation des connaissances et comp\u00e9tences suivantes :<\/p><ul><li>Comprendre le vocabulaire des statisticiens et savoir effectuer des calculs r\u00e9currents<\/li><li>Savoir situer la fronti\u00e8re entre statistiques et probabilit\u00e9s<\/li><li>Savoir choisir le bon outil pour repr\u00e9senter vos \u00e9tudes statistiques, et bien communiquer dessus<\/li><li>Conna\u00eetre les acteurs du Big Data et leur niveau d&#8217;interd\u00e9pendance<\/li><li>Conna\u00eetre les sp\u00e9cificit\u00e9s d&#8217;une infrastructure Big Data : stockage de donn\u00e9es, analyse, visualisation&#8230;<\/li><li>Manipuler des donn\u00e9es, des objets et programmer avec R<\/li><li>Ma\u00eetriser les fonctionnalit\u00e9s plus avanc\u00e9es de R : packages, structrures de donn\u00e9es, Rmarkdown, purr&#8230;<\/li><li>Comprendre les diff\u00e9rences entre apprentissage automatique supervis\u00e9, non supervis\u00e9 et meta-apprentissage<\/li><li>Ma\u00eetriser l\u2019utilisation d\u2019algorithmes d&#8217;auto-apprentissage adapt\u00e9s \u00e0 une solution d&#8217;analyse, et appliquer ces techniques \u00e0 des projets Big Data<\/li><li>G\u00e9rer, collecter, analyser et visualiser vos donn\u00e9es<\/li><li>Mettre en r\u00e9cit vos analyses pour les promouvoir en interne ou en externe<\/li><\/ul><h2>\u00c0 qui s&#8217;adresse cette formation ?<\/h2><p><strong>Public :<\/strong><\/p><p>De mani\u00e8re g\u00e9n\u00e9rale, ce cursus Data Scientist s&#8217;adresse \u00e0 toute personne amen\u00e9e \u00e0 \u00e9voluer vers une fonction de Data Scientist. Ce poste recoupe des profils vari\u00e9s : analystes, statisticiens, sp\u00e9cialistes BI&#8230;<\/p><p><strong>Pr\u00e9requis :<\/strong><\/p><p>Pour suivre ce cursus Data Scientist, il est n\u00e9cessaire de poss\u00e9der des connaissances de base en statistiques (r\u00e9gression lin\u00e9aire, \u00e9chantillonnage) ainsi que des connaissances de base en programmation (variables, boucles, etc.).<\/p><h2>\u00a0Contenu du cours<\/h2><ol><li><h3>I &#8211; Comprendre les statistiques pour le Big Data ou la Business Intelligence (3 jours)<\/h3><p><strong>Le vocabulaire de base<\/strong><\/p><p><strong>Calcul fondamental en statistique descriptive<\/strong><\/p><p><strong>Probabilit\u00e9s<\/strong><\/p><p><strong>Tests et intervalles de confiance<\/strong><\/p><p><strong>Visualisation des donn\u00e9es<\/strong><\/p><p><strong>L\u2019\u00e9volution des statistiques pour le Big Data<\/strong><\/p><h3>II &#8211; Big Data : Enjeux, concepts, architectures et outils (3 jours)<\/h3><p><strong>Contexte et opportunit\u00e9s du Big Data<\/strong><\/p><p><strong>S\u00e9curit\u00e9 \u00e9thique et enjeux juridiques du Big Data<\/strong><\/p><p><strong>Open data<\/strong><\/p><p><strong>Les projets Big Data en entreprise<\/strong><\/p><p><strong>Architecture et infrastructure Big Data<\/strong><\/p><p><strong>L\u2019analyse des donn\u00e9es et la visualisation<\/strong><\/p><p><strong>Le d\u00e9veloppement d\u2019applications Big Data<\/strong><\/p><p><strong>La visualisation des donn\u00e9es (Dataviz)<\/strong><\/p><p><strong>D\u00e9monstration d\u2019un environnement distribu\u00e9 Hadoop<\/strong><\/p><p><strong>Cas d\u2019usage et success-stories<\/strong><\/p><h3>III &#8211; Logiciel R : Prise en main (2 jours)<\/h3><p><strong>Pr\u00e9sentation du logiciel R<\/strong><\/p><p><strong>Premi\u00e8re prise en main du logiciel R<\/strong><\/p><p><strong>Les Objets<\/strong><\/p><p><strong>Les Fonctions et programmation R<\/strong><\/p><p><strong>G\u00e9n\u00e9ration, gestion et visualisation des donn\u00e9es<\/strong><\/p><p><strong>Analyses statistiques<\/strong><\/p><p><strong>Bilan<\/strong><\/p><h3>IV &#8211; Logiciel R : Perfectionnement et bonnes pratiques (3 jours)<\/h3><p><strong>Organiser son travail sous R<\/strong><\/p><p><strong>Manipuler facilement ses donn\u00e9es avec le package dplyr<\/strong><\/p><p><strong><em>Exercices<\/em><\/strong><\/p><p><strong>Manipulation des variables cat\u00e9gorielles avec le package forecats<\/strong><\/p><p><strong><em>Exercices<\/em><\/strong><\/p><p><strong>Manipuler les cha\u00eenes de caract\u00e8res avec le package stringr<\/strong><\/p><p><strong><em>Exercices<\/em><\/strong><\/p><p><strong>Manipuler des donn\u00e9es de date : utilisation du package lubridate<\/strong><\/p><p><strong><em>Exercices<\/em><\/strong><\/p><p><strong>Assemblage de tables<\/strong><\/p><p><strong><em>Exercices<\/em><\/strong><\/p><p><strong>R\u00e9aliser des repr\u00e9sentations graphiques performantes avec le package ggplot2<\/strong><\/p><p><strong>G\u00e9n\u00e9rer dynamiquement son rapport d\u2019analyse avec R Markdown<\/strong><\/p><p><strong>Introduction \u00e0 la programmation fonctionnelle avec le package purrr<\/strong><\/p><p><strong><em>Exercices<\/em><\/strong><\/p><h3>V &#8211; Machine Learning : Introduction par la pratique (3 jours)<\/h3><p><strong>Introduction au monde du Big Data et de la Data Science<\/strong><\/p><p><strong>Un premier exemple de mod\u00e9lisation : la d\u00e9tection de Spams<\/strong><\/p><p><strong>Les diff\u00e9rents types d&#8217;application du Machine Learning<\/strong><\/p><p><strong>Prise en main des outils<\/strong><\/p><p><strong>Mise en pratique sur un probl\u00e8me de classification<\/strong><\/p><p><strong>Mise en pratique sur un probl\u00e8me de r\u00e9gression<\/strong><\/p><p><strong>La validation des mod\u00e8les : 1\u00e8re partie<\/strong><\/p><p><strong>Une approche non-supervis\u00e9e : le clustering<\/strong><\/p><p><strong>Nettoyage des donn\u00e9es : 1\u00e8re partie<\/strong><\/p><p><strong>Exploration et visualisation des donn\u00e9esLa validation des mod\u00e8les : 2e partie<\/strong><\/p><p><strong>Le processus de cr\u00e9ation d&#8217;un mod\u00e8le<\/strong><\/p><p><strong>Les m\u00e9thodes ensemblistes<\/strong><\/p><p><strong>Le nettoyage des donn\u00e9es : 2e partie<\/strong><\/p><p><strong>Le Feature Engineering<\/strong><\/p><p><strong>Ouverture sur le Deep Learning<\/strong><\/p><h3>VI &#8211; Big Data : Les techniques d&#8217;Analyse et de Visualisation (4 jours)<\/h3><p><strong>Comprendre les sp\u00e9cificit\u00e9s du Big Data<\/strong><\/p><p><strong>Les concepts fondamentaux et technologies associ\u00e9es du Big Data (stockage, recherche, visualisation)<\/strong><\/p><p><strong>Gestion des donn\u00e9es structur\u00e9es ou non<\/strong><\/p><p><strong>La collecte et exploration des donn\u00e9es<\/strong><\/p><p><strong>L\u2019analyse des donn\u00e9es<\/strong><\/p><p><strong>La visualisation des donn\u00e9es (Dataviz)<\/strong><\/p><h3>VII &#8211; Data Storytelling : Racontez l&#8217;histoire de vos donn\u00e9es (1 jour)<\/h3><p><strong>Concepts cl\u00e9s de la mise en r\u00e9cit des donn\u00e9es<\/strong><\/p><p><strong><em>Exercice<\/em><\/strong><\/p><p><em>Analyse d\u2019une pr\u00e9sentation, cr\u00e9ation d\u2019indicateurs de mesure de l\u2019histoire<\/em><\/p><p><strong><em>Exercice pratique<\/em><\/strong><\/p><p><em>R\u00e9daction d\u2019un pitch et d\u2019un sch\u00e9ma narratif<\/em><\/p><p><strong>Mise en pratique\u00a0<\/strong><\/p><p><strong><em>Exercice pratique<\/em><\/strong><\/p><p><em>Prise en main de l&#8217;outil de Data Storytelling de Tableau Software, en \u00e9quipe<\/em><\/p><p><strong><em>Exercice pratique<\/em><\/strong><\/p><p><em>Exercice individuel de construction et de pr\u00e9sentation d&#8217;une histoire entre les participants<\/em><\/p><\/li><\/ol><\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t\t\t<div class=\"elementor-toggle-item\">\n\t\t\t\t\t<div id=\"elementor-tab-title-2072\" class=\"elementor-tab-title\" data-tab=\"2\" role=\"tab\" aria-controls=\"elementor-tab-content-2072\" aria-expanded=\"false\">\n\t\t\t\t\t\t\t\t\t\t\t\t<span class=\"elementor-toggle-icon elementor-toggle-icon-left\" aria-hidden=\"true\">\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t<span class=\"elementor-toggle-icon-closed\"><i class=\"fas fa-caret-right\"><\/i><\/span>\n\t\t\t\t\t\t\t\t<span class=\"elementor-toggle-icon-opened\"><i class=\"elementor-toggle-icon-opened fas fa-caret-up\"><\/i><\/span>\n\t\t\t\t\t\t\t\t\t\t\t\t\t<\/span>\n\t\t\t\t\t\t\t\t\t\t\t\t<a href=\"\" class=\"elementor-toggle-title\">FORMATION FONDAMENTAUX DE LA DATA SCIENCE<\/a>\n\t\t\t\t\t<\/div>\n\n\t\t\t\t\t<div id=\"elementor-tab-content-2072\" class=\"elementor-tab-content elementor-clearfix\" data-tab=\"2\" role=\"tabpanel\" aria-labelledby=\"elementor-tab-title-2072\"><h2>Objectifs de la formation<\/h2><p>Cette\u00a0<strong>formation\u00a0Data Scientist Fondamentaux\u00a0<\/strong>se concentre sur l&#8217;aspect technique de ce m\u00e9tier. Vous d\u00e9couvrirez les m\u00e9thodes et les outils du Data Scientist et partagerez les retours d&#8217;exp\u00e9riences des formateurs.<\/p><ul><li>D\u00e9couvrir le m\u00e9tier de Data Scientist et les grandes familles de probl\u00e8mes<\/li><li>Savoir mod\u00e9liser un probl\u00e8me de Data Science<\/li><li>Cr\u00e9er vos premi\u00e8res variables<\/li><li>Constituer votre bo\u00eete \u00e0 outils de Data Scientist<\/li><li>Participer \u00e0 une premi\u00e8re comp\u00e9tition.<\/li><\/ul><h2>\u00c0 qui s&#8217;adresse cette formation ?<\/h2><p><strong>Public :<\/strong><\/p><p>Ce stage s&#8217;adresse aux Analystes, Statisticiens, Architectes, D\u00e9veloppeurs.<\/p><p><strong>Pr\u00e9requis :<\/strong><\/p><p>Pour suivre ce cours dans les meilleures conditions possibles, il vous faut avoir certaines connaissances de base en programmation ou scripting, ainsi que quelques souvenirs de statistiques qui peuvent \u00eatre un plus.<\/p><h2>\u00a0Contenu du cours<\/h2><ol><li><h3>Introduction au Big Data<\/h3><p>Qu\u2019est-ce-que le Big Data ?<br \/>L\u2019\u00e9cosyst\u00e8me technologique du Big Data<\/p><h3>Introduction \u00e0 la Data Science, le m\u00e9tier de Data Scientist<\/h3><p>Le vocabulaire d\u2019un probl\u00e8me de Data Science<br \/>De l\u2019analyse statistique au machine learning<br \/>Overview des possibilit\u00e9s du machine learning<\/p><h3>Mod\u00e9lisation d\u2019un probl\u00e8me<\/h3><p>Input \/ ouput d\u2019un probl\u00e8me de machine learning<\/p><p><strong><em>Travaux Pratiques \u00ab OCR\u00bb :<\/em><\/strong><\/p><p><em>Comment mod\u00e9liser le probl\u00e8me de la reconnaissance optique de caract\u00e8re<\/em><\/p><h3>Identifier les familles d\u2019algorithmes de machine learning<\/h3><p>Analyse supervis\u00e9e<br \/>Analyse non supervis\u00e9e<br \/>Classification \/ r\u00e9gression<\/p><h3>Sous le capot des algorithmes : la r\u00e9gression lin\u00e9aire<\/h3><p>Quelques rappels : fonction hypoth\u00e8se, fonction convexe, optimisation<br \/>La construction de la fonction de co\u00fbt<br \/>M\u00e9thode de minimisation : la descente de gradient<\/p><h3>Sous le capot des algorithmes : la r\u00e9gression logistique<\/h3><p>Fronti\u00e8re de d\u00e9cision<br \/>La construction d\u2019une fonction de co\u00fbt convexe pour la classification<\/p><h3>La bo\u00eete \u00e0 outil du Data Scientist<\/h3><p>Introduction aux outils<br \/>Introduction \u00e0 Python, Pandas et Scikit-learn<\/p><p><strong><em>Cas pratique n\u00b01 : \u00ab Pr\u00e9dire les survivants du Titanic \u00bb<\/em><\/strong><\/p><p><em>Expos\u00e9 du probl\u00e8me<\/em><em><br \/>Premi\u00e8re manipulation en Python<\/em><\/p><h3>1.\u00a0\u00a0\u00a0 \u00a0<\/h3><h3><br \/>Rappels et r\u00e9visions du jour 1<br \/>Qu\u2019est-ce qu\u2019un bon mod\u00e8le ?<\/h3><p>Cross-validation<br \/>Les m\u00e9triques d\u2019\u00e9valuation : precision, recall, ROC, MAPE, etc<\/p><h3>Les pi\u00e8ges du machine learning<\/h3><p>Overfitting ou sur-apprentissage<br \/>Biais vs variance<br \/>La r\u00e9gularisation : r\u00e9gression Ridge et Lasso<\/p><h3>Data Cleaning<\/h3><p>Les types de donn\u00e9es : cat\u00e9gorielles, continues, ordonn\u00e9es, temporelles<br \/>D\u00e9tection des outliers statistiques, des valeurs aberrantes<br \/>Strat\u00e9gie pour les valeurs manquantes<\/p><p><strong><em>Travaux Pratiques :<\/em><\/strong><\/p><p><em>\u00ab Remplissage des valeurs manquantes\u00bb<\/em><\/p><h3>Feature Engineering<\/h3><p>Strat\u00e9gies pour les variables non continues<br \/>D\u00e9tecter et cr\u00e9er des variables discriminantes<\/p><p><strong><em>Cas pratique n\u00b02 : \u00ab Pr\u00e9dire les survivants du Titanic \u00bb<\/em><\/strong><\/p><p><em>Identification et cr\u00e9ation des bonnes variables<\/em><em><br \/>R\u00e9alisation d\u2019un premier mod\u00e8le<br \/>Soumission sur Kaggle<\/em><\/p><h3>Data visualisation<\/h3><p>La visualisation pour comprendre les donn\u00e9es : histogramme, scatter plot, etc<br \/>La visualisation pour comprendre les algorithmes : train \/ test loss, feature importance, etc<\/p><h3>Introduction aux m\u00e9thodes ensemblistes<\/h3><p>Le mod\u00e8le de base : l\u2019arbre de d\u00e9cision, ses avantages et ses limites<br \/>Pr\u00e9sentation des diff\u00e9rentes strat\u00e9gies ensemblistes : bagging, boosting, etc<\/p><p><strong><em>Travaux Pratiques &#8220;Retour sur le Titanic&#8221; :<\/em><\/strong><\/p><p><em>Utilisation d\u2019une m\u00e9thode ensembliste sur la base du pr\u00e9c\u00e9dent mod\u00e8le<\/em><\/p><h3>Apprentissage semi-supervis\u00e9<\/h3><p>Les grandes classes d\u2019algorithmes non supervis\u00e9es : clustering, PCA, etc<\/p><p><strong><em>Travaux Pratiques \u00ab D\u00e9tection d\u2019anomalies dans les prises de paris\u00bb :<\/em><\/strong><\/p><p><em>Comment un algorithme non supervis\u00e9 permet-il de d\u00e9tecter des fraudes dans les prises de paris?<\/em><\/p><h3>2.\u00a0\u00a0\u00a0 \u00a0<\/h3><h3><br \/>Rappels et r\u00e9visions<\/h3><p>Synth\u00e8se des points abord\u00e9s en journ\u00e9es 1 et 2<br \/>Approfondissement des sujets s\u00e9lectionn\u00e9s avec l\u2019intervenant<\/p><h3>Mise en pratique<\/h3><p>Le dernier jour est enti\u00e8rement consacr\u00e9 \u00e0 des mises en pratique<\/p><h3>S\u00e9lection et participation \u00e0 une comp\u00e9tition<\/h3><p>Le formateur s\u00e9lectionnera une comp\u00e9tition en cours sur Kaggle ou datascience.net qui sera d\u00e9marr\u00e9e en jour 3 par l\u2019ensemble des participants<\/p><\/li><\/ol><\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t\t\t<div class=\"elementor-toggle-item\">\n\t\t\t\t\t<div id=\"elementor-tab-title-2073\" class=\"elementor-tab-title\" data-tab=\"3\" role=\"tab\" aria-controls=\"elementor-tab-content-2073\" aria-expanded=\"false\">\n\t\t\t\t\t\t\t\t\t\t\t\t<span class=\"elementor-toggle-icon elementor-toggle-icon-left\" aria-hidden=\"true\">\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t<span class=\"elementor-toggle-icon-closed\"><i class=\"fas fa-caret-right\"><\/i><\/span>\n\t\t\t\t\t\t\t\t<span class=\"elementor-toggle-icon-opened\"><i class=\"elementor-toggle-icon-opened fas fa-caret-up\"><\/i><\/span>\n\t\t\t\t\t\t\t\t\t\t\t\t\t<\/span>\n\t\t\t\t\t\t\t\t\t\t\t\t<a href=\"\" class=\"elementor-toggle-title\">FORMATION DATA SCIENTIST :NIVEAU 1<\/a>\n\t\t\t\t\t<\/div>\n\n\t\t\t\t\t<div id=\"elementor-tab-content-2073\" class=\"elementor-tab-content elementor-clearfix\" data-tab=\"3\" role=\"tabpanel\" aria-labelledby=\"elementor-tab-title-2073\"><h2>Objectifs de la formation<\/h2><p>Gr\u00e2ce \u00e0 cette\u00a0<strong>formation Data Scientist<\/strong>, les participants seront sensibilis\u00e9s aux enjeux et opportunit\u00e9s qu&#8217;offre la \u00ab Citizen Data Science \u00bb pour leur organisation, ainsi qu&#8217;aux singularit\u00e9s des diff\u00e9rentes plateformes du march\u00e9<\/p><p><br \/><br \/><\/p><p>\u00c0 l&#8217;issue de cette formation, vous aurez acquis les connaissances et les comp\u00e9tences n\u00e9cessaires pour :<\/p><ul><li>D\u00e9couvrir les acteurs, les tendances et les enjeux actuels de la Data Science<\/li><li>S&#8217;approprier les principales notions de la Data Science<\/li><li>Savoir utiliser les fonctionnalit\u00e9s \u00e9l\u00e9mentaires d&#8217;une plateforme de Data Science et Machine Learning sans expertise de programmation<\/li><li>Exp\u00e9rimenter le cycle de vie d&#8217;un projet de Data Science<\/li><\/ul><h2>\u00c0 qui s&#8217;adresse cette formation ?<\/h2><p><strong>Public :<\/strong><\/p><p>Ce cours Data Scientist NIVEAU 1 s&#8217;adresse aux :<\/p><ul><li>Directeurs \/ Managers.<\/li><li>Chefs de projet \/ Products Manager \/ Products Owner<\/li><li>Business Analysts \/ Consultants Analytics<\/li><li>Citizen Data Scientist \/ Data Analysts \/ Statisticiens<\/li><li>\u00c9quipes m\u00e9tier impliqu\u00e9es dans un projet IA\/Data Science<\/li><\/ul><p><strong>Pr\u00e9requis :<\/strong><\/p><p>Pour suivre cette formation Data Scientist, il est n\u00e9cessaire de poss\u00e9der une app\u00e9tence pour le domaine de l&#8217;analytics et\/ou d&#8217;avoir des connaissances des bases de la Data Science (mod\u00e8les, biais, variances, etc.).<\/p><h2>\u00a0Contenu du cours<\/h2><ol><li><h3>Introduction \u00e0 la Citizen Data Science<\/h3><p>Fondamentaux de la Data Science<br \/>La Citizen Data Science<br \/>Le march\u00e9 des plateformes de DSML (Data Science et Machine Learning)<\/p><h3>Le cycle de vie d&#8217;un projet de Data Science : Phase de pr\u00e9paration<\/h3><p>Pr\u00e9sentation de la solution Dataiku<br \/>Pr\u00e9sentation du cas d\u2019usage<br \/>Collecte et pr\u00e9paration des donn\u00e9es<\/p><h3>Le cycle de vie d&#8217;un projet de Data Science : Phase d&#8217;ex\u00e9cution<\/h3><p>Mod\u00e9lisation et travail collaboratif<br \/>Analyse, interpr\u00e9tation et publication des r\u00e9sultats<br \/>Notions de mise en production et de supervision des mod\u00e8les<\/p><h3>Mise en perspective avec les autres plateformes, \u00e9changes et conclusion<\/h3><p>D\u00e9mo Datarobot<br \/>Enseignements et bonnes pratiques<br \/>Questions \/ R\u00e9ponses<\/p><\/li><\/ol><\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t\t\t<div class=\"elementor-toggle-item\">\n\t\t\t\t\t<div id=\"elementor-tab-title-2074\" class=\"elementor-tab-title\" data-tab=\"4\" role=\"tab\" aria-controls=\"elementor-tab-content-2074\" aria-expanded=\"false\">\n\t\t\t\t\t\t\t\t\t\t\t\t<span class=\"elementor-toggle-icon elementor-toggle-icon-left\" aria-hidden=\"true\">\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t<span class=\"elementor-toggle-icon-closed\"><i class=\"fas fa-caret-right\"><\/i><\/span>\n\t\t\t\t\t\t\t\t<span class=\"elementor-toggle-icon-opened\"><i class=\"elementor-toggle-icon-opened fas fa-caret-up\"><\/i><\/span>\n\t\t\t\t\t\t\t\t\t\t\t\t\t<\/span>\n\t\t\t\t\t\t\t\t\t\t\t\t<a href=\"\" class=\"elementor-toggle-title\">FORMATION DATA SCIENTIST: NIVEAU AVANC\u00c9<\/a>\n\t\t\t\t\t<\/div>\n\n\t\t\t\t\t<div id=\"elementor-tab-content-2074\" class=\"elementor-tab-content elementor-clearfix\" data-tab=\"4\" role=\"tabpanel\" aria-labelledby=\"elementor-tab-title-2074\"><h2>Objectifs de la formation<\/h2><p>Cette\u00a0<strong>formation Data Scientist Avanc\u00e9<\/strong><strong>\u00a0<\/strong>vous apprend les mod\u00e8les statistiques et les techniques d&#8217;analyse des donn\u00e9es qui vous aideront \u00e0 exploiter vos donn\u00e9es.<\/p><p>\u00c0 l&#8217;issue de cette formation, vous aurez acquis les connaissances et les comp\u00e9tences n\u00e9cessaires pour :<\/p><ul><li>D\u00e9couvrir et utiliser la puissance pr\u00e9dictive des mod\u00e8les ensemblistes<\/li><li>Savoir effectuer un &#8220;feature engineering&#8221; performant<\/li><li>Appr\u00e9hender les techniques de text-mining et de deep-learning \u00e0 travers d&#8217;exemples concrets<\/li><li>Enrichir ses outils de data scientist<\/li><\/ul><h2>\u00c0 qui s&#8217;adresse cette formation ?<\/h2><p><strong>Public :<\/strong><\/p><p>le cours s&#8217;adresse aux data scientists, analystes, statisticiens, architectes et d\u00e9veloppeurs souhaitant approfondir leurs connaissances sur la Data Science.<\/p><p><strong>Pr\u00e9requis :<\/strong><\/p><p>Pour suivre cette formation, il est recommand\u00e9 d&#8217;avoir des connaissances de base en programmation ou en scripting.<\/p><h2>\u00a0Contenu du cours<\/h2><ol><li><h3>Rappel des fondamentaux Data Scientist<\/h3><p>Ecosyst\u00e8me du Big Data et Data Scientist<br \/>Comment mod\u00e9liser un probl\u00e8me de data science ?<br \/>Les diff\u00e9rentes familles d\u2019algorithmes (supervis\u00e9 : classification\/r\u00e9gression, non supervis\u00e9)<br \/>Les algorithmes classiques<br \/>Comment \u00e9valuer la performance ?<br \/>Sur apprentissage et compromis biais\/variance<\/p><h3>Mod\u00e8les ensemblistes<\/h3><p>Rappels<br \/>Pourquoi \u00e7a fonctionne ? Raisons th\u00e9oriques<br \/>Introduction au stacking<br \/>Architecture et promesses du stacking<br \/>Feature weighted stacking<\/p><p><strong><em>Mise en application<\/em><\/strong><\/p><h3>Introduction au text mining<\/h3><p>Un mod\u00e8le de repr\u00e9sentation : le bag of words<br \/>Normalisations usuelles<br \/>Stemming, lemmatization<br \/>Distances (Levenshtein, Hamming, Jaro-Winkler)<br \/>Word2Vec<\/p><h3>Feature engineering avanc\u00e9<\/h3><p>Normalisation<br \/>Qu\u2019est ce que la normalisation ?<br \/>Quand l\u2019utiliser ?<br \/>R\u00e9duction de dimension (ACP, TSNE, LSA, etc.)<br \/>Transformation et interactions entre variables<br \/>Traitement des variables cat\u00e9gorielles \u00e0 haute dimensionnalit\u00e9<br \/>Cr\u00e9ation de variables extraites d\u2019arbres (Facebook Trick)<\/p><h3>R\u00e9seaux de neurones et deep learning<\/h3><p>L\u2019origine : le perceptron<br \/>Les r\u00e9seaux de neurones<br \/>Deep learning<br \/>Objectif : s\u2019affranchir du feature engineering manuel<br \/>Convolution<br \/>R\u00e9seaux r\u00e9current<\/p><p><strong><em>Cas concret<\/em><\/strong><\/p><p><em>Reconnaissance de chiffres<\/em><\/p><h3>Apprentissage semi-supervis\u00e9<\/h3><h3>Rappels et r\u00e9visions<\/h3><p>Synth\u00e8se des points abord\u00e9s les deux premiers jours<br \/>Approfondissement des sujets s\u00e9lectionn\u00e9s avec l\u2019intervenant<\/p><h3>Mise en pratique<\/h3><p>Le dernier jour de ce stage est enti\u00e8rement consacr\u00e9 \u00e0 des mises en pratique<\/p><p><strong>S\u00e9lection et participation \u00e0 une comp\u00e9tition<\/strong><\/p><h3>Le formateur s\u00e9lectionnera une comp\u00e9tition en cours sur Kaggle qui sera d\u00e9marr\u00e9e en jour 3 par l\u2019ensemble des participants<\/h3><\/li><\/ol><\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t\t\t<div class=\"elementor-toggle-item\">\n\t\t\t\t\t<div id=\"elementor-tab-title-2075\" class=\"elementor-tab-title\" data-tab=\"5\" role=\"tab\" aria-controls=\"elementor-tab-content-2075\" aria-expanded=\"false\">\n\t\t\t\t\t\t\t\t\t\t\t\t<span class=\"elementor-toggle-icon elementor-toggle-icon-left\" aria-hidden=\"true\">\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t<span class=\"elementor-toggle-icon-closed\"><i class=\"fas fa-caret-right\"><\/i><\/span>\n\t\t\t\t\t\t\t\t<span class=\"elementor-toggle-icon-opened\"><i class=\"elementor-toggle-icon-opened fas fa-caret-up\"><\/i><\/span>\n\t\t\t\t\t\t\t\t\t\t\t\t\t<\/span>\n\t\t\t\t\t\t\t\t\t\t\t\t<a href=\"\" class=\"elementor-toggle-title\">FORMATION DATA VISUALISATION POUR DATA SCIENCE<\/a>\n\t\t\t\t\t<\/div>\n\n\t\t\t\t\t<div id=\"elementor-tab-content-2075\" class=\"elementor-tab-content elementor-clearfix\" data-tab=\"5\" role=\"tabpanel\" aria-labelledby=\"elementor-tab-title-2075\"><h2>Objectifs de la formation<\/h2><p>Cette\u00a0<strong>formation Data Visualisation Data Scientist<\/strong>\u00a0vous permettra, en tant que data scientist, de mettre en valeur les r\u00e9sultats de vos travaux de la meilleure des mani\u00e8res.<\/p><p>\u00c0 l&#8217;issue de cette formation, vous aurez acquis les connaissances et les comp\u00e9tences n\u00e9cessaires pour :<\/p><ul><li>Appr\u00e9hender les principales librairies de data visualisation utilis\u00e9es en Python<\/li><li>Savoir effectuer les transformations de donn\u00e9es n\u00e9cessaires \u00e0 la data visualisation en Python (agr\u00e9gation, donn\u00e9es manquantes, etc.)<\/li><li>Savoir cr\u00e9er des graphes en Python<\/li><li>Savoir cr\u00e9er un dashboard basique en Python pour mettre en valeur des graphes<\/li><\/ul><h2>\u00c0 qui s&#8217;adresse cette formation ?<\/h2><p><strong>Public :<\/strong><\/p><p>Ce cours Data Visualisation pour Data Scientist s&#8217;adresse prioritairement aux data scientists. Dans une seconde mesure, il pourra \u00e9galement int\u00e9resser les d\u00e9veloppeurs habitu\u00e9s \u00e0 coder en Python et en R.<\/p><p><strong>Pr\u00e9requis :<\/strong><\/p><p>Pour suivre cette formation Data Visualisation pour Data Scientist dans de bonnes conditions, il est n\u00e9cessaire d&#8217;avoir des connaissances de base en programmation ou scripting avec Python ou R.<\/p><h2>\u00a0Contenu du cours<\/h2><ol><li><h3>La data visualisation pour le data scientist<\/h3><p>Identifier les apports de la data visualisation<br \/>Choisir des repr\u00e9sentations de donn\u00e9es adapt\u00e9es<br \/>D\u00e9couvrir les outils et librairies Python pour la visualisation et le dashboarding<\/p><p><strong><em>Mise en pratique<\/em><\/strong><\/p><p><em>R\u00e9aliser ses premiers graphes sur un jeu de donn\u00e9es pr\u00eat \u00e0 l\u2019emploi<\/em><\/p><p><strong><em>Mise en pratique<\/em><\/strong><\/p><p><em>R\u00e9aliser des graphes sur un jeu de donn\u00e9es brutes<\/em><\/p><p>Transformer des donn\u00e9es avec Pandas (Calculs d\u2019agr\u00e9gats, traitement des valeurs manquantes, etc.)<br \/>Cr\u00e9er des graphes sur diff\u00e9rents types de donn\u00e9es (qualitatives, quantitatives, s\u00e9ries temporelles)<br \/>Affiner ses graphes (\u00e9chelle, valeurs aberrantes, etc.)<\/p><p><strong><em>Mise en pratique<\/em><\/strong><\/p><p><em>R\u00e9aliser un dashboard simple<\/em><\/p><p>Cr\u00e9er des graphes et boutons simples permettant l\u2019action de l\u2019utilisateur<br \/>Obtenir les pr\u00e9dictions d\u2019un mod\u00e8le de Machine Learning<\/p><\/li><\/ol><\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t\t\t<div class=\"elementor-toggle-item\">\n\t\t\t\t\t<div id=\"elementor-tab-title-2076\" class=\"elementor-tab-title\" data-tab=\"6\" role=\"tab\" aria-controls=\"elementor-tab-content-2076\" aria-expanded=\"false\">\n\t\t\t\t\t\t\t\t\t\t\t\t<span class=\"elementor-toggle-icon elementor-toggle-icon-left\" aria-hidden=\"true\">\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t<span class=\"elementor-toggle-icon-closed\"><i class=\"fas fa-caret-right\"><\/i><\/span>\n\t\t\t\t\t\t\t\t<span class=\"elementor-toggle-icon-opened\"><i class=\"elementor-toggle-icon-opened fas fa-caret-up\"><\/i><\/span>\n\t\t\t\t\t\t\t\t\t\t\t\t\t<\/span>\n\t\t\t\t\t\t\t\t\t\t\t\t<a href=\"\" class=\"elementor-toggle-title\">FORMATION INDUSTRIALISER UN PROJET DATA SCIENCE<\/a>\n\t\t\t\t\t<\/div>\n\n\t\t\t\t\t<div id=\"elementor-tab-content-2076\" class=\"elementor-tab-content elementor-clearfix\" data-tab=\"6\" role=\"tabpanel\" aria-labelledby=\"elementor-tab-title-2076\"><h2>Objectifs de la formation<\/h2><p>Cette\u00a0<strong>formation Data Science<\/strong>\u00a0vous fournit les meilleures pratiques pour faire passer votre projet du stade de la recherche \u00e0 celui de l&#8217;exploitation. Gr\u00e2ce \u00e0 ces bonnes pratiques de d\u00e9veloppement, vos applications de data science seront ainsi en mesure d&#8217;apporter de la valeur en entreprise.<\/p><p>\u00a0<\/p><p>\u00c0 l&#8217;issue de cette\u00a0<strong>formation Data Science<\/strong>, vous aurez acquis les connaissances et comp\u00e9tences n\u00e9cessaires pour :<\/p><ul><li>Savoir emmener votre mod\u00e8le de data science en production<\/li><li>Apprendre \u00e0 g\u00e9rer les nouvelles contraintes<\/li><li>Minimiser le co\u00fbt de transfert de l\u2019exploration \u00e0 la production<\/li><li>D\u00e9couvrir les concepts de Software Craftsmanship (clean code) appliqu\u00e9s \u00e0 la Data Science<\/li><\/ul><h2>\u00c0 qui s&#8217;adresse cette formation ?<\/h2><p><strong>\u00a0Public :<\/strong><\/p><p>Ce cours Data Science s&#8217;adresse aux analystes, statisticiens et d\u00e9veloppeurs.<\/p><p><strong>Pr\u00e9requis :<\/strong><\/p><p>Pour suivre cette formation Data Science, il est n\u00e9cessaire de poss\u00e9der des connaissances de base de la Data Science (mod\u00e8les, biais, variances&#8230;), des connaissances des librairies de manipulation de donn\u00e9es en Python (pandas, numpy&#8230;) ainsi qu&#8217;une connaissance de la ligne de commande linux\u00a0<\/p><h2>\u00a0Contenu du cours<\/h2><ol><li><h3>Introduction et rappels sur la Data Science<\/h3><p>R\u00f4le du data scientist<br \/>Convictions<\/p><h3>Installation des environnements<\/h3><p>Jupyter Notebook<br \/>PyCharm<br \/>Environnement anaconda<\/p><h3>Clean code et notebook<\/h3><p>Nettoyer son notebook<br \/>Noms des variables<br \/>Utilisation de fichiers de configuration<br \/>Programmation fonctionnelle<br \/>Immutabilit\u00e9<br \/>Cr\u00e9er des fonctions<\/p><p><strong><em>Mise en pratique<\/em><\/strong><\/p><p><em>Appliquer les techniques de Clean code \u00e0 un notebook<\/em><\/p><h3>Tester son code<\/h3><p>D\u00e9couverte du TDD<br \/>Initiation \u00e0 unittest :<br \/>&#8211; Les classes de test<br \/>&#8211; \u00c9crire son premier test<br \/>&#8211; Les m\u00e9thode setup et teardown<br \/>Int\u00e9gration \u00e0 setuptools<\/p><p><strong><em>Mise en pratique<\/em><\/strong><\/p><p><em>\u00c9crire ses premiers tests<\/em><\/p><h3>Documenter son projet<\/h3><p>D\u00e9couverte de Sphinx<br \/>D\u00e9couverte de sphinx-quickstart<\/p><p><strong><em>Mise en pratique<\/em><\/strong><\/p><p><em>Documenter son projet<\/em><\/p><h3>G\u00e9rer les versions<\/h3><p>Introduction \u00e0 git<br \/>G\u00e9rer les versions de code<br \/>Utilisation des tags<br \/>Strat\u00e9gies de versionning<br \/>G\u00e9rer des datasets et des mod\u00e8les<\/p><h3>Rendre son code d\u00e9ployable<\/h3><p>D\u00e9finition du packaging<br \/>Introduction \u00e0 setuptools<br \/>Installer son code en local<br \/>Gestion des d\u00e9pendances<br \/>R\u00e8gles simples de d\u00e9marrage<\/p><p><strong><em>Mise en pratique<\/em><\/strong><\/p><p><em>Cr\u00e9er et installer son package<\/em><\/p><h3>Conclusion<\/h3><p>Synth\u00e8se des points abord\u00e9s<br \/>Partage sur la formation<br \/>Questions\/R\u00e9ponses additionnelles<\/p><\/li><\/ol><\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t\t\t<div class=\"elementor-toggle-item\">\n\t\t\t\t\t<div id=\"elementor-tab-title-2077\" class=\"elementor-tab-title\" data-tab=\"7\" role=\"tab\" aria-controls=\"elementor-tab-content-2077\" aria-expanded=\"false\">\n\t\t\t\t\t\t\t\t\t\t\t\t<span class=\"elementor-toggle-icon elementor-toggle-icon-left\" aria-hidden=\"true\">\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t<span class=\"elementor-toggle-icon-closed\"><i class=\"fas fa-caret-right\"><\/i><\/span>\n\t\t\t\t\t\t\t\t<span class=\"elementor-toggle-icon-opened\"><i class=\"elementor-toggle-icon-opened fas fa-caret-up\"><\/i><\/span>\n\t\t\t\t\t\t\t\t\t\t\t\t\t<\/span>\n\t\t\t\t\t\t\t\t\t\t\t\t<a href=\"\" class=\"elementor-toggle-title\">FORMATION INDUSTRIALISATION AVANC\u00c9E PROJET DATA SCIENCE<\/a>\n\t\t\t\t\t<\/div>\n\n\t\t\t\t\t<div id=\"elementor-tab-content-2077\" class=\"elementor-tab-content elementor-clearfix\" data-tab=\"7\" role=\"tabpanel\" aria-labelledby=\"elementor-tab-title-2077\"><h2>Objectifs de la formation<\/h2><p>Cette\u00a0<strong>formation Data Science avanc\u00e9<\/strong>\u00a0vous propose de d\u00e9couvrir les syst\u00e8mes de Data Science industrialis\u00e9s, et vous fait pratiquer les meilleures m\u00e9thodes pour faire passer votre projet en production.\u00a0<\/p><p>\u00c0 l&#8217;issue de cette\u00a0<strong>formation Data Science avanc\u00e9<\/strong>, vous aurez acquis les connaissances et comp\u00e9tences n\u00e9cessaires pour :<\/p><ul><li>D\u00e9couvrir le d\u00e9coupage d\u2019un projet de Machine Learning en diff\u00e9rentes briques et les organiser<\/li><li>Savoir construire l&#8217;architecture applicative d&#8217;un projet Data Science<\/li><li>D\u00e9ployer son application de Machine Learning en production et interagir avec<\/li><li>Faire consommer des donn\u00e9es chaque seconde \u00e0 une application de Machine Learning<\/li><li>Mesurer les performances de son application de Machine Learning<\/li><\/ul><h2>\u00c0 qui s&#8217;adresse cette formation ?<\/h2><p><strong>\u00a0Public :<\/strong><\/p><p>Ce cours Data Science avanc\u00e9 s&#8217;adresse principalement aux data scientist, data engineer, machine learning engineer et d\u00e9veloppeurs d&#8217;applications de Data Science.<\/p><p><strong>Pr\u00e9requis :<\/strong><\/p><p>Pour suivre cette formation Data Science avanc\u00e9, il est n\u00e9cessaire :<\/p><p>&#8211; de poss\u00e9der des connaissances de base en programmation et en scripting<br \/>&#8211; d&#8217;avoir suivi la\u00a0formation Data Science : Industrialiser un projet de Data Science \u00a0ou de savoir packager et tester une application Python<br \/>&#8211; d&#8217;avoir suivi la\u00a0formation Data Scientist : Les fondamentaux de la Data Science ou de savoir mod\u00e9liser et d\u00e9velopper un probl\u00e8me de Data Science simple<\/p><h2>Contenu du cours<\/h2><ol><li><h3>I<\/h3><h3>Introduction \u00e0 la CI \/ CD<\/h3><p>Les diff\u00e9rents environnements n\u00e9cessaires<br \/>L\u2019int\u00e9r\u00eat de l\u2019int\u00e9gration continue et du d\u00e9ploiement continu<br \/>Les outils de CI \/ CD existants<\/p><p><strong><em>Mise en pratique<\/em><\/strong><\/p><p><em>Mettre en place un outil d\u2019int\u00e9gration continue<\/em><\/p><h3>Pyramide de tests<\/h3><p>Description des diff\u00e9rents types de tests<br \/>Focus sur les tests d\u2019int\u00e9grations et fonctionnels<br \/>Pr\u00e9sentation de framework de tests<\/p><h3>Cloud<\/h3><p>Introduction au cloud et aux diff\u00e9rents providers<br \/>Choix d\u2019un cloud provider pour les travaux pratiques<\/p><h3>Orchestration<\/h3><p>Le besoin d\u2019orchestration dans un syst\u00e8me de Data Science<br \/>Pr\u00e9sentation de diff\u00e9rents orchestrateurs<\/p><p><strong><em>Mise en pratique<\/em><\/strong><\/p><p><em>Passer d\u2019un script Python \u00e0 une s\u00e9rie de t\u00e2ches orchestr\u00e9es avec Airflow<\/em><\/p><ol><li>\u00a0<\/li><\/ol><h3>Architecture<\/h3><p>Patterns d\u2019architecture technique pour favoriser la mise en production et la maintenabilit\u00e9 du projet<br \/>Identification des artefacts (mod\u00e8les, donn\u00e9es, code\u2026)<br \/>Cycles de vie des artefacts<\/p><h3>D\u00e9ploiement<\/h3><p>La d\u00e9marche<br \/>Infrastructure as code<\/p><h3>Exposition<\/h3><p>M\u00e9thodes pour exposer un mod\u00e8le de Data Science<\/p><p><strong><em>Mise en pratique<\/em><\/strong><\/p><p><em>Interagir avec un mod\u00e8le existant<\/em><\/p><ol start=\"2\"><li>\u00a0<\/li><\/ol><p><strong><em>Mise en pratique<\/em><\/strong><\/p><p><em>Passer d\u2019un mod\u00e8le one-shot \u00e0 un mod\u00e8le qui pr\u00e9dit toutes les secondes<\/em><\/p><p>\u00c0 partir d\u2019un flux de donn\u00e9es disponibles, mettre en place les outils n\u00e9cessaires pour faire une pr\u00e9diction par seconde<\/p><h3>Feedback loops<\/h3><p>L\u2019int\u00e9r\u00eat des boucles de feedback<br \/>Identifier les diff\u00e9rentes boucles de feedbacks<br \/>Mettre en place les diff\u00e9rentes boucles de feedbacks<\/p><h3>Monitoring<\/h3><p>L\u2019enjeu du monitoring<br \/>Les indicateurs \u00e0 suivre<br \/>Les pratiques pour mettre en place un monitoring utile tout en respectant les contraintes de SLA<\/p><h3>R\u00e9entra\u00eenement des mod\u00e8les<\/h3><p>Choisir le bon moment pour r\u00e9entra\u00eener un mod\u00e8le<br \/>Les strat\u00e9gies \u00e0 mettre en place pour s\u2019assurer que le mod\u00e8le en production est toujours pertinent<\/p><h3>Bilan et cl\u00f4ture<\/h3><p>Partage et retour d\u2019exp\u00e9rience<br \/>Questions \/ r\u00e9ponses<br \/>\u00c9valuation de la session<\/p><\/li><\/ol><\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t\t\t<div class=\"elementor-toggle-item\">\n\t\t\t\t\t<div id=\"elementor-tab-title-2078\" class=\"elementor-tab-title\" data-tab=\"8\" role=\"tab\" aria-controls=\"elementor-tab-content-2078\" aria-expanded=\"false\">\n\t\t\t\t\t\t\t\t\t\t\t\t<span class=\"elementor-toggle-icon elementor-toggle-icon-left\" aria-hidden=\"true\">\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t<span class=\"elementor-toggle-icon-closed\"><i class=\"fas fa-caret-right\"><\/i><\/span>\n\t\t\t\t\t\t\t\t<span class=\"elementor-toggle-icon-opened\"><i class=\"elementor-toggle-icon-opened fas fa-caret-up\"><\/i><\/span>\n\t\t\t\t\t\t\t\t\t\t\t\t\t<\/span>\n\t\t\t\t\t\t\t\t\t\t\t\t<a href=\"\" class=\"elementor-toggle-title\">FORMATION MAITRISER L\u2019INDUSTRIALISATION D\u2019UN PROJET DE DATA SCIENCE<\/a>\n\t\t\t\t\t<\/div>\n\n\t\t\t\t\t<div id=\"elementor-tab-content-2078\" class=\"elementor-tab-content elementor-clearfix\" data-tab=\"8\" role=\"tabpanel\" aria-labelledby=\"elementor-tab-title-2078\"><h2>Objectifs de la formation<\/h2><p>Cette\u00a0<strong>formation Industrialisation Data Science<\/strong>\u00a0commence par vous fournir les meilleures pratiques pour faire passer votre projet du stade de la recherche \u00e0 celui de l&#8217;exploitation. Gr\u00e2ce \u00e0 ces bonnes pratiques de d\u00e9veloppement, vos applications de data science seront ainsi en mesure d&#8217;apporter de la valeur en entreprise.<\/p><p>\u00a0<\/p><p>\u00c0 l&#8217;issue de cette\u00a0<strong>formation Industrialisation Data Science<\/strong>, vous aurez acquis les connaissances et comp\u00e9tences n\u00e9cessaires pour :<\/p><ul><li>Savoir emmener votre mod\u00e8le de data science en production<\/li><li>Apprendre \u00e0 g\u00e9rer les nouvelles contraintes<\/li><li>Minimiser le co\u00fbt de transfert de l\u2019exploration \u00e0 la production<\/li><li>D\u00e9couvrir les concepts de Software Craftsmanship (clean code) appliqu\u00e9s \u00e0 la Data Science<\/li><li>D\u00e9couvrir le d\u00e9coupage d\u2019un projet de Machine Learning en diff\u00e9rentes briques et les organiser<\/li><li>Savoir construire l&#8217;architecture applicative d&#8217;un projet Data Science<\/li><li>D\u00e9ployer son application de Machine Learning en production et interagir avec<\/li><li>Faire consommer des donn\u00e9es chaque seconde \u00e0 une application de Machine Learning<\/li><li>Mesurer les performances de son application de Machine Learning<\/li><\/ul><h2>\u00c0 qui s&#8217;adresse cette formation ?<\/h2><p><strong>Public :<\/strong><\/p><p>Ce cours Industrialisation Data Science s&#8217;adresse aux analystes, statisticiens, d\u00e9veloppeurs, data scientist, data engineer, machine learning engineer et d\u00e9veloppeurs d&#8217;applications de Data Science.<\/p><p><strong>Pr\u00e9requis :<\/strong><\/p><p>Pour suivre cette formation Industrialisation Data Science, il est n\u00e9cessaire de poss\u00e9der des connaissances de base de la Data Science (mod\u00e8les, biais, variances&#8230;), des connaissances des librairies de manipulation de donn\u00e9es en Python (pandas, numpy&#8230;) ainsi qu&#8217;une connaissance de la ligne de commande linux (bash par exemple).<\/p><h2>Contenu du cours<\/h2><ol><li><p><em><strong>Jour 1<\/strong><\/em><\/p><h3>Introduction et rappels sur la Data Science<\/h3><p>R\u00f4le du data scientist<br \/>Convictions<\/p><h3>Installation des environnements<\/h3><p>Jupyter Notebook<br \/>PyCharm<br \/>Environnement anaconda<\/p><h3>Clean code et notebook<\/h3><p>Nettoyer son notebook<br \/>Noms des variables<br \/>Utilisation de fichiers de configuration<br \/>Programmation fonctionnelle<br \/>Immutabilit\u00e9<br \/>Cr\u00e9er des fonctions<\/p><p><strong><em>Mise en pratique<\/em><\/strong><\/p><p><em>Appliquer les techniques de Clean code \u00e0 un notebook<\/em><\/p><h3>Tester son code<\/h3><p>D\u00e9couverte du TDD<br \/>Initiation \u00e0 unittest :<br \/>&#8211; Les classes de test<br \/>&#8211; \u00c9crire son premier test<br \/>&#8211; Les m\u00e9thode setup et teardown<br \/>Int\u00e9gration \u00e0 setuptools<\/p><p><strong><em>Mise en pratique<\/em><\/strong><\/p><p><em>\u00c9crire ses premiers tests<\/em><\/p><p><em><strong>Jour 2<\/strong><\/em><\/p><h3>Documenter son projet<\/h3><p>D\u00e9couverte de Sphinx<br \/>D\u00e9couverte de sphinx-quickstart<\/p><p><strong><em>Mise en pratique<\/em><\/strong><\/p><p><em>Documenter son projet<\/em><\/p><h3>G\u00e9rer les versions<\/h3><p>Introduction \u00e0 git<br \/>G\u00e9rer les versions de code<br \/>Utilisation des tags<br \/>Strat\u00e9gies de versionning<br \/>G\u00e9rer des datasets et des mod\u00e8les<\/p><h3>Rendre son code d\u00e9ployable<\/h3><p>D\u00e9finition du packaging<br \/>Introduction \u00e0 setuptools<br \/>Installer son code en local<br \/>Gestion des d\u00e9pendances<br \/>R\u00e8gles simples de d\u00e9marrage<\/p><p><strong><em>Mise en pratique<\/em><\/strong><\/p><p><em>Cr\u00e9er et installer son package<\/em><\/p><p><em><strong>Jour 3<\/strong><\/em><\/p><h3>Introduction \u00e0 la CI \/ CD<\/h3><p>Les diff\u00e9rents environnements n\u00e9cessaires<br \/>L\u2019int\u00e9r\u00eat de l\u2019int\u00e9gration continue et du d\u00e9ploiement continu<br \/>Les outils de CI \/ CD existants<\/p><p><strong><em>Mise en pratique<\/em><\/strong><\/p><p><em>Mettre en place un outil d\u2019int\u00e9gration continue<\/em><\/p><h3>Pyramide de tests<\/h3><p>Description des diff\u00e9rents types de tests<br \/>Focus sur les tests d\u2019int\u00e9grations et fonctionnels<br \/>Pr\u00e9sentation de framework de tests<\/p><h3>Cloud<\/h3><p>Introduction au cloud et aux diff\u00e9rents providers<br \/>Choix d\u2019un cloud provider pour les travaux pratiques<\/p><h3>Orchestration<\/h3><p>Le besoin d\u2019orchestration dans un syst\u00e8me de Data Science<br \/>Pr\u00e9sentation de diff\u00e9rents orchestrateurs<\/p><p><strong><em>Mise en pratique<\/em><\/strong><\/p><p><em>Passer d\u2019un script Python \u00e0 une s\u00e9rie de t\u00e2ches orchestr\u00e9es avec Airflow<\/em><\/p><p><strong><em>Jour 4<\/em><\/strong><\/p><h3>Architecture<\/h3><p>Patterns d\u2019architecture technique pour favoriser la mise en production et la maintenabilit\u00e9 du projet<br \/>Identification des artefacts (mod\u00e8les, donn\u00e9es, code\u2026)<br \/>Cycles de vie des artefacts<\/p><h3>D\u00e9ploiement<\/h3><p>La d\u00e9marche<br \/>Infrastructure as code<\/p><h3>Exposition<\/h3><p>M\u00e9thodes pour exposer un mod\u00e8le de Data Science<\/p><p><strong><em>Mise en pratique<\/em><\/strong><\/p><p><em>Interagir avec un mod\u00e8le existant<\/em><\/p><p><strong><em>Jour 5<\/em><\/strong><\/p><p><strong><em>Mise en pratique<\/em><\/strong><\/p><p><em>Passer d\u2019un mod\u00e8le one-shot \u00e0 un mod\u00e8le qui pr\u00e9dit toutes les secondes<\/em><\/p><p>\u00c0 partir d\u2019un flux de donn\u00e9es disponibles, mettre en place les outils n\u00e9cessaires pour faire une pr\u00e9diction par seconde<\/p><h3>Feedback loops<\/h3><p>L\u2019int\u00e9r\u00eat des boucles de feedback<br \/>Identifier les diff\u00e9rentes boucles de feedbacks<br \/>Mettre en place les diff\u00e9rentes boucles de feedbacks<\/p><h3>Monitoring<\/h3><p>L\u2019enjeu du monitoring<br \/>Les indicateurs \u00e0 suivre<br \/>Les pratiques pour mettre en place un monitoring utile tout en respectant les contraintes de SLA<\/p><h3>R\u00e9entra\u00eenement des mod\u00e8les<\/h3><p>Choisir le bon moment pour r\u00e9entra\u00eener un mod\u00e8le<br \/>Les strat\u00e9gies \u00e0 mettre en place pour s\u2019assurer que le mod\u00e8le en production est toujours pertinent<\/p><h3>Bilan et cl\u00f4ture<\/h3><h3>Partage et retour d\u2019exp\u00e9rience<br \/>Questions \/ r\u00e9ponses<br \/>\u00c9valuation de la session<\/h3><\/li><\/ol><\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t\t\t<div class=\"elementor-toggle-item\">\n\t\t\t\t\t<div id=\"elementor-tab-title-2079\" class=\"elementor-tab-title\" data-tab=\"9\" role=\"tab\" aria-controls=\"elementor-tab-content-2079\" aria-expanded=\"false\">\n\t\t\t\t\t\t\t\t\t\t\t\t<span class=\"elementor-toggle-icon elementor-toggle-icon-left\" aria-hidden=\"true\">\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t<span class=\"elementor-toggle-icon-closed\"><i class=\"fas fa-caret-right\"><\/i><\/span>\n\t\t\t\t\t\t\t\t<span class=\"elementor-toggle-icon-opened\"><i class=\"elementor-toggle-icon-opened fas fa-caret-up\"><\/i><\/span>\n\t\t\t\t\t\t\t\t\t\t\t\t\t<\/span>\n\t\t\t\t\t\t\t\t\t\t\t\t<a href=\"\" class=\"elementor-toggle-title\">FORMATION HADOOP \u2013 CLOUDERA POUR DATA ANALYST<\/a>\n\t\t\t\t\t<\/div>\n\n\t\t\t\t\t<div id=\"elementor-tab-content-2079\" class=\"elementor-tab-content elementor-clearfix\" data-tab=\"9\" role=\"tabpanel\" aria-labelledby=\"elementor-tab-title-2079\"><h2>Objectifs de la formation<\/h2><p>Cette\u00a0<strong>formation Hadoop Cloudera Data Analyst<\/strong>\u00a0se destine aux professionnels de la donn\u00e9es amen\u00e9s \u00e0 acc\u00e9der, manipuler, transformer et analyser des ensembles de donn\u00e9es complexes, en utilisant SQL et les langages de script les plus courants.<\/p><p>\u00a0<\/p><p>\u00c0 l&#8217;issue de cette\u00a0<strong>formation officielle Hadoop Cloudera Data Analyst,<\/strong>\u00a0vous aurez acquis les connaissances et comp\u00e9tences n\u00e9cessaires pour :<\/p><ul><li>Acqu\u00e9rir, stocker et analyser des donn\u00e9es \u00e0 l&#8217;aide de Hive et Impala<\/li><li>Effectuer des t\u00e2ches fondamentales d&#8217;ETL avec les outils Hadoop (extraire, transformer et charger) : ingestion et traitement avec Hadoop<\/li><li>Utiliser Hive et Impala pour am\u00e9liorer la productivit\u00e9 sur les t\u00e2ches d&#8217;analyse typiques<\/li><li>Relier des jeux de donn\u00e9es de diverses provenances pour obtenir une meilleure connaissance commerciale<\/li><li>Effectuer des requ\u00eates complexes sur les jeux de donn\u00e9es<\/li><\/ul><h2>\u00c0 qui s&#8217;adresse cette formation ?<\/h2><p><strong>\u00a0Public :<\/strong><\/p><p>Ce cours officiel Hadoop Cloudera Data Analyst s&#8217;adresse aux analystes de donn\u00e9es, sp\u00e9cialistes de la business intelligence, d\u00e9veloppeurs, architectes syst\u00e8me et administrateurs de bases de donn\u00e9es.<\/p><p><strong>Pr\u00e9requis :<\/strong><\/p><p>Pour suivre cette formation Hadoop Cloudera Data Analyst, il est n\u00e9cessaire de poss\u00e9der des connaissances en SQL ainsi que des connaissances de base des lignes de commandes Linux. Il est recommand\u00e9 \u00e9galement de conna\u00eetre un langage de script comme Bash scripting, Perl, Python ou Ruby.<\/p><h2>Contenu du cours<\/h2><ol><li><h3>Les fondamentaux d&#8217;Hadoop<\/h3><p>Pourquoi choisir Hadoop ?<br \/>Pr\u00e9sentation d\u2019Hadoop<br \/>Stockage de donn\u00e9es : HDFS<br \/>Traitement des donn\u00e9es distribu\u00e9es : YARN, MapReduce et Spark<br \/>Traitement et analyse des donn\u00e9es : Hive et Impala<br \/>Int\u00e9gration de base de donn\u00e9es : Sqoop<br \/>Les autres outils Hadoop<br \/>Pr\u00e9sentation des exercices<\/p><h3>Introduction \u00e0 Hive et \u00e0 Impala<\/h3><p>Pr\u00e9sentation de Hive<br \/>Pr\u00e9sentation d&#8217;Impala<br \/>Pourquoi utiliser Hive et Impala ?<br \/>Sch\u00e9ma et stockage de donn\u00e9es<br \/>Comparaison de Hive et Impala avec les bases de donn\u00e9es traditionnelles<br \/>Cas d&#8217;utilisation<\/p><h3>Requ\u00eates avec Hive et Impala<\/h3><p>Bases de donn\u00e9es et tables<br \/>Syntaxe de base des langages de requ\u00eate Hive et Impala<br \/>Types de donn\u00e9es<br \/>Utilisation de Hue pour ex\u00e9cuter des requ\u00eates<br \/>Utilisation de Beeline (Shell Hive)<br \/>Utilisation de Impala Shell<\/p><ol><li>\u00a0<\/li><\/ol><h3>Les op\u00e9rateurs communs et fonctions built-in<\/h3><p>Op\u00e9rateurs<br \/>Fonctions scalaires<br \/>Fonctions d&#8217;agr\u00e9gation<\/p><h3>Gestion des donn\u00e9es avec Hive et Impala<\/h3><p>Stockage de donn\u00e9es<br \/>Cr\u00e9ation de bases de donn\u00e9es et de tables<br \/>Chargement des donn\u00e9es<br \/>Modification des bases de donn\u00e9es et des tables<br \/>Simplification des requ\u00eates au moyen de vues<br \/>Enregistrement des r\u00e9sultats de requ\u00eates<\/p><h3>Stockage de donn\u00e9es et performances<\/h3><p>Tables partitionn\u00e9es<br \/>Chargement des donn\u00e9es dans des tables partitionn\u00e9es<br \/>Quand utiliser le partitionnement<br \/>Choisir un format de fichier<br \/>Utilisation des formats de fichier Avro et Parquet<\/p><ol start=\"2\"><li>\u00a0<\/li><\/ol><h3>Analyse relationnelle de donn\u00e9es avec Hive et Impala<\/h3><p>Jointure de jeux de donn\u00e9es<br \/>Fonctions communes int\u00e9gr\u00e9es<br \/>Agr\u00e9gation et fen\u00eatrage<\/p><h3>Les fonctions analytiques et le fen\u00eatrage<\/h3><p>Utiliser des fonctions analytiques<br \/>Autres fonctions analytiques<br \/>Fen\u00eatres glissantes<\/p><h3>Donn\u00e9es complexes avec Hive et Impala<\/h3><p>Donn\u00e9es complexes avec Hive<br \/>Donn\u00e9es complexes avec Impala<\/p><h3>Analyse de texte avec Hive et Impala<\/h3><p>Utilisation d&#8217;expressions r\u00e9guli\u00e8res avec Hive et Impala<br \/>Traitement des donn\u00e9es textuelles dans Hive avec des SerDes<br \/>Analyse de sentiment et n-grams<\/p><ol start=\"3\"><li>\u00a0<\/li><\/ol><h3>Optimisation de Hive<\/h3><p>Comprendre les performances des requ\u00eates<br \/>Bucketing<br \/>Indexation des donn\u00e9es<br \/>4Hive sur Spark<\/p><h3>Optimisation d&#8217;Impala<\/h3><p>Ex\u00e9cution de requ\u00eate avec Impala<br \/>Am\u00e9liorer la performance d\u2019Impala<\/p><h3>Extension de Hive et d&#8217;Impala<\/h3><p>SerDes et formats de fichier personnalis\u00e9s dans Hive<br \/>Transformation de donn\u00e9es avec des scripts personnalis\u00e9s dans Hive<br \/>Fonctions d\u00e9finies par l&#8217;utilisateur<br \/>Requ\u00eates param\u00e9tr\u00e9es<\/p><h3>Choisir le meilleur outil<\/h3><p>Comparaison de Pig, Hive, Impala et des bases de donn\u00e9es relationnelles<br \/>Crit\u00e8res de choix<\/p><h3>Module optionnel (en fonction de l&#8217;avancement) : Apache Kudu<\/h3><p>Qu\u2019est-ce que Kudu<br \/>Les tables Kudu<br \/>Utiliser Impala avec Kudu<\/p><\/li><\/ol><\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t\t\t<div class=\"elementor-toggle-item\">\n\t\t\t\t\t<div id=\"elementor-tab-title-20710\" class=\"elementor-tab-title\" data-tab=\"10\" role=\"tab\" aria-controls=\"elementor-tab-content-20710\" aria-expanded=\"false\">\n\t\t\t\t\t\t\t\t\t\t\t\t<span class=\"elementor-toggle-icon elementor-toggle-icon-left\" aria-hidden=\"true\">\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t<span class=\"elementor-toggle-icon-closed\"><i class=\"fas fa-caret-right\"><\/i><\/span>\n\t\t\t\t\t\t\t\t<span class=\"elementor-toggle-icon-opened\"><i class=\"elementor-toggle-icon-opened fas fa-caret-up\"><\/i><\/span>\n\t\t\t\t\t\t\t\t\t\t\t\t\t<\/span>\n\t\t\t\t\t\t\t\t\t\t\t\t<a href=\"\" class=\"elementor-toggle-title\">FORMATION DATA SCIENCE NATURAL LANGUAGE PROCESSING (NLP) ET SPEECH RECOGNITION<\/a>\n\t\t\t\t\t<\/div>\n\n\t\t\t\t\t<div id=\"elementor-tab-content-20710\" class=\"elementor-tab-content elementor-clearfix\" data-tab=\"10\" role=\"tabpanel\" aria-labelledby=\"elementor-tab-title-20710\"><h2>Objectifs de la formation<\/h2><p>Cette\u00a0<strong>formation Data Science NLP &amp; Speech Recognition<\/strong>\u00a0pr\u00e9pare les data scientists \u00e0 ma\u00eetriser les donn\u00e9es texte et voix au sein d&#8217;un contexte technologique innovant et en particulier au cours d&#8217;un projet d&#8217;Intelligence Artificielle.<\/p><p>\u00c0 l&#8217;issue de cette\u00a0<strong>formation <\/strong>\u00a0vous aurez acquis les connaissances et les comp\u00e9tences n\u00e9cessaires pour :<\/p><ul><li>Savoir structurer les donn\u00e9es texte et voix<\/li><li>Savoir analyser un volume cons\u00e9quent de donn\u00e9es texte et\/ou voix et appliquer des mod\u00e8les de machine learning<\/li><li>Savoir traiter de la voix et\/ou du texte en temps r\u00e9el<\/li><li>Savoir mettre en place une recherche intelligente dans des documents et\/ou enregistrements audio<\/li><li>Savoir cr\u00e9er des mod\u00e8les de d\u00e9tection d&#8217;intention, d&#8217;entit\u00e9s<\/li><\/ul><h2>\u00c0 qui s&#8217;adresse cette formation ?<\/h2><p><strong>Public :<\/strong><\/p><p>Ce cours Data Science NLP &amp; Speech Recognition s&#8217;adresse aux :<\/p><ul><li>Analystes<\/li><li>Statisticiens<\/li><li>Architectes<\/li><li>D\u00e9veloppeurs<\/li><li>Data scientists<\/li><li>Machine Learning Engineers<\/li><\/ul><p><strong>Pr\u00e9requis :<\/strong><\/p><p>Pour suivre cette formation Data Science NLP &amp; Speech Recognition, il est n\u00e9cessaire d&#8217;avoir des connaissances g\u00e9n\u00e9rales sur le Machine Learning ainsi qu&#8217;en statistiques. Des notions de base en Python sont \u00e9galement demand\u00e9es.<\/p><h2>Contenu du cours<\/h2><ol><li><p><strong>Introduction au domaine de l&#8217;analyse du texte et de la voix<\/strong><\/p><p>NLP, NLU, Speech processing et understanding<\/p><p><strong>Natural Language Processing (NLP)<\/strong><\/p><p>Les bases du NLP : encoding, regex, tokenisation(n-grams) bag of words<br \/>NLP : la r\u00e9duction de dimensions<br \/>Nettoyer le texte : stemming, lemmatisation<br \/>Topic modeling : SVD, NMF, LDA<br \/>Word embedding : Word2vec, FastText, etc.<\/p><p><strong>Information Retrieval (IR) : cr\u00e9er un moteur de recherche<\/strong><\/p><p>Indexation de contenu, moteur recherche simple<br \/>R\u00e9aliser un moteur de recherche intelligent<\/p><h3>1.\u00a0\u00a0\u00a0 \u00a0<\/h3><p><strong>Natural Language Understanding (NLU)<\/strong><\/p><p>Les cas d\u2019usages au travers de mises en pratique :<br \/>&#8211; Cr\u00e9er un mod\u00e8le simple d\u2019analyse de sentiments<br \/>&#8211; Cr\u00e9er un mod\u00e8le simple de d\u00e9tection d\u2019intention<br \/>&#8211; Cr\u00e9er un mod\u00e8le simple de d\u00e9tection d&#8217;entit\u00e9s NER<br \/>M\u00e9thodologie avanc\u00e9e :<br \/>&#8211; Mettre en place un mod\u00e8le de machine learning sur du texte (analyse de sentiment, etc.)<br \/>&#8211; Mod\u00e9lisation deep learning : Sequence, Bert, HuggingFace<br \/>Consommer une API de NLP :<br \/>&#8211; Utiliser une API externe<\/p><h3>2.\u00a0\u00a0\u00a0 \u00a0<\/h3><p><strong>Speech Processing<\/strong><\/p><p>Introduction \u00e0 la donn\u00e9e audio : signal num\u00e9rique, encodage<br \/>Speech recognition :<br \/>&#8211; Entra\u00eener un mod\u00e8le de speech to text (trigger word detection)<br \/>&#8211; Utiliser un mod\u00e8le de speech to text complet (API Cloud, mod\u00e8le pr\u00e9-entra\u00een\u00e9)<\/p><p><strong>Speech Understanding<\/strong><\/p><p>Les cas d\u2019usages :<br \/>&#8211; D\u00e9tection intention<br \/>&#8211; Analyse de sentiments<br \/>Speech analysis :<br \/>&#8211; Repr\u00e9sentation : transform\u00e9e de Fourier, spectrogramme mel MFCC, (librosa, pyaudio)<br \/>&#8211; Les particularit\u00e9 du langage parl\u00e9 : syntaxe, gestion du d\u00e9bit de parole, erreur de transcription<br \/>&#8211; Speaker Embedding : caract\u00e9riser le timbre, l\u2019intonation de la voix<\/p><\/li><\/ol><\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t\t\t<div class=\"elementor-toggle-item\">\n\t\t\t\t\t<div id=\"elementor-tab-title-20711\" class=\"elementor-tab-title\" data-tab=\"11\" role=\"tab\" aria-controls=\"elementor-tab-content-20711\" aria-expanded=\"false\">\n\t\t\t\t\t\t\t\t\t\t\t\t<span class=\"elementor-toggle-icon elementor-toggle-icon-left\" aria-hidden=\"true\">\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t<span class=\"elementor-toggle-icon-closed\"><i class=\"fas fa-caret-right\"><\/i><\/span>\n\t\t\t\t\t\t\t\t<span class=\"elementor-toggle-icon-opened\"><i class=\"elementor-toggle-icon-opened fas fa-caret-up\"><\/i><\/span>\n\t\t\t\t\t\t\t\t\t\t\t\t\t<\/span>\n\t\t\t\t\t\t\t\t\t\t\t\t<a href=\"\" class=\"elementor-toggle-title\">FORMATION DATA SCIENCE BONNE PRATIQUE DE L\u2019INTELLIGENCE ARTIFICIELLE<\/a>\n\t\t\t\t\t<\/div>\n\n\t\t\t\t\t<div id=\"elementor-tab-content-20711\" class=\"elementor-tab-content elementor-clearfix\" data-tab=\"11\" role=\"tabpanel\" aria-labelledby=\"elementor-tab-title-20711\"><h2>Objectifs de la formation<\/h2><p>Cette\u00a0<strong>formation Data Science : S&#8217;approprier les bonnes pratiques de l&#8217;Intelligence Artificielle responsable<\/strong>a pour objectif de permettre aux data scientists ainsi qu&#8217;\u00e0 leurs managers d&#8217;appr\u00e9hender les enjeux et les leviers d&#8217;action existants pour d\u00e9velopper et impl\u00e9menter des syst\u00e8mes d&#8217;IA plus responsables.<\/p><p>\u00a0<\/p><p>\u00c0 l&#8217;issue de cette\u00a0<strong>formation <\/strong>\u00a0vous aurez acquis les connaissances et les comp\u00e9tences n\u00e9cessaires pour :<\/p><ul><li>Prendre conscience des probl\u00e8mes d\u2019\u00e9thique en Data Science<\/li><li>D\u00e9couvrir les diff\u00e9rentes typologies de probl\u00e8mes<\/li><li>Appr\u00e9hender les responsabilit\u00e9s de chacun<\/li><li>Favoriser l&#8217;interpr\u00e9tabilit\u00e9 des mod\u00e8les<\/li><li>D\u00e9tecter les biais discriminatoires et les corriger<\/li><\/ul><h2>\u00c0 qui s&#8217;adresse cette formation ?<\/h2><p><strong>Public :<\/strong><\/p><p>Ce cours Intelligence Artificielle Responsable s&#8217;adresse prioritairement aux data scientists. Il int\u00e9ressera \u00e9galement les managers, analystes, statisticiens, architectes et d\u00e9veloppeurs.<\/p><p><strong>Pr\u00e9requis :<\/strong><\/p><p>Pour suivre cette formation Intelligence Artificielle Responsable, les participants doivent poss\u00e9der des connaissances pr\u00e9alables en data science et en machine learning ainsi qu&#8217;en programmation ou en scripting. Des notions en statistiques sont un plus.<\/p><h2>Contenu du cours<\/h2><ol><li><h3>Pr\u00e9sentation crois\u00e9e et attentes des participants<\/h3><p>D\u00e9finition des concepts li\u00e9s \u00e0 la Data et \u00e0 l&#8217;Intelligence Artificielle (IA)<\/p><h3>Pr\u00e9sentation des diff\u00e9rentes typologies de probl\u00e8me<\/h3><p>Responsabilit\u00e9s juridiques<br \/>Protection des donn\u00e9es personnelles<br \/>Biais discriminatoires<br \/>Pr\u00e9sentation des 5 piliers de l&#8217;IA Responsable<\/p><h3>Interpr\u00e9tabilit\u00e9 : pouvoir expliquer ses mod\u00e8les<\/h3><p>L&#8217;interpr\u00e9tabilit\u00e9 pour qui ?<br \/>Les sources de complexit\u00e9<br \/>Le trade-off Performance vs Interpr\u00e9tabilit\u00e9<br \/>Les outils (Eli5, Lime, Shap)<\/p><p><strong><em>Mise en pratique<\/em><\/strong><\/p><p><em>D\u00e9monstration au travers d&#8217;un cas d&#8217;usage<\/em><\/p><h3>La vigilance : conna\u00eetre ses donn\u00e9es<\/h3><p>L&#8217;origine des biais<br \/>Des v\u00e9rifications \u00e0 tous les niveaux<br \/>Les outils (AI Fairness 360)<\/p><p><strong><em>Mise en pratique<\/em><\/strong><\/p><p><em>D\u00e9monstration au travers d&#8217;un cas d&#8217;usage<\/em><\/p><h3>Cl\u00f4ture<\/h3><p>Retour d\u2019exp\u00e9rience<br \/>Questions\/R\u00e9ponses<br \/>\u00c9valuation de la session<\/p><\/li><\/ol><\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t<div class=\"elementor-column elementor-col-50 elementor-top-column elementor-element elementor-element-f92389c\" data-id=\"f92389c\" data-element_type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t\t\t<div class=\"elementor-element elementor-element-efb6798 elementor-widget elementor-widget-image\" data-id=\"efb6798\" data-element_type=\"widget\" data-widget_type=\"image.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t<style>\/*! elementor - v3.7.8 - 02-10-2022 *\/\n.elementor-widget-image{text-align:center}.elementor-widget-image a{display:inline-block}.elementor-widget-image a img[src$=\".svg\"]{width:48px}.elementor-widget-image img{vertical-align:middle;display:inline-block}<\/style>\t\t\t\t\t\t\t\t\t\t\t\t<img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"284\" src=\"https:\/\/705consulting.com\/wp-content\/uploads\/2021\/01\/fous-1024x284.jpg\" class=\"attachment-large size-large\" alt=\"\" srcset=\"https:\/\/705consulting.com\/wp-content\/uploads\/2021\/01\/fous-1024x284.jpg 1024w, https:\/\/705consulting.com\/wp-content\/uploads\/2021\/01\/fous-300x83.jpg 300w, https:\/\/705consulting.com\/wp-content\/uploads\/2021\/01\/fous-768x213.jpg 768w, https:\/\/705consulting.com\/wp-content\/uploads\/2021\/01\/fous-1536x426.jpg 1536w, https:\/\/705consulting.com\/wp-content\/uploads\/2021\/01\/fous.jpg 1920w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/>\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t\t\t\t<\/div>\n\t\t","protected":false},"excerpt":{"rendered":"<p>FORMATION CURSUS DATA SCIENTIST Objectifs de la formation Le m\u00e9tier de Data Scientist est apparu ces derni\u00e8res ann\u00e9es pour faire face \u00e0 la multiplication des donn\u00e9es, \u00e0 la diversit\u00e9 de leurs formes et de leurs sources : le Big Data. Le r\u00f4le du Data Scientist : rendre les donn\u00e9es exploitables, les traiter pour leur donner [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"parent":0,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":{"footnotes":""},"class_list":["post-13026","page","type-page","status-publish","hentry"],"_links":{"self":[{"href":"https:\/\/705consulting.com\/index.php\/wp-json\/wp\/v2\/pages\/13026","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/705consulting.com\/index.php\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/705consulting.com\/index.php\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/705consulting.com\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/705consulting.com\/index.php\/wp-json\/wp\/v2\/comments?post=13026"}],"version-history":[{"count":4,"href":"https:\/\/705consulting.com\/index.php\/wp-json\/wp\/v2\/pages\/13026\/revisions"}],"predecessor-version":[{"id":13030,"href":"https:\/\/705consulting.com\/index.php\/wp-json\/wp\/v2\/pages\/13026\/revisions\/13030"}],"wp:attachment":[{"href":"https:\/\/705consulting.com\/index.php\/wp-json\/wp\/v2\/media?parent=13026"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}