Expert en sciences des données (MS)
Certification RNCP35197
Formacodes 31011 | Cloud computing 31052 | Data Warehouse
Nomenclature Europe Niveau 7
Formacodes 31011 | Cloud computing 31052 | Data Warehouse
Nomenclature Europe Niveau 7
Les métiers associés à la certification RNCP35197 : Expertise et support en systèmes d'information Études et prospectives socio-économiques Administration de systèmes d'information Études et développement informatique
Codes NSF 326m | Informatique, traitement de l'information
Voies d'accès : Formation initiale Contrat d'apprentissage Formation continue Contrat de professionnalisation Candidature individuelle VAE
Prérequis : Les conditions d’admission sont fixées par la CGE dans le cadre de Mastère Spécialisé labélisé. Sont donc recevables les candidatures de titulaires d’un des diplômes suivants : ? Diplôme d’ingénieur habilité par la Commission des Titres d’Ingénieur (liste
Certificateurs :
Voies d'accès : Formation initiale Contrat d'apprentissage Formation continue Contrat de professionnalisation Candidature individuelle VAE
Prérequis : Les conditions d’admission sont fixées par la CGE dans le cadre de Mastère Spécialisé labélisé. Sont donc recevables les candidatures de titulaires d’un des diplômes suivants : ? Diplôme d’ingénieur habilité par la Commission des Titres d’Ingénieur (liste
Certificateurs :
| Certificateur | SIRET |
|---|---|
| INST NAT SCIENCES APPLIQUEES ROUEN | 19760165100023 |
Activités visées :
L’expert en sciences des données réalise la gestion et l’analyse pointue des données massives pour la stratégie et l’opérationnel de l’entreprise.
Dans ce cadre, il réalise plusieurs activités : - dans ce premier grand champ d’activité, il va analyser les données, en procédant à leur analyse dans le cadre de la modélisation des données massives hétérogènes ou non d’une entreprise puis il va élaborer un modèle prédictif de traitement de données afin de modéliser ces données.
- dans un second grand champ d’activités, il va s’atteler à extraire et collecter des données via une technique d’analyse et de stockage pour chaque donnée ; il va réaliser le traitement et l’exploitation des données collectées et veiller à l’amélioration continue du traitement des données structurées ou non structurées.
- enfin, il va avoir pour mission d’élaborer une stratégie d’exploitation et de valorisation de la donnée lui permettant d’exploiter les données hétérogènes de la structure, puis d’organiser et planifier des projets de la structure, de façon collaborative et avec les différents services de la structure concernés par la donnée.
L’expert en sciences des données réalise la gestion et l’analyse pointue des données massives pour la stratégie et l’opérationnel de l’entreprise.
Dans ce cadre, il réalise plusieurs activités : - dans ce premier grand champ d’activité, il va analyser les données, en procédant à leur analyse dans le cadre de la modélisation des données massives hétérogènes ou non d’une entreprise puis il va élaborer un modèle prédictif de traitement de données afin de modéliser ces données.
- dans un second grand champ d’activités, il va s’atteler à extraire et collecter des données via une technique d’analyse et de stockage pour chaque donnée ; il va réaliser le traitement et l’exploitation des données collectées et veiller à l’amélioration continue du traitement des données structurées ou non structurées.
- enfin, il va avoir pour mission d’élaborer une stratégie d’exploitation et de valorisation de la donnée lui permettant d’exploiter les données hétérogènes de la structure, puis d’organiser et planifier des projets de la structure, de façon collaborative et avec les différents services de la structure concernés par la donnée.
Capacités attestées :
Bloc de compétences 1 : Modéliser les données massives d'une structure C1.1. Maitriser les outils d’analyse pour décrire les données en tenant compte du contexte. C1.2. Identifier l’outil de modélisation statistique en fonction du type de donnée, structurée ou non structurée, afin de la traiter. C1.3. Effectuer l’analyse exploratoire et la description des masses de données au travers d’une méthode statistique pour déterminer les problématiques de description, de projection, de visualisation et de regroupement des données en catégories homogènes. C2.1. Sélectionner une méthodologie de traitement statistique au regard du problème posé, du type de donnée pour la modéliser. C2.2. Concevoir et réaliser un prototype du modèle à partir de logiciels de programmation haut niveau pour montrer la faisabilité et la pertinence du modèle. C2.3. Evaluer la performance du modèle au regard des contraintes de mise en production pour le mettre en œuvre. Bloc de compétences 2 : Collecter, structurer et traiter les données d'une structure C1.1. Maitriser et utiliser les outils d’interrogation des bases de données pour extraire et collecter les données. C1.2. Concevoir un système d’ingénierie de données en définissant une approche méthodologique de collecte, de stockage et d’interrogation pour l’analyse de masse de données réelles. C2.1. Elaborer et mettre en place une stratégie de traitement distribué en ligne ou hors ligne de la donnée structurée et non structurée par un langage de programmation fonctionnel afin de les exploiter. C2.2. Développer des implémentations au regard des données à traiter pour cadrer les algorithmes et performances prédictives. C3.1. Analyser les retours pour mettre à jour l’exploitation et le stockage des données. C3.2. Repérer le type de problème rencontré, d’apprentissage ou de fouille de données, en utilisant des algorithmes d’optimisation pour le résoudre. Bloc de compétences 3 : Concevoir une stratégie de valorisation de la donnée C1.1. Maîtriser les fonctionnalités d’une architecture informatique robuste pour le stockage et le traitement distribué des données. C1.2. Traduire un problème business en problème mathématiques/statistiques afin de définir une stratégie de valorisation des données pour exploiter les informations décisionnelles de la structure. C1.3. Concevoir une stratégie de valorisation des données en proposant des « entrepôts de données » tenant compte de l’écosystème économique, réglementaire et des contraintes de sécurité liées au traitement des données. C.2.1 Formuler et présenter des analyses statistiques décisionnels à viser des différents services de la structure pour les accompagner dans leur prise de décision. C.2.2 Communiquer sur le potentiel des outils innovants de représentation, de modélisation et de visualisation pour contribuer à la plus-value et la prise de décisions utiles à la structure. C.2.3 Dimensionner les actions du projet en définissant les choix techniques et méthodologiques des interventions pour évaluer et planifier les ressources techniques, budgétaires et humaines. C.2.4 Communiquer sur la stratégie de valorisation des données de la structure pour sensibiliser les acteurs, accompagner au changement et améliorer le fonctionnement interne.
Bloc de compétences 1 : Modéliser les données massives d'une structure C1.1. Maitriser les outils d’analyse pour décrire les données en tenant compte du contexte. C1.2. Identifier l’outil de modélisation statistique en fonction du type de donnée, structurée ou non structurée, afin de la traiter. C1.3. Effectuer l’analyse exploratoire et la description des masses de données au travers d’une méthode statistique pour déterminer les problématiques de description, de projection, de visualisation et de regroupement des données en catégories homogènes. C2.1. Sélectionner une méthodologie de traitement statistique au regard du problème posé, du type de donnée pour la modéliser. C2.2. Concevoir et réaliser un prototype du modèle à partir de logiciels de programmation haut niveau pour montrer la faisabilité et la pertinence du modèle. C2.3. Evaluer la performance du modèle au regard des contraintes de mise en production pour le mettre en œuvre. Bloc de compétences 2 : Collecter, structurer et traiter les données d'une structure C1.1. Maitriser et utiliser les outils d’interrogation des bases de données pour extraire et collecter les données. C1.2. Concevoir un système d’ingénierie de données en définissant une approche méthodologique de collecte, de stockage et d’interrogation pour l’analyse de masse de données réelles. C2.1. Elaborer et mettre en place une stratégie de traitement distribué en ligne ou hors ligne de la donnée structurée et non structurée par un langage de programmation fonctionnel afin de les exploiter. C2.2. Développer des implémentations au regard des données à traiter pour cadrer les algorithmes et performances prédictives. C3.1. Analyser les retours pour mettre à jour l’exploitation et le stockage des données. C3.2. Repérer le type de problème rencontré, d’apprentissage ou de fouille de données, en utilisant des algorithmes d’optimisation pour le résoudre. Bloc de compétences 3 : Concevoir une stratégie de valorisation de la donnée C1.1. Maîtriser les fonctionnalités d’une architecture informatique robuste pour le stockage et le traitement distribué des données. C1.2. Traduire un problème business en problème mathématiques/statistiques afin de définir une stratégie de valorisation des données pour exploiter les informations décisionnelles de la structure. C1.3. Concevoir une stratégie de valorisation des données en proposant des « entrepôts de données » tenant compte de l’écosystème économique, réglementaire et des contraintes de sécurité liées au traitement des données. C.2.1 Formuler et présenter des analyses statistiques décisionnels à viser des différents services de la structure pour les accompagner dans leur prise de décision. C.2.2 Communiquer sur le potentiel des outils innovants de représentation, de modélisation et de visualisation pour contribuer à la plus-value et la prise de décisions utiles à la structure. C.2.3 Dimensionner les actions du projet en définissant les choix techniques et méthodologiques des interventions pour évaluer et planifier les ressources techniques, budgétaires et humaines. C.2.4 Communiquer sur la stratégie de valorisation des données de la structure pour sensibiliser les acteurs, accompagner au changement et améliorer le fonctionnement interne.
Secteurs d'activité :
L’expert en sciences des données travaille sur des technologies numériques à haute valeur ajoutée intellectuelle et technique dans des entreprises de toutes tailles : grands groupes, sociétés de prestations (consultants), collectivités territoriales, PME, startups. Il peut exercer son activité dans les secteurs suivants : les banques, les compagnies d’assurances, les sociétés de transport, les cabinets de conseil, les entreprises spécialisées dans l’énergie, le web marketing, les plateformes d’e-commerce, l’industrie, la R&D.
L’expert en sciences des données travaille sur des technologies numériques à haute valeur ajoutée intellectuelle et technique dans des entreprises de toutes tailles : grands groupes, sociétés de prestations (consultants), collectivités territoriales, PME, startups. Il peut exercer son activité dans les secteurs suivants : les banques, les compagnies d’assurances, les sociétés de transport, les cabinets de conseil, les entreprises spécialisées dans l’énergie, le web marketing, les plateformes d’e-commerce, l’industrie, la R&D.
Types d'emplois accessibles :
L’expert en sciences des données (data scientist) détermine et met en œuvre une stratégie de collecte des données massives, complexes et hétérogènes (structurées ou non structurées), afin d’en retirer l’information pour une prise de décision optimale. Il maîtrise les méthodes efficaces de collecte, stockage, mise en forme, visualisation, modélisation et traitement de ces données. Il explore les données de multiples sources dispersées. Suivant les secteurs et les structures, il assure les postes et fonctions suivantes : - Data analyst et data scientist : procède à des analyses sur les approches statistiques possibles en relation avec des enjeux métiers. Conçoit et déploie des modèles prédictifs. Maintient, améliore et conçoit des algorithmes d’extraction d’information. Traduit les données en leviers opérationnels, accompagne les développeurs jusqu’au déploiement en production des solutions et assure une veille technologique. - Consultant valorisation des données : analyse les besoins clients big data, définit les architectures applicatives et techniques nécessaires au traitement des données, conçoit des modèles de données, participe au développement et à l’implémentation des algorithmes de traitement, à la mise en production, rédige la documentation associée et effectue la veille technologique sur les nouvelles tendances autour de l’exploitation des données. - Business analyst/business developer : interface indispensable entre les départements opérationnels de l’entreprise et le service informatique, il analyse le processus d’information et les stratégies au service de la prise de décision quotidienne de sa société afin d’en évaluer l’efficacité ou d’apporter les ajustements nécessaires. Autres appellations de fonctions possibles : - Ingénieur d’étude et développement de données massives - Strategy manager/project manager L’expert en sciences des données est un cadre détenant des compétences techniques, scientifiques et transversales faisant de lui un vecteur facilitant la prise de décision en entreprise. Il est à même d’intervenir au plus haut niveau de la stratégie de l’entreprise. Il est l'interlocuteur privilégié du Directeur des Systèmes Informatiques, comme du Directeur Marketing, du Directeur R&D ou Bureaux d’études, comme encore du Président de start up. Son niveau de responsabilité varie en fonction du positionnement de l’entreprise et de sa stratégie de valorisation des données. Il est amené à travailler dans un environnement multi-échelle, à l’interface entre différents services : R&D, informatique, marketing, ressources humaines, direction financière, direction générale, etc.
L’expert en sciences des données (data scientist) détermine et met en œuvre une stratégie de collecte des données massives, complexes et hétérogènes (structurées ou non structurées), afin d’en retirer l’information pour une prise de décision optimale. Il maîtrise les méthodes efficaces de collecte, stockage, mise en forme, visualisation, modélisation et traitement de ces données. Il explore les données de multiples sources dispersées. Suivant les secteurs et les structures, il assure les postes et fonctions suivantes : - Data analyst et data scientist : procède à des analyses sur les approches statistiques possibles en relation avec des enjeux métiers. Conçoit et déploie des modèles prédictifs. Maintient, améliore et conçoit des algorithmes d’extraction d’information. Traduit les données en leviers opérationnels, accompagne les développeurs jusqu’au déploiement en production des solutions et assure une veille technologique. - Consultant valorisation des données : analyse les besoins clients big data, définit les architectures applicatives et techniques nécessaires au traitement des données, conçoit des modèles de données, participe au développement et à l’implémentation des algorithmes de traitement, à la mise en production, rédige la documentation associée et effectue la veille technologique sur les nouvelles tendances autour de l’exploitation des données. - Business analyst/business developer : interface indispensable entre les départements opérationnels de l’entreprise et le service informatique, il analyse le processus d’information et les stratégies au service de la prise de décision quotidienne de sa société afin d’en évaluer l’efficacité ou d’apporter les ajustements nécessaires. Autres appellations de fonctions possibles : - Ingénieur d’étude et développement de données massives - Strategy manager/project manager L’expert en sciences des données est un cadre détenant des compétences techniques, scientifiques et transversales faisant de lui un vecteur facilitant la prise de décision en entreprise. Il est à même d’intervenir au plus haut niveau de la stratégie de l’entreprise. Il est l'interlocuteur privilégié du Directeur des Systèmes Informatiques, comme du Directeur Marketing, du Directeur R&D ou Bureaux d’études, comme encore du Président de start up. Son niveau de responsabilité varie en fonction du positionnement de l’entreprise et de sa stratégie de valorisation des données. Il est amené à travailler dans un environnement multi-échelle, à l’interface entre différents services : R&D, informatique, marketing, ressources humaines, direction financière, direction générale, etc.
Objectif contexte :
Cette certification, accréditée par la CGE depuis sa mise en œuvre en 2015 (et réaccréditée cette année), a été créée afin de former des professionnels capables de répondre à l’enjeu actuel de l’exploitation des données massives. Ces données ouvrent de no
Cette certification, accréditée par la CGE depuis sa mise en œuvre en 2015 (et réaccréditée cette année), a été créée afin de former des professionnels capables de répondre à l’enjeu actuel de l’exploitation des données massives. Ces données ouvrent de no
Statistiques : :
| Année | Certifiés | Certifiés VAE | Taux d'insertion global à 6 mois | Taux d'insertion métier à 2 ans |
|---|---|---|---|---|
| 2018 | 16 | 0 | 100 | |
| 2017 | 12 | 0 | 83 | 64 |
Bloc de compétences
RNCP35197BC01 : Modéliser les données massives d'une structure
Compétences :
C1.1. Maitriser les outils d’analyse pour décrire les données en tenant compte du contexte. C1.2. Identifier l’outil de modélisation statistique en fonction du type de donnée, structurée ou non structurée, afin de la traiter. C1.3. Effectuer l’analyse exploratoire et la description des masses de données au travers d’une méthode statistique pour déterminer les problématiques de description, de projection, de visualisation et de regroupement des données en catégories homogènes. C2.1. Sélectionner une méthodologie de traitement statistique au regard du problème posé, du type de donnée pour la modéliser. C2.2. Concevoir et réaliser un prototype du modèle à partir de logiciels de programmation haut niveau pour montrer la faisabilité et la pertinence du modèle. C2.3. Evaluer la performance du modèle au regard des contraintes de mise en production pour le mettre en œuvre.
C1.1. Maitriser les outils d’analyse pour décrire les données en tenant compte du contexte. C1.2. Identifier l’outil de modélisation statistique en fonction du type de donnée, structurée ou non structurée, afin de la traiter. C1.3. Effectuer l’analyse exploratoire et la description des masses de données au travers d’une méthode statistique pour déterminer les problématiques de description, de projection, de visualisation et de regroupement des données en catégories homogènes. C2.1. Sélectionner une méthodologie de traitement statistique au regard du problème posé, du type de donnée pour la modéliser. C2.2. Concevoir et réaliser un prototype du modèle à partir de logiciels de programmation haut niveau pour montrer la faisabilité et la pertinence du modèle. C2.3. Evaluer la performance du modèle au regard des contraintes de mise en production pour le mettre en œuvre.
Modalités d'évaluation :
E1 - Mise en situation professionnelle reconstituée d’analyse de données publiquement disponibles : chaque candidat réalise un support (code, rapport) de son modèle d'analyse exploratoire et de représentation des données E2 - Thèse professionnelle E3 - Projet en groupe E4 : QCM de 10 questions sur les concepts théoriques et pratiques.Exemple de thématiques: -modèle SVM et Bayes - modèle d'apprentissage supervisé vs non supervisé - modèle convolutif et récurrent (IA) - optimisation
E1 - Mise en situation professionnelle reconstituée d’analyse de données publiquement disponibles : chaque candidat réalise un support (code, rapport) de son modèle d'analyse exploratoire et de représentation des données E2 - Thèse professionnelle E3 - Projet en groupe E4 : QCM de 10 questions sur les concepts théoriques et pratiques.Exemple de thématiques: -modèle SVM et Bayes - modèle d'apprentissage supervisé vs non supervisé - modèle convolutif et récurrent (IA) - optimisation
RNCP35197BC03 : Concevoir une stratégie de valorisation de la donnée
Compétences :
C1.1. Maîtriser les fonctionnalités d’une architecture informatique robuste pour le stockage et le traitement distribué des données. C1.2. Traduire un problème business en problème mathématiques/statistiques afin de définir une stratégie de valorisation des données pour exploiter les informations décisionnelles de la structure. C1.3. Concevoir une stratégie de valorisation des données en proposant des « entrepôts de données » tenant compte de l’écosystème économique, réglementaire et des contraintes de sécurité liées au traitement des données. C.2.1 Formuler et présenter des analyses statistiques décisionnels à viser des différents services de la structure pour les accompagner dans leur prise de décision. C.2.2 Communiquer sur le potentiel des outils innovants de représentation, de modélisation et de visualisation pour contribuer à la plus-value et la prise de décisions utiles à la structure. C.2.3 Dimensionner les actions du projet en définissant les choix techniques et méthodologiques des interventions pour évaluer et planifier les ressources techniques, budgétaires et humaines. C.2.4 Communiquer sur la stratégie de valorisation des données de la structure pour sensibiliser les acteurs, accompagner au changement et améliorer le fonctionnement interne.
C1.1. Maîtriser les fonctionnalités d’une architecture informatique robuste pour le stockage et le traitement distribué des données. C1.2. Traduire un problème business en problème mathématiques/statistiques afin de définir une stratégie de valorisation des données pour exploiter les informations décisionnelles de la structure. C1.3. Concevoir une stratégie de valorisation des données en proposant des « entrepôts de données » tenant compte de l’écosystème économique, réglementaire et des contraintes de sécurité liées au traitement des données. C.2.1 Formuler et présenter des analyses statistiques décisionnels à viser des différents services de la structure pour les accompagner dans leur prise de décision. C.2.2 Communiquer sur le potentiel des outils innovants de représentation, de modélisation et de visualisation pour contribuer à la plus-value et la prise de décisions utiles à la structure. C.2.3 Dimensionner les actions du projet en définissant les choix techniques et méthodologiques des interventions pour évaluer et planifier les ressources techniques, budgétaires et humaines. C.2.4 Communiquer sur la stratégie de valorisation des données de la structure pour sensibiliser les acteurs, accompagner au changement et améliorer le fonctionnement interne.
Modalités d'évaluation :
E2 - Thèse professionnelle E3 - Projet en groupe E7 - Mise en situation professionnelle réelle sur la réglementation, la sécurisation des données:Chaque apprenant(e) traite l'aspect règlementaire sur une problématique de l'entreprise dans laquelle il (elle) réalise son alternance
E2 - Thèse professionnelle E3 - Projet en groupe E7 - Mise en situation professionnelle réelle sur la réglementation, la sécurisation des données:Chaque apprenant(e) traite l'aspect règlementaire sur une problématique de l'entreprise dans laquelle il (elle) réalise son alternance
RNCP35197BC02 : Collecter, structurer et traiter les données d'une structure
Compétences :
C1.1. Maitriser et utiliser les outils d’interrogation des bases de données pour extraire et collecter les données. C1.2. Concevoir un système d’ingénierie de données en définissant une approche méthodologique de collecte, de stockage et d’interrogation pour l’analyse de masse de données réelles. C2.1. Elaborer et mettre en place une stratégie de traitement distribué en ligne ou hors ligne de la donnée structurée et non structurée par un langage de programmation fonctionnel afin de les exploiter. C2.2. Développer des implémentations au regard des données à traiter pour cadrer les algorithmes et performances prédictives. C3.1. Analyser les retours pour mettre à jour l’exploitation et le stockage des données. C3.2. Repérer le type de problème rencontré, d’apprentissage ou de fouille de données, en utilisant des algorithmes d’optimisation pour le résoudre.
C1.1. Maitriser et utiliser les outils d’interrogation des bases de données pour extraire et collecter les données. C1.2. Concevoir un système d’ingénierie de données en définissant une approche méthodologique de collecte, de stockage et d’interrogation pour l’analyse de masse de données réelles. C2.1. Elaborer et mettre en place une stratégie de traitement distribué en ligne ou hors ligne de la donnée structurée et non structurée par un langage de programmation fonctionnel afin de les exploiter. C2.2. Développer des implémentations au regard des données à traiter pour cadrer les algorithmes et performances prédictives. C3.1. Analyser les retours pour mettre à jour l’exploitation et le stockage des données. C3.2. Repérer le type de problème rencontré, d’apprentissage ou de fouille de données, en utilisant des algorithmes d’optimisation pour le résoudre.
Modalités d'évaluation :
E2 - Thèse professionnelle E3 - Projet en groupe E5 : Mise en situation professionnelle reconstituée sur le stockage de la donnée:Chaque candidat réalise la conception, la configuration et l'implémentation de systèmes de stockage de la donnée via des outils d'interrogation des bases de données et à partir de données publiquement disponibles. E6 : Mise en situation professionnelle reconstituée portant sur l’architecture de traitement distribuée de données:Chaque candidat conçoit et réalise une architecture de traitement distribuée des données à partir de données publiquement disponibles.
E2 - Thèse professionnelle E3 - Projet en groupe E5 : Mise en situation professionnelle reconstituée sur le stockage de la donnée:Chaque candidat réalise la conception, la configuration et l'implémentation de systèmes de stockage de la donnée via des outils d'interrogation des bases de données et à partir de données publiquement disponibles. E6 : Mise en situation professionnelle reconstituée portant sur l’architecture de traitement distribuée de données:Chaque candidat conçoit et réalise une architecture de traitement distribuée des données à partir de données publiquement disponibles.