Azizi D.

Data Scientist

830 dollar

My experience

More

CNAV (ASSURANCE)October 2020 - Present

Expertises : Python, Pandas profiling, sweetviz, DTale, CDSW, Random forest, SVM, RL DecisionTrees

Réalisation d’un modèle pour détecter les assuré.e.s futur.e.s réclamant.e.s à la caisse nationale d’assurance vieillesse.
  • Contexte Big Data et travaux réalisés sur Cloudera.
  • Volumétrie : Dizaine de millions d’enregistrements * Centaine de features
  • Jeux de données fortement déséquilibré (umballanced dataset).
  • Utilisation de plusieurs algorithmes pour classer les assuré.e.s.
More

Saur (HYDRAULIQUE)July 2020 - August 2020

Expertises : Python, Xgboost, Pandas profiling

Réalisation d’un modèle pour expliquer la consommation d’eau par secteur d’activités des clients de Saur sur le territoire Breton.
  • Recherche de données : pluviométriques, météorologiques, Insee, piézométriques et des mesures débits et hauteurs des cours d’eaux.
  • Création de features à partir des données ci-dessous.
  • Utilisation de l’algorithme XGBRegressor avec une features_selection.
  • Présentation des résultats et perspectives à la fin de la mission.
More

PSA (AUTOMOBILE)September 2018 - July 2020

Expertises : Python, Tkinter, Tableau Software, Knapsack algorithm

Réalisation d’un outil d’engagement de commandes. Il permet d’optimiser le volume de commandes de voitures à effectuer par les concessionnaires du groupe PSA.
  • Réalisations de requêtes Business Object (BO) pour récupérer certaines données « métiers ».
  • Récupération des données provenant de requêtes BO sur Outlook.
  • Analyse et exploration des données dans Python en utilisant Matplolib, Pandas et Numpy.
  • Traitement des données afin d’en sortir des insights pertinents.
  • Réalisation du modèle de distribution en utilisant l’algorithme du sac à dos (Knapsack algorithm).
  • Utilisation des insights dans l’algorithme du sac à dos.
  • Proposition de quantité de voitures par concessionnaires.
  • Réunion quotidienne avec les responsables métiers pour étudier la pertinence des données.
  • Contact en anglais avec les différentes filiales du groupe pour valider les taches réalisées.
  • Déploiement de l’outil sous forme d’une application avec interface graphique.
More

Umanis R&D (RECHERCHE ET DEVELOPMENT)July 2018 - September 2018

Expertises : MongoDB, Robomogo, Python, GitLab, TSP

1 - Réalisation de scripts python pour automatiser le stockage et la mise à jour de données (CV) dans MongoDB dans le cadre d’un projet de « Big Data RH ».

2 - Travaux de recherche sur le problème du voyageur de commerce (TSP) pour l’optimisation des temps de trajets pendant les plans de tournées.

  • Réalisation de script Python pour stocker les données dans MongoDB (Pymongo).
  • Requêtes sur MongoDB pour vérifier leurs mises à jour dans la base de données.
  • Traitement des CVs des docteurs pour détecter des mots clés et identifier leurs disciplines initiales en utilisant la librairie Spacy (NLP)
  • Recherche de Base de données open source pour récolter des données de trajet de taxi dans le cadre du projet TSP
  • Utilisation d’API open sources (Google Maps, Open Weather, etc.)

More

CMS GROUP (ASSURANCE)March 2018 - July 2018

Expertises : MongoDB, Kafka, Python, Algorithme XgBoost (Arbres de décision)

Réalisation d’un modèle prédictif en assurance maladie en utilisant des données du groupe américain « Prudential».
  • Récupération des données sur Kaggle
  • Stockage des données dans une base de données (MongoDB).
  • Réalisation de Requêtes MongoDB sous python.
  • Analyse descriptive et visuelle des données sous python.
  • Nettoyage des données dans Python en utilisant les librairies Pandas et Numpy.
  • Visualisation des données nettoyées en utilisant les librairies Seaborn et MatPlotLib.
  • Réalisation du modèle prédictif en utilisant les arbres de décision (XGBoost).
  • Simulation de l’envoi des données en temps réel en utilisant Kafka (Confluent_kafka).
More

CEREMA (RECHERHCE)October 2014 - March 2018

Expertises : MatLab, Comsol, Python, Imagerie Infrarouge thermique

Estimations et prédictions hydrauliques sous MatLab et Python en utilisant différents types d’algorithmes : Algorithmes génétiques, Algorithmes stochastiques, Algorithmes hybrides, …

Objectif du projet : L’objectif consiste à utiliser des données thermiques, des images infrarouge thermique et des géophysiques pour réaliser des modèles permettant d’estimer les propriétés et paramètres hydrauliques. Ces paramètres sont utilisés par la suite pour prédire la productivité hydraulique, les écoulements dans le milieu, etc.

Mission
  • Mise en œuvre des protocoles expérimentaux.
  • Acquisition et traitement des données.
  • Visualisation des données sous Python.
  • Réalisation de modèles multi-physique (Modélisations physique et mathématique).
  • Implémentation des algorithmes sous MatLab.

Les principaux algorithmes implémentés sont :
  • Algorithme génétique.
  • Hamiltonian Monte Carlo.
  • Manifold Metropolis adjusted Langevin algorithm.

My stack

Environment of Development

GitLab

Business Intelligence

Tableau Software, Tibco Spotfire

Technologies

Machine Learning, Matplotlib, Pandas, NumPy, Tkinter, PyMongo

CAD&CAM

AutoCAD

Artificial Intelligence

Dataiku

Databases

MongoDB, Google BigQuery, SQL Server, MySQL

Big Data

Data Visualization, Apache Kafka, Big Data

Languages

Python, R Language, Matlab

Analysis methods and tools

Scrum

Machine Learning

Clustering, K-means, Deep learning

Industrial automation

COMSOL

IT Infrastructure

Google Cloud Platform (GCP)

Others

Teamwork, Natural Language Processing (NLP), Artificial Intelligence, Google Maps API, SVM

My education and trainings

Formations - -

Doctorat de Modélisation et prédiction hydraulique (MatLab/Python/Comsol) - Université de Rouen2014 - 2018

Master 2 de Géophysique appliquée (Matlab/Scilab) - Université Pierre et Marie Curie (Paris VI)2013 - 2014