Souleymane S.

Data Scientist

555 dollar
Freelancer
1 year
Boulogne-Billancourt, FRANCE

My experience

More

Generali France (Sainte Luce sur Loire, Nantes)March 2019 - August 2019

Projet:  La collecte des données réassurance: Migrer la collecte des données MRH vers Hadoop.

Tâches réalisées:

- Transférer les requêtes BOBI et codes SAS sous Hadoop en utilisant PySpark

- Construire une base de données contenant les données clients collectés sous Hadoop.

- Rehausser les valeurs des champs manquants.

- Automatiser les prochaines collectes des données réassurances sous Hadoop.

- rédiger un cahier des charges fonctionnels.

More

Generali France (Sainte Luce sur Loire, Nantes)January 2019 - March 2019

Projet : Automatiser la Lecture / Traitement des rapports d'expertises des contrats sinistres  concernant les dégâts des eaux.

Tâches réalisées:

- Développement de modules python PDFminer et PyPDF et collection d'une liste de mots clés

- Extraction des informations pertinentes via les mots clés sur les rapports via les bibliothèques PDFminer et PyPDF

- Construire une base de sortie contenant les informations pertinentes 

More

Generali France (Sainte Luce sur Loire, Nantes)October 2018 - December 2018

 Projet : Produire une application via Dash python
afin d'avoir une vision interactive de la rentabilité des produits (Prévoyance, Santé, Retraite, Épargne)

Tâches Réalisées :

- Calcul du volume des frais généraux sur une plage de 3 ans (2016, 2017 et 2018) 

- Comparaison des volumes de frais par rapports aux frais calculés en 2018 via
des graphes dynamiques afin d'apercevoir la rentabilité des produits 

-  Déploiement des travaux sur une application obtenue via Dash python
permettant au service de valeur d'avoir une vision interactive sur les frais  généraux de l'entreprise

More

IMT-ATLANTIQUE (Brest)March 2018 - July 2018

Projet : La mise en place d'un modèle de prédiction des accidents routiers en France
.

Tâches réalisées:

- Formulation de la problématique et nettoyage des données

- Développement des modèles de prédiction python (Random Forest, SVM, Régression) sur Scikit-Learn

- Déploiement de la solution sous forme d'API web avec Flask Python

My stack

Business Intelligence

Business Intelligence, ETL

Technologies

Pandas, ElasticSearch, Machine Learning, NumPy, MySQL-python

Languages

HTML, JavaScript, CSS3, Java

Databases

Oracle, MySQL, NoSQL

Big Data

PySpark, Hadoop, Data Mining, Big Data

Machine Learning

Scikit-Learn

IT Infrastructure

Git

Other

Services Web Amazon (AWS), Cascading Style Sheets, French, English, Python Programming

My education and trainings

Master 2 - Diplôme d'Ingénieur Généraliste option Système de Traitement d'Information / Data science2016 - 2019

Master 1 en Mathématique Fondamentale - Université de Bretagne Occidentale2017 - 2018

Licence 3 Mathématique - Université Pierre et Marie Curie2015 - 2016