Mohamed D.

Data Scientist

830 dollar

My experience

More

HomeServeAugust 2019 - Present

Dynamic pricing
More

Shapr - Business Networking appSeptember 2016 - March 2019

Shapr is a business networking app that brings you a daily suggestion of people to meet. I was leading the Data team, in charge of building and improving the suggestion algorithms. Keywords: machine learning, recommender systems, R, Python, Web services, Agile, project management.


PROJET 1 : « Suggestion de Profils » : Algorithmes de recommandation pour le matching de
profils professionnels sur la base de l’intérêt mutuel et le parcours d’utilisation. Modélisation
mathématique, développement, évaluation & mise en production. Prototypes utilisés au sein
de l’app. mobile Shapr. (350 j/h)
DOMAINE D’INTERVENTION :
Lead d’une petite équipe de Data Scientists, en mode Agile (Scrum)
 Analyse des besoins et affinage des cas d’usage avec les utilisateurs finaux
Proposition et adaptation de modèles statistiques pour la suggestion de profils
Conception, modélisation, développement, tests et évaluation
 Déploiement des modèles en production en R/Rserve, Python/Flask
Amélioration continue du produit et prise en compte des feedbacks utilisateurs
Reporting sous Splunk et Tableau.
ENVIRONNEMENT TECHNIQUE :
 Compétences mobilisées : modélisation, latent variable analysis, topic models, machine
learning, text mining, time series
R / Python
 Tableau / Splunk
 MySQL.

More

InsermSeptember 2015 - August 2016

Data science for healthcare is one of the most promising and challenging fields today. At INSERM research lab., I worked on automating diagnosis-code assignment (ICD codes) to discharge summaries. Keywords: NLP, machine learning, deep learning, text mining, R, deployment.


PROJET 1 : « Codage des CRHs/CROs » : Algorithmes pour l’assignation automatique de
codes aux compte-rendus hospitaliers (CRHs) et opératoires (CROs). Appréhension des
problématiques métier, traduction du besoin, développement des algorithmes en cycles
courts en collaboration avec les équipes d’information médicale. (180 j/h)
DOMAINE D’INTERVENTION :
 Analyse des besoins avec les médecins d’information médicale
Proposition de modèles de classification à base de réseaux de neurones,
particulièrement adaptés à la nature hétérogène des données (numérique, texte,
images)
 Implémentation et évaluation sur des données réelles en temps réel
Déploiement des modèles en R/Rserve.
ENVIRONNEMENT TECHNIQUE :
 Compétences mobilisées : text mining, machine learning, deep learning, réseaux de
neurones profonds
R, Python (Keras)

More

Bertin IT - CNIM GroupJanuary 2012 - August 2014

At Bertin IT , my job revolved around semantic analysis and learning from textual/unstructured data (Web and social media). My work was part of the Enterprise Intelligence platform. Keywords: machine learning, text mining, C/C++, computational linguistics.


PROJET : « Thèse industrielle sur les nouveaux outils de veille » : Algorithmes pour l’analyse et le
suivi des opinions sur le Web et les médias sociaux. Défis liés à la taille et la vélocité des
données en plus de leur caractère non-structuré et bruité. (900 j/h)
DOMAINE D’INTERVENTION :
Proposition de solutions innovantes pour modéliser l’évolution des opinions sur Internet
(latent variable models, topic models, LDA-like models)
 Implémentation des algorithmes from scratch en C/C++
Evaluation et optimisation de paramètres sur des cas d’usage réels
 Déploiement en production
Documentation technique et publications scientifiques à l’international.
ENVIRONNEMENT TECHNIQUE :
 Compétences mobilisés : data cleansing, modélisation, latent variable analysis, time
series, machine learning, text mining
C/C++.


More

France Telecom R&DFebruary 2011 - July 2011

I did my 6-month internship at France Telecom R&D, on preprocessing and categorization of CRM data for market segmentation.


PROJET : «Prédiction du churn » : Algorithmes pour la détection du churn à partir des
réclamations et messages échangés avec les clients Mobile. (100 j/h)
DOMAINE D’INTERVENTION :
Collecte et mise en forme des données textuelles non-structurées
Algorithmes de prédiction
Evaluation et documentation
ENVIRONNEMENT TECHNIQUE :
 R.

My stack

Others

Artificial Intelligence, Project Management, Natural Language Processing (NLP), Social Media, Kibana, Data Science, Algorithms, Research, Data analysis, Social Networking

Databases

MySQL

Technologies

Machine Learning, ElasticSearch

Languages

C++, C/C++, LaTeX, Java, Python, SQL

Big Data

Big Data, Data Mining

Machine Learning

Keras, Deep learning

Other

Topic Modeling, Python Programming, Data Cleansing, Arabic, French, English

My education and trainings

Ph.D. - Université Lumière (Lyon II)2012 - 2015

Master of Research - Polytech'Nantes2010 - 2011

Diplôme d’Ingénieur, Informatique - Ecole Supérieure d’Informatique d’Alger2011 - 2011