Khadir L.

Data Scientist

915 dollar
Freelancer
9 years
Paris, FRANCE

My experience

More

NOVELISJuly 2019 - Present

PROJET : SMART PROGRAMMING
Développement d’une platforme permettant de générer des applications web à partir des cahiers de charges

TEAM :

1 data scientist, 2 Post-Doc, 2 PhD candidates, 1 Data engineer, 1 web developer

MISSIONS:

Proposition et développement des algorithmes de représentation et de modélisation des langues naturelles (Anglais et Français) afin de développer des interfaces capables de transformer un langage naturel à des modèles de bases de données relationnelles et des requêtes SQL.

•    Tâches réalisées :  
Implémentation et fine tuning des modèles de transformation de connaissances pour la modélisation des langues en se basant sur le pre-trained model BERT.
Implémentation des algorithmes de représentation des textes avec des graphes.
Implémentation et développement des algorithmes d’extraction d’information à partir de Wikipedia.

ENVIRONNEMENT TECHNIQUE :

Python, Scikit-learn, Gensim, NLTK, Pandas, Flask, Tensorflow, MongoDB, Linux, GitLab, Docker.

More

GROUPE OCP / UM6PAugust 2017 - July 2019

PROJET :  EAGLE
Développement d’une platforme IoT pour la maintenace prédictive (acquisition des données, monitoring et analytics)

EQUIPE :
2 data scientists, 3 data engineers, 3 software developers, 1 Devops engineer and 1 designer.

MISSIONS:
Développement d’un modèle de prédiction des pannes pour la maintenance des équipements et ateliers de l’OCP Group à base de deep learning.
Développement d’un modèle d’analyse et diagnostique automatique des équipements.
Développement des fonctions de traitement de signal et des modèles de classifications des défauts de roulement des différents machines tournantes

PROJET : AGRIOP
Développement d’une plateforme de recommandation et d’aide à la décision pour les agriculteurs dédiés à l’Afrique en partenariat avec les ministères d’agriculture du Maroc, Ethiopie et de TOGO.

EQUIPE :
3 data scientists, 4 software developers, 1 Devops engineer et un scrum master.

MISSIONS:
Implémentation des modèles de recommandation des fertilisants à partir des données du sol.
Implémentation des modèles d’irrigation en analysant les caractéristiques de la culture, le type du sol et la météo
Implémentation des modèles de prédictions des prix des produits agricoles.
Implémentation des modèles de recommandation des cultures adéquat à chaque parcelle agricole.

PROJET : AUTOMATED DATA SCIENCE PLATFORM

Développement d’une plateforme d'intelligence artificielle et de machine learning automatique (Automated Machine learning Platform).

EQUIPE :
1 Data scientist, 2 PhD students, 1 data engineer and 1 developer

MISSIONS:
Mon rôle dans ce projet est de concevoir la plateforme, de déterminer les flux de données nécessaires pour chaque projet d'intelligence artificielle, et d’implémenter des modèles de deep learning et de machine learning pour prédire et optimiser les hyper paramètres des différents modèles de machine learning, pour éviter les problèmes de overfitting, et ainsi pour sélectionner les meilleurs modèles pour des différents cas d'utilisation.

ENVIRONNEMENT TECHNIQUE:

Python, Anaconda, Spark, XGBoost, H2O, Scikit-learn, NLTK, Keras, Tensorflow, OpenCV, MongoDB, Docker, Git, Hadoop, Kafka, Oozie, Linux.


More

UNIVERSITE HASSAN II- MAROCJanuary 2013 - December 2017

SUJET ET DOMAINES DE RECHERCHE :

Building an Arabic question answering system based on deep learning algorithms
During my thesis, I worked on all methods of extracting information from Arabic texts, in order to build an Arabic question answering system. I contributed in the following axes:
-   Text mining and natural language processing
-   Question answering systems.
-   Information retrieval and document ranking.
-   Sentiment analysis.
-   Social networks analysis.

More

OCTO TECHNOLOGYJanuary 2017 - August 2017

PROJET WAFA BOT :
Développement d’un système conversationnel automatique (chatbot) pour le compte de Attijariwafa bank.

EQUIPE :
1 data scientist, 2 developers and 1 data engineer

MISSIONS :
J’ai contribué au développement d’un chatbot pour le compte de, Durant ce projet, j’ai implémenté un programme qui permet de classer les messages par leurs types (réclamation, demande de crédit, demande de simulation de crédit, demande d’emploi, etc) et d’extraire les entité et l’informations intéressante à partir de ces messages, j’ai implémenté par la suite un modèle de sélection de réponse en se basant sur Word2Vec et le deep learning (LSTM)

PROJET : PREDICTION DES PROVISIONS

Implémentation d’un modèle de prédictions des provisions pour le compte de Wafasalaf filiale de attijariwafa bank.

EQUIPE :
2 data scientists

MISSIONS :
J’ai modélisé et implémenté un modèle de deep learning qui permet de prédire la valeur mensuelle globale des provisions liées aux échéances impayés.

ENVIRONNEMENT TECHNIQUE:

SAS, Dataiku, Python, Anaconda, Scikit-learn, Appache Lucene, NLTK, Elastic Search, Hortonworks data platform (HDP), MongoDB, Oozie, Flume, PyCharm IDE, Linux, Docker, Git.

More

FRAKTALMay 2014 - January 2017

PROJET : HARTI EXPERT
Développement d’un systèmes de questions/réponses basé sur les ontologies des domaines et le deep learning.

EQUIPE:
2 Data scientist, 3 développeurs, un data engineer

MISSIONS :

Au sein de la Start-up Fraktal, je me suis occupé d’implémenter un système de question réponse intelligent qui permet de proposer des réponses automatiques aux utilisateurs dans des différents domaines d’expertises. Mon rôle consiste en particulier à :
-   Conduite et pilotage du projet de l’identification des besoins jusqu’à la validation de l’application
-   Extraction de données de pages web (web scraping, web crawling)
-   Proposition et implémentation des méthodes de Machine Learning et de Data Mining pour l’extraction d’information à partir des textes.
-   Proposition et implémentation d’un modèle de Deep Learning dans les systèmes Q/R.
-   Proposition et implémentation des méthodes pour la réutilisation de la connaissance produite dans l’entreprise à partir des données non-structurées (texte, html, xml)
-   Analyse automatique de feedback client pour améliorer la qualité des réponses proposées par le système (Analyse des sentiments).
-   Indexation et recherche d’information des documents textuelles.
-   Implémentation des méthodes de classement de résultats de recherche d’information (Ranking)
-   Développement logiciel agile avec Scrum (animation des rétrospectives, sprint planning, backlog review, daily scrum...)
-   Gestion des sprints (planification, pilotage opérationnel, gestion des risques...)
-   Constitution et formation de l’équipe et la participation aux recrutements.

ENVIRONNEMENT TÉCHNIQUE:

Python, Java, Spark Context, Spark MLLIB, Appache Lucene, Stanford Core NLP, Tree Tagger, Elastic Search, MongoDB, GATE information extraction, Stanford NER, Amazon Web Services (aws), Eclipse IDE, Linux, Git, DeepLearning4J frameworks.


More

SUBCALLSeptember 2012 - April 2014

PROJET : RECOMMENDER SYSTEM
Développement d’un système de recommandation pour l’e-commerce en se basant sur les informations du profil utilisateur extraites à partir des réseaux sociaux.

EQUIPE :
1 Data scientist, 1 développeur, 1 project manager

MISSIONS :
Durant ce projet j’ai contribué à la conception et l’implémentation d’un système de recommandation en exploitant les informations du profil utilisateur extraites de Twitter et Facebook et les agréger avec l’historique d’achat pour recommander des produits personnalisé pour chaque client.
Mon rôle consiste en particulier à :

-   La proposition de l’architecture du système.
-   La conception et l’implémentation de la base de données du système.
-   L’analyse et l’extraction d’information à partir d’un profil utilisateur (en utilisant graph api de Facebook et Twitter api)
-   L’analyse de sentiment à partir des commentaires pour sélectionner les produits les plus recommandés par les clients.
-   Proposition et implémentation des algorithmes de segmentation clientèle.

ENVIRONMENT TECHNIQUE:

Python, Java, Scikit-Learn, Stanford Log Linear POS Tagger, Gate information extraction, Apache Lucene, Eclipse IDE, Weka, Svn, Jira.


My stack

Databases

Microsoft SQL Server, SQL Server, MySQL, MongoDB, HBase

Others

Analytics, SVM, Twitter, Social Media, Data Science

Analysis methods and tools

Scrum, Weka, JIRA

Technologies

AWS, Machine Learning, Lucene, LSA, ElasticSearch, LDA

IT Infrastructure

Google Cloud Platform (GCP), CentOS, Debian, Linux, Ubuntu, Git, Linux (Ubuntu, CentOS), Docker

Environment of Development

IntelliJ Idea, Eclipse IDE, GitLab, PyCharm, Visual Studio Code, SVN

Open Source solutions

Jupyter

Business Intelligence

SAS, Business Intelligence, Tableau Software, Power BI

Big Data

Big Data, Hive, Apache Kafka, Hadoop, Oozie, Spark, Apache Sqoop

Frameworks

OpenCV

Machine Learning

Anaconda, Convolutional Neural Networks, K-means, Scikit-Learn, Keras, Neural networks

Languages

SQL, Python, Scala, R Language, Java

My education and trainings

Big Data Engineer -2018- Mastery Award for Educators (IBM) Certified - -2019 - 2019

Doctorat en Mathématique et informatique (Data science / NLP) - -2018 - 2018

Master en Business intelligence and Multimedia, Spécialité : Data analysis and data mining - -2012 - 2012

Licence en sciences mathématiques et informatique - -2010 - 2010