ELHOUSSAIN A.

Data Engineer

1105 dollar

My experience

More

Louis-VuittonJune 2019 - Present

Projet : Intégré dans le service Datalab pour les services et application louis vuitton , Plus particulièrement, en charge des cas d’usages de “reporting” et  des applications des search et e-commerce, web / mobile

Rôle/Equipe/Méthodologies : Data Engineer au sein d’une équipe de 7 personnes en mode scrum. 

Réalisations :

Conception et développement des workflows pour lancer des jobs Spark de transformation et de restitution données au sein de data-lake (OneData)

●Création des chaines ETL pour des usages de reporting et alimentation des applications et service de Louis-Vuitton

●Développement d’un service pour de controle et qualité de données 

●Création d’un outil pour checker les flux « OneData »

●Intégration des données client de LV dans « OneData »

●Alimentation site avec les données de plusieurs sources après le mapping et des transformations spécifiques

Technologies mises en oeuvre : Scala 2.11, Spark 2, Elasticsearch, Cloudera, hive,impala, Yarn, Jenkins, SBT


More

Pages Jaunes - SolocalDecember 2018 - Present

Projet : Intégré dans le service “ Datalake Audience / Connaissance Clients” pour le portail de Pages Jaunes, annuaire de référence avec les coordonnées de plus 400 000 professionnels (TPE, PME…). Plus particulièrement, en charge des cas d’usages “marketing” de Pages Jaunes pour ses clients professionnels (actions publicitaires, référencements payants…) 

Rôle/Equipe/Méthodologies : Data Engineer au sein d’une équipe de 6 personnes (PO & Data Engineering) combinant Scrum (nouveaux projets/évolutions) et Kanban (run). 

Réalisations :

Conception et développement des workflows pour lancer des jobs Spark de transformation et de restitution données dans la base ElasticSearch :

●    Faire des évolutions et des correctifs dans le codebase (datacrunch, Datapro, pro-exporter …)

●    Créer un service d’évaluation des données estimés avec des données réelles 

●    Simuler des données professionnelles en se basant sur l’historique des professionnels (ratio d’impression, nombre de clics…)

●    Créer des tests d’intégration pour s’assurer qu’il n’y a pas d’incohérences et pertes de données lors de la réindexation 

●    Créer des tests d’intégration pour comparer les données de l’environnement  de développement et de recette

Technologies mises en oeuvre : Scala 2.11, Spark 2, Elasticsearch, Cloudera, GraphQL/Sangria, Yarn, Jenkins, SBT, Google Cloud Platform (GCP)



More

La Poste NumériqueJanuary 2018 - Present

Projet : Connaissance Clients: Datalake d'ingestion de transformation, de croisement et de restitution de la vision Client 360 au sein d’une Agile de 20 PO et Data Engineers/Ops

●    Développement du système d'identification des paniers abandonnés sur la Boutique de La Poste

●    Automatisation de la génération de schéma Elasticsearch à partir d'un schéma de données Kafka.

●    Ingestion de données et comptage en temps réel de l'activité

Technologies: Scala 2.11, Spark 2, Confluent Suite (Kafka, KafkaStreams, KafkaConnect), Elasticsearch, Jenkins, SBT, Mesos, Spark SQL, Datasets, DataFrames, MongoDB, Ansible, Git, Amazon Web Services (AWS), Linux 


More

Fraktal / ExpenliApril 2015 - December 2017

Projet : Développement d'un système de réponses généré automatique par un système intelligent basé sur des technologies Machine Learning, Deep Learning et NLP

Système avec une première version en environnement Java, et une deuxième mise en œuvre à partir d’octobre 2016 en environnement Scala

Equipe/Méthodologie Scrum : 6 personnes dont 1 data engineer et 1 data scientist

Tâches principales

●    Extraction de contenu des pages web (web scraping, web crawling)

●    Mise en œuvre du framework Spark  

●    Indexation et recherche d'information des documents texte avec un moteur de recherche ElasticSearch

●    Création d’une base de données NoSQL sur MongoDB.

●    Mise en œuvre d’un algorithme de recherche d'information et de documents

●    Classement en utilisant l'apprentissage en profondeur (Word2Vec and Convolutional Neural Networks).

Technologies : Spark, HDFS, Python, Scala, Eclipse IDE, TreeTagger, Stanford NER, Lucene, ElasticSearch, MongoDB, Ansible, Git, Amazon Web Services (AWS), Linux 

More

PierdorJanuary 2014 - March 2015

Projet : Développement de projets Web et mobiles responsive spécialisés dans la vente de toute une gamme de produits destinée à l’aménagement du jardin et de la maison

Equipe/Méthologie Scrum : 1 développeur et 1 chef de projet 

Tâches principales

●    Conception et mise en œuvre de projets e-Commerce 

●    Création d’un robot web pour l'analyse des urls

●    Analyse et extraction de connaissances à partir d'un profil utilisateur (crawling)

●    Mise en œuvre d’algorithmes pour l'exploration de données et l'analyse des comportements utilisateurs et acheteurs en s’appuyant sur l’outil SentiWordNet et des APIs de Facebook

Technologies : Java EE, Python, Scikit-Learn, Scrapy, Ionic, Cordova, Prestashop, Eclipse IDE, Debian, Ansible


More

AAIMJuly 2012 - December 2013

Equipe : développeur au sein d’une équipe MOE basée sur Rabat et en relation avec l’équipe MOA basée sur le siège social à New Jersey (USA) 

Tâches principales

●    Conception et implémentation d’applications Web

●    Administration du serveur Debian

●    Tests unitaires, tests fonctionnels et tests d’intégration 

●    Déploiement

Projets :

●    Développement d’un projet de gestion de workflow du matériel Intel fourni aux étudiants des facultés du Sénégal

●    Personnalisation d’Odoo (anciennement OpenERP, solution leader des ERP opensource) pour la Chambre de Commerce Arabe aux Etats-Unis

●    Développement d’une application d’évaluation du personnel pour une société de Gaz a Bahreïn (Banagaz)

Technologies : Ubuntu, Netbeans, OpenERP7, PHP, Python


My stack

Languages

JavaScript, Java, Ruby on Rails, SQL, Ruby, Scala, UML, PL/SQL, Java EE, PHP, Python

Frameworks

jQuery, Prestashop, .NET

Analysis methods and tools

Scrum, Kanban, DevOps

Mobile

Ionic

Technologies

ElasticSearch, HDFS, AWS, Machine Learning, Lucene, Yarn, J2EE, Web Services, MapReduce

Others

Kibana, Artificial Intelligence

ERP&CRM

ERP, Odoo (OpenERP)

Big Data

Spark, Apache Kafka, Cloudera CDH, Hadoop, Impala, Big Data, Hive

Machine Learning

Scikit-Learn

Environment of Development

Eclipse IDE, SBT, NetBeans, Eclipse

Middleware

Jenkins

IT Infrastructure

Unix, Google Cloud Platform (GCP), Linux, Ubuntu, Debian, Docker, Ansible, Cloud Computing, Git

Business Intelligence

ETL

Databases

Microsoft SQL Server, MongoDB, Oracle, MySQL, SQL Server, PostGreSQL, Cassandra, NoSQL

My education and trainings

Formations - -

Professional Scrum Master I - Scrum.org

Certifications - Google

Databricks Certified Developer - Apache Spark 2.x for Scala - Databricks2018 - 2018

Ingénieur en Informatique et Technologies de l’Information - VINCI2007 - 2012