Hicham K.

Data Scientist

415 dollar
Freelancer
1 year
Paris, FRANCE

My experience

More

Google Cloud PlatformOctober 2020 - February 2021

• Transformation, documentation, deploiement et tests de donnees d’un dataset de mobilites avec DBT(Data Build Tool) et BigQuery

• Implementation des requetes dans des macros reutilisables avec SQL et Jinja

• Materialisation des requetes dans des tables et des vues sur BigQuery

• Automatisation du pipeline de transformation de donnees avec un processus CI/CD en utilisant Cloud Run et Cloud Scheduler

• Creation de dashboards de donnees de mobilite sur Data Studio

More

Boursorama BanqueApril 2020 - October 2020

• Collection de donnees clients de diff´erentes sources: CRM, Data Warehouse, Open Data etc.

• Construction de pipelines ETL sur Spark et modelisation des donnees avec des graphes de transactions/relations entre clients

• Implementation d’algorithmes de scoring de fraude a l’aide des features extraites des graphes en utilisant Spark GraphX et Spark SQL

• Creation et deploiement d’un modele de Machine Learning pour la detection de fraude avec 94% de performance

More

DataDirectNetwork StorageApril 2019 - October 2019

• Deploiement et configuration d’un cluster Hadoop de 8 nœuds avec IME - un systeme de fichiers distribue developpe par DDN - en tant que couche de stockage et Yarn en tant que Resource Manager

• Evaluation et monitoring de performance d’IME avec des applications de machine learning et des requetes SQL sur Spark ainsi que des applications de Lecture/Ecriture tres volumineuses avec Hadoop MapReduce

• Realisation d’une comparaison des performances d’E/S entre IME et HDFS en tant que couches de stockage

• Optimisation des applications d’E/S volumineuses sur IME et realisation d’un debit d’E/S de 11 Go/s sur le debit maximal disponible de 12 Go/s

• Mise en place d’un cluster Spark de 10 noeuds pour le projet Evolve: un projet europeen de Big Data et High Performance Computing dont DDN Storage fait partie

My stack

Middleware

Jenkins

Analysis methods and tools

DevOps

Databases

Neo4J, Cassandra, MongoDB, MySQL

Languages

C/C++, Python, Scala, C++, Java, SQL

IT Infrastructure

Git, Linux, Azure, Docker

Others

Research

Business Intelligence

Talend, ETL

Big Data

Hadoop, Big Data, Spark, Apache Kafka

Technologies

Machine Learning, AWS, HDFS, Pandas, ElasticSearch, REST API, MapReduce

Open Source solutions

Kubernetes

My education and trainings

Diplome d’ingenieur en Data Science et Mathematiques Appliquees de l’ISIMA - Institut Superieur d'Informatique de Modelisation et de leurs Applications2017 - 2020

Option Mathematiques et Physique - Classes Preparatoires aux Grandes Ecoles d’Ingenieurs2015 - 2017