Karim B.

Data Scientist

415 dollar
Freelancer
2 years
Chelles, FRANCE

My experience

More

Capgemini insights&Data - Ministère Des ArméesNovember 2019 - December 2020

• Construction et maintenance d'un écosystème Big Data comprennent un Data lake sous Hadoop HDFS et de Data Warehouse/Data Mart en PostgreSQL.
• Scripting shell et environnement Linux (Debian) .
• Développement ETL avec le Framework Talend permettant la migration de données sous format JSON imbriqué provenant de serveur mainframe/MySQL vers le Data lake, data warehouse et Data mart , script Java/Python utilisé en complément.
• Conception de pipelines spark dans un environnement docker et déploiement effectué via la plateforme Data-ops Saggie orchestrant les clusters sur les serveurs locaux.
• Contrôle de qualité et d'intégrité des données tous au long du processus ETL.
• Gestion de versions sous Tortoise SVN.
• Technologies utilisées : Hadoop HDFS, Docker, Soogie, Talend Big Data, PostgreSQL, Python, Spark, Kerberos, Bash,Hive .
More

FreelanceOctober 2018 - November 2018

• Développement de scripts Python permettant la collecte de données.
• Conception et implémentation d'une base de donnée MySQL
• Développer en python, l'application assure la réception, le nettoyage et le stockage des données (MySQL) provenant de moteurs de recherche  (Tripadvisor)
• Construction d'un micro web service  (Flask)
More

Ministère de l'Éducation nationaleSeptember 2016 - July 2018

• Management et assistance de la direction d'une école primaire
• Aide aux devoirs et accompagnement des écoliers

My stack

Business Intelligence

Talend, ETL, Power BI

IT Infrastructure

Mainframe, Docker, Google Cloud Platform (GCP), Linux, Windows

Application servers

Apache

Open Source solutions

Kubernetes

Big Data

Big Data, Apache Kafka, Hadoop, Hive, Spark, Data Mining, Apache Sqoop

Others

Data analysis, Data Migration, Web Scraping, Data Science, Artificial Intelligence, GitHub

Languages

SQL, Java, Python, R Language, Scala, Bash, Shell Scripting, C/C++

Analysis methods and tools

Scrum, Kanban, Agile Methodology, Functional Programming

Databases

MySQL, PostGreSQL, NoSQL, MongoDB

Protocols

JSON, Kerberos

Technologies

HDFS, ElasticSearch, NumPy, TortoiseSVN, Pandas, Flask, Machine Learning

My education and trainings

Licenses & certifications - -

RNCP niveau 6 - Simplon.co2019 - 2020