Karim B.

Data Scientist

415 dollar
Freelancer
2 years
Chelles, FRANCE

My experience

More

Capgemini insights&Data - Ministère Des ArméesNovember 2019 - December 2020

• Construction et maintenance d'un écosystème Big Data comprennent un Data lake sous Hadoop HDFS et de Data Warehouse/Data Mart en PostgreSQL.
• Scripting shell et environnement Linux (Debian) .
• Développement ETL avec le Framework Talend permettant la migration de données sous format JSON imbriqué provenant de serveur mainframe/MySQL vers le Data lake, data warehouse et Data mart , script Java/Python utilisé en complément.
• Conception de pipelines spark dans un environnement docker et déploiement effectué via la plateforme Data-ops Saggie orchestrant les clusters sur les serveurs locaux.
• Contrôle de qualité et d'intégrité des données tous au long du processus ETL.
• Gestion de versions sous Tortoise SVN.
• Technologies utilisées : Hadoop HDFS, Docker, Soogie, Talend Big Data, PostgreSQL, Python, Spark, Kerberos, Bash,Hive .
More

FreelanceOctober 2018 - November 2018

• Développement de scripts Python permettant la collecte de données.
• Conception et implémentation d'une base de donnée MySQL
• Développer en python, l'application assure la réception, le nettoyage et le stockage des données (MySQL) provenant de moteurs de recherche  (Tripadvisor)
• Construction d'un micro web service  (Flask)
More

Ministère de l'Éducation nationaleSeptember 2016 - July 2018

• Management et assistance de la direction d'une école primaire
• Aide aux devoirs et accompagnement des écoliers

My stack

Open Source solutions

Kubernetes

Languages

C/C++, Scala, Shell Scripting, Python, SQL, Java, R Language, Bash

Big Data

Apache Kafka, Hive, Data Mining, Big Data, Hadoop, Spark, Apache Sqoop

Databases

PostGreSQL, NoSQL, MySQL, MongoDB

Technologies

HDFS, Machine Learning, NumPy, Pandas, TortoiseSVN, ElasticSearch, Flask

Others

GitHub, Web Scraping, Data Science, Data Migration, Data analysis, Artificial Intelligence

Analysis methods and tools

Agile Methodology, Kanban, Scrum, Functional Programming

Application servers

Apache

Protocols

JSON, Kerberos

Business Intelligence

Talend, Power BI, ETL

IT Infrastructure

Google Cloud Platform (GCP), Docker, Mainframe, Linux, Windows

My education and trainings

Licenses & certifications - -

RNCP niveau 6 - Simplon.co2019 - 2020