Catalina C.

Data Engineer

775 dollar
Freelancer
10 years
Lyon, FRANCE

My experience

More

Hardis GroupJune 2014 - June 2019

* Depuis mars 2018:
* Création des divers prototypes en utilisant des algorithmes et outils de machine learning. Implémentation en Scala (avec Breeze), Octave.
* Dans le cadre de Lab Innovation Hardis: détection d'un nouveau business: intelligence artificielle pour un métier des grands clients de l'entreprise (métier de l'assurance): étude de marché.
* En collaboration avec EyeSnap : pilotage de projet pour la détection des nouvelles tendances sur Internet (détection automatique de sens).
* Formation / certification en machine learning
* Conférence - retour expérience Meetup Lyon Data Science
* Organisation de l'accueil du Meetup Scala de Lyon (SLUG) dans les locaux de Hardis
* Programmation Python pour divers projets
More

LizeoMarch 2016 - March 2018

* Durée: 2 ans
* Rôle: Création d'un algorithme pour l'extraction automatique des aspects:
* Apprentissage automatique supervisé suivi d'extraction sur des nouvelles données
* Évaluation de la qualité de données
* Mise en place des techniques d'extraction et d'analyse de données pertinentes
* Analyse des données spécifiques au Métier afin de les transformer en problème mathématique
* Comparaison et tests des différents modèles et méthodes de calcul
* Taux de réussite: 80%-95%
* Participation à l'élaboration d'une offre pour un projet client
* Environnement technique: Scala, Java 1.8, Maven, ElasticSearch (Kibana), Mysql, PERL; parseurs TAL/NLP (Stanford, Snowball)
More

CPSJune 2014 - January 2016

* Duréede la mission : 1 an
* Rôle: Développeur outils support
* Tâches: Création outils en Python
* Environnement technique: PHP (avec Zend), Python, MYSQL procédural.
More

CNRSJanuary 2013 - January 2014

Durée de la mission: 1 an
* Contexte: CNRS Villejuif, laboratoire SEDYL
* Rôle: Création d'algorithmes de clustering
* Tâches:
* Création d'une sauvegarde du résultat du concordancier, en format éditable (ODT): génération du code XML correspondant au fichier ODT (PERL et PHP).
* Création d'une interface de recherche dans la base de données, sur plusieurs niveaux, et avec un résultat complexe.
* Création d'un outil de représentation de données concernant un ou plusieurs corpus, qui comporte la génération d'images en PHP: conception de l'algorithme, développement en PHP.
* Analyse de données pour traduire une problèmatique métier en problème mathématique (algorithme clustering).
* Création d'une sauvegarde des corpus en XML (créés avec l'interface Jaxe) en format éditable (ODT)
* Génération d'un type de codage pour la représentation schématique des énoncés dans un corpus donné, travail en XSLT sur la représentation automatique de ces schémas dans la page XML.

* Environnement technique: PHP, PERL, XSLT, HTML, CSS.
More

KATEXPERTJanuary 2010 - January 2012

Durée de la mission: 2 ans
* Contexte: client final, éditeur de logiciel
* Rôle: Création d'algorithmes de recherche de données pour de la e-réputation
* Tâches:
* Création d'un outil pour l'extraction intelligente des éléments des forums multilingues, à partir des pages Web, à l'aide des expressions régulières. Par exemple: extraire, pour un message diffusé sur un forum: l'auteur, les discussions parentes, la date de la diffusion, le contenu, les éventuelles citations des autres messages dans le contenu; cet outil était destiné à un traitement ultérieur pour la fouille d'opinion;
* Analyse des données afin de les transformer en problème mathématique;
* Application des techniques de text mining d'extraction et d'analyse d'information;
* Conception et implémentation en PHP5 d'un modèle de parcours de réseaux imbriqués. Ce modèle est destiné de trier un ensemble de données reçues en entrée, selon des critères structurés sur plusieurs niveaux et ayant des priorités différentes.
* Conception et implémentation d'une interface en PHP5 et JavaScript permettant de créer des parcours composés de plusieurs étapes structurées sous forme d'arbre. Cet outil, conçu pour être très général, afin d'être utilisé à plusieurs finalités, est destiné essentiellement à la planification et automatisation des tâches.

* Environnement technique: PHP5, Java Script, MYSQL
More

APXJanuary 2008 - January 2010

Durée de la mission: 1 an
* Contexte: SS2I, chez divers clients: AERMC.
* Rôle: Missions de développement et maintenance informatique.
* Tâches:
* Création d'un site Intranet pour AERMC de Lyon
* Saisie du contenu pour un site réalisé en Typo3, AERMC (saisie dans le back-office)
* Création d'un site Internet et mise à jour d'un site Intranet en PHP+MYSQL (AERMC).
* Maintenance informatique (TMA).
* Environnement technique: PHP5, Oracle, CMS: Typo3, Web (HTML, CSS).
More

Université de CaenMay 2007 - April 2008

Durée de la mission: 1 an
* Contexte: Université de Caen, Laboratoire GREYC
* Rôle: Attaché de recherche
* Tâches:
* Dans le cadre du projet Résurgence, pour l'extraction de la structure logique des documents en format PDF:
* Création d'un modèle pour l'extraction de la structure logique des articles scientifiques et journalistiques multilingues;
* Analyse des données afin de transformer un problème Métier en problème mathématique;
* Comparaison et tests des différents modèles de calcul afin de choisir le plus approprié;
* Algorithmes fondés sur le TAL (NLP)

* Environnement technique: PHP5, Java, XML
More

DIGIMINDFebruary 2006 - May 2006

Durée de la mission: 4 mois
* Contexte: Entreprise Digimind spécialisée dans la veille stratégique
* Rôle: Stagiaire
* Tâches:
* Création de corpora, en anglais et en français, destinés à être donnés en entrée à un programme d'apprentissage automatique pour le clustering;
* Classification automatique par méthode bayesiènne;
* Nettoyage des corpora.

* Environnement technique: Java (Weka)

My stack

Others

Kibana

Technologies

Machine Learning, ElasticSearch

Open Source solutions

TYPO3

Databases

MySQL, Oracle

Analysis methods and tools

Apache Maven

Frameworks

Zend Framework

Big Data

Spark, Big Data, Data Mining

Other

English, Romanian, Perl Programming, Java Streams, TAL, Python Programming, tableau, Informaticien, Italian, Cascading Style Sheets

Languages

Java, XML, SQL, JavaScript, Perl, Matlab, HTML, XSLT, Python, Scala

My education and trainings

Master 2, Industries - Université Stendhal2002 - 2006

Master 1 en langue anglaise LLCE - Université Stendhal2005

Diplôme bac+4 Théologie Catholique et de Langue et Littérature Anglaises - Institut Catholique2000