|
"L'exploitation
d'un datawarehouse est un travail de coordination
entre les activités de développement, de
contrôle fonctionnel, d'exploitation et
de maintenance."
|
| Le
9 Juillet 2002 |
 |
Depuis
1994, Pentalog High Tech développe des
prestations d'assistance ou de direction
pour l'exploitation, l'extraction, l'analyse,
la diffusion et l'alimentation de datawarehouses
ou de datamarts.
Sébastien
L. présente ses expériences
et celles de Mickaël H. dans l'alimentation
et l'exploitation quotidienne de datawarehouses.
|
|
 |
 |
Aleth D. : Sébastien,
vous prenez la direction technique de l'offre Aide
à la Décision de Pentalog High Tech. Après avoir
dirigé un infocentre pour le compte de l'opérateur
de téléphonie mobile au Kenya, vous êtes actuellement
en mission dans le cadre de l'exploitation d'une
application de facturation de France Telecom. Pourquoi
avez-vous cherché à intégrer une équipe d'exploitation
à votre retour en France ? |
| Sébastien
L. : Après nos expériences dans divers infocentres,
nous avons ressenti le besoin de mieux maîtriser
la gestion du transfert des données qui alimentent
les datawarehouses que nous exploitons dans le cadre
de nos prestations. Maîtriser les contraintes de
Production nous est devenu indispensable pour valoriser
notre savoir-faire sur le domaine décisionnel. Et
par conséquent, la maîtrise de tous les maillons
de la chaîne décisionnelle nous permet de mieux
répondre aux besoins et attentes de nos clients. |
Aleth D. : En
quoi consiste ce type de prestation ? |
Sébastien
L. : L'exploitation d'un datawarehouse s'inscrit
dans le cadre plus général de la production informatique
de données. Elle en suit les règles élémentaires
- Disponibilité des ressources de production,
- Reprise des processus d'alimentation en cas d'erreur,
- Maîtrise de la planification et de l'ordonnancement
des processus de production.
Un processus d'alimentation de datawarehouse est
en général à cheval sur deux mondes, celui de la
production et celui de la cellule ALAD (Aide à la
décision). Il doit être par conséquent exploité
par deux équipes aux rôles distincts. Une "équipe
exploitation" qui appartient au service de la production
pure et une "équipe fonctionnelle" qui contrôle
la qualité et la cohérence des données envoyées.
Nous avons pu remarquer que, dans un certain nombre
d'entreprises, "l'équipe fonctionnelle" est elle-même
responsable de l'exploitation du datawarehouse pour
les processus de transformation et de chargement
des données (le T et le L des outils ETL - Extraction,
Transformation & Load tools). |
Aleth D. : Quel
cas pratique pouvez-vous nous donner en exemple
? |
| Sébastien
L. : Nous avons déjà eu à traiter
le cas d'une chaîne ETL, qui est une extraction
de données pour la consolidation d'un datawarehouse.
Dans cet exemple là, l'idée est de créer des fichiers
plats à partir de requêtes et de les envoyer par
FTP vers la machine hôte du datawarehouse. Les équipes
d'exploitation de la production nationale ne se
préoccupe en aucun cas du traitement fonctionnel
ou du data management. Cette extraction est réalisée
quotidiennement à J pour les données trafic de J-1.
Elle est incrémentale, la chaîne calculant une assiette
d'extraction permettant de déterminer l'incrément
à traiter. Etant donné qu'il s'agit de données trafic,
la volumétrie des flux et, par voie de conséquence,
le dimensionnement de la base du datawarehouse est
une sérieuse contrainte. |
Aleth D. :Certes
la société Pentalog High Tech est spécialisée sur
les infocentres dans le secteur des Télécommunications
(France Telecom, Vivendi Universal). Pouvez-vous
nous donner un autre exemple sur une autre activité
? |
Sébastien
L. : Prenons alors l'expérience de Mickaël
H. (voir
son cv) sur le marché du disque et de la musique.
Les données sont directement prises dans les tables
de production par des processus propres au datawarehouse
et gérés par un automate. L'équipe du service Infocentre-Datawarehouse
doit vérifier la bonne exécution de ces process,
détecter les erreurs et remonter l'information aux
différents responsables des applications de production.
Puis enfin, elle vérifie la cohérence des informations
importées.
Dans ce cadre là, l'équipe Infocentre doit avoir
des compétences pour comprendre les différents processus
d'alimentation, sans oublier qu'elle est doit également
analyser les données en elles-mêmes. |
Aleth D. : Chez
KenCell Communication, l'export des données de production
n'était pas géré par l'équipe de l'infocentre que
vous avez dirigé lors de la troisième phase de son
implantation ? |
| Sébastien
L. : Effectivement. Les données sont mises à
disposition sous forme de fichiers dump de tables
Oracle dans un répertoire spécifique. Un process
propre au datawarehouse vient alors importer ces
données dans les tables idoines. Pour éviter tout
problème de synchronisation entre les différents
processus, c'est l'équipe de Production de l'entreprise
qui lance cet import. L'équipe Infocentre est tenue
de vérifier tous les jours la cohérence des données
et des informations agrégées qui sont mises à disposition
des utilisateurs finaux |
Aleth D. :
Comment s'effectue le contrôle de l'alimentation
d'un datawarehouse ? |
| Sébastien
L. : Avoir des outils de suivi et de contrôle
de la chaîne d'alimentation, précis et facile d'utilisation,
restent indispensable pour réagir au plus vite en
cas de problème d'alimentation de la base. Utiliser,
par exemple, une console web de suivi et de gestion
des tâches d'alimentation, permet d'identifier rapidement
le ou les processus défaillants, puis de le relancer.
Un SI décisionnel doit être disponible au sein de
l'entreprise dans les mêmes créneaux horaires que
les acteurs qui l'utilisent. |
Aleth D. : Quelle
est votre synthèse sur cette activité par rapport
aux contraintes d'un système d'information décisionnel
? |
Sébastien
L. : En fait, l'exploitation d'un datawarehouse
est un travail de coordination entre les activités
de développement, de contrôle fonctionnel, d'exploitation
et de maintenance. Dans quelques cas, il s'agit
même d'un soutien à un Pôle Infocentre ou à l'utilisateur
final.
Les points de friction se situent souvent à l'interface
entre l'exploitation des chaînes transactionnelles
(le métier) et l'ETL qui ne sont pas conçues par
les mêmes personnes et qui, traditionnellement,
n'ont pas le même temps de service dans un SI. Il
importe que l'équipe d'exploitation gère les chaînes
d'alimentation comme des chaînes de production et
qu'elle soit parfaitement bien formée à leur exploitation.
Il va s'en dire que les normes d'exploitabilité
et de rédaction documentaire doivent être communes
aux deux systèmes. Le but final est d'intégrer complètement
les chaînes ETL dans la production informatique
de l'entreprise. |
| En
savoir plus : consultez
le CV de Sébastien L. |
| Contact
: Hélène
Hemery |