DissertationsEnLigne.com - Dissertations gratuites, mémoires, discours et notes de recherche
Recherche

La Normalisation De l'Information Pour Une Exploitation Dans Un Contexte De l'Intelligence Économique

Documents Gratuits : La Normalisation De l'Information Pour Une Exploitation Dans Un Contexte De l'Intelligence Économique. Rechercher de 53 000+ Dissertation Gratuites et Mémoires
Page 1 sur 40

Babátisé,

à mes proches…

Table des matières

1. Contexte Général, Problématique et Objectifs 10

1.1 Introduction 10

1.2 Cadre du travail 11

1.3 Présentation de cette étude 14

2. La Normalisation de l’Information 15

2.1 La normalisation de l’information 15

2.1.1 L’information, documentation et connaissance 15

2.1.2 La normalisation 18

2.1.3 La normalisation de l’information 20

2.2 Les structures des sources de documents électroniques 22

2.2.1 La structure des formats des documents textuels 22

2.2.2 La structure des tableaux 24

2.2.3 La structure des bases de données 26

2.2.4 Vers une source homogène 30

2.3 Les méthodes de conversion dans XML 33

2.3.1 Documents structurés 33

2.3.2 Documents non structurés ou semi structurés 34

2.4 La rétro-conception des bases de données 37

2.4.1 Etude de certaines méthodes de rétro-conception 44

2.4.2 Les outils de rétro-conception 46

3. Domaine d’Application 50

3.1 Systèmes d’Information 51

3.2 Gestion des connaissances 54

3.2.1 La fouille de données 54

3.2.2 L’entrepôt de données 56

3.3 Système d’informations stratégiques (SIS) 58

4. Application Concrète 63

4.1 La proposition de NetLor-Concept 64

4.2 L’algorithme de la proposition 66

4.2.1 La problématique 66

4.2.2 Description de l’algorithme 66

4.2.3 L’algorithme 70

4.2.4 Problème de l’algorithme 71

4.3 Une amélioration de l’algorithme 72

4.3.1 L’algorithme proposé 73

5. Conclusion et Perspective 75

5.1 Pour conclure … 75

5.2 Perspectives 76

5.2.1 L’utilisateur au cœur du système 76

5.2.2 Interopérabilité dans les SIS 78

Bibliographie 81

Table des illustrations

Figure 2.1 : La normalisation de l’information 21

Figure 2.2 : Le processus standard de la conception des bases de données et leurs produits, inspiré de [Hainaut 2002] 29

Figure 2.3 : Architecture générale de la rétro-conception des bases de données [Hainaut 2002]. 38

Figure 2.4 : Architecture générale de la phase d'extraction de structure de données 40

Figure 2.5 : Architecture générale de la phase de conceptualisation des structures de données 42

Figure 2.6 : Une table pour la comparaison des méthodes de rétro-conception 46

Figure 3.1 : Architecture d’un système d’information [Zacklad 2000] 53

Figure 3.2 : Une classification des différents systèmes d’information 54

Figure 3.3 : Architecture d’un entrepôt de données 57

Figure 3.4 : Architecture d’un système d’intelligence économique [Thiéry 2002] 59

Figure 3.5 : Représentation du SI-S et du S-IS [Thiery 2002] 61

Figure 4.1 : Schéma présentant une base de données non exploitable 64

Figure 4.2 : Schéma présentant le nouveau MPD (Modèle Physique de Données) 65

Figure 4.3 : Conversion et regroupement d’informations 67

Figure 4.4 : Modification de structures respectant le modèle relationnel standard 68

Figure 4.5 : Migration étape par étape des champs et des données associées 69

Figure 5.1 : Modélisation de l’utilisateur et S-IS 77

Figure 5.2 : Tableau récapitulatif des différents modes de coopération entre SI 79

Avant-propos

Les systèmes d’informations des organismes socio économiques sont souvent alimentés par des sources bien différentes et hétérogènes (en contenu et en format). Ces différences mènent, parfois, à une augmentation de coût de traitement, de la gestion du stockage et le problème de la rentabilité.

La nécessité d’alimenter ces systèmes d’informations par des informations ou données homogènes pour une exploitation efficace dans le contexte de l’intelligence économique est assez importante.

L’intelligence économique est un domaine de recherche en Information Scientifique et Technique actuellement intégré dans les Sciences de l’Information et de la Communication comme un aspect des technologies de l’information. La problématique de ce domaine d’étude est l’acquisition, l’organisation, la gestion et l’exploitation des données personnelles dans les technologies de l’information.

Cette étude porte sur une amélioration de l’organisation et l’exploitation, en particulier informatique, des informations dans les entreprises.

1. Contexte Général, Problématique et Objectifs

1.1 Introduction

L’apparition des nouvelles technologies de l’information (l’accès au haut débit, les réseaux câblés et l’Internet) fait naître de nouvelles sources, besoins et contraintes liés à l’utilisation des informations hétérogènes (contenu et/ou format). Ceci nous pousse à revoir en profondeur la normalisation de l’information.

En effet, la gestion de l'information vise le cycle de vie des documents des organismes socio-économiques. Ces documents doivent demeurer disponibles, compréhensibles et utilisables tant que l'administration et les employés en ont besoin. Priorité est accordée aux services qui sont considérés comme indispensables à la conservation de ces documents, à savoir leur identification, leur description, leur classification, leur organisation, leur entreposage, leur protection et leur disposition.

Ceci pose différents problèmes. La variété des sources d’information est extrême. Par exemple, il y a une distinction entre les sources générales et les sources spécifiques [Jakobiak 2001]. Les sources générales (les revues, journaux, publications périodiques diverses etc.) sont les sources connues, indispensables, diffusées et utilisées par les entreprises de toute taille. Elles sont utilisables pour organiser une surveillance systématique. De plus les sources spécifiques (les rapports pour des acteurs particuliers ou les rapports annuels, les normes, l’information informelle, les informations internes à l’entreprise etc.) sont généralement moins utilisées et permettent de répondre à des questions ponctuelles. Il faut également distinguer les différentes sources suivant leur moyen de stockage : les sources non électroniques (livres, journaux, etc.) et les sources électroniques (documents textuels, tableaux, bases de données, etc.). Ces dernières nous intéressent, parce que nous allons essayer de les normaliser.

Remarquons que les informations contenues dans ces sources peuvent être disponibles dans des formats différents. Dans une revue, les informations peuvent être des tables, des tableaux, des textes, des pictogrammes, etc.

On peut trouver toutes ces informations dans des bibliothèques, sur les sites Web, dans les bases de données opérationnelles des entreprises ou plus généralement dans les systèmes d’information des entreprises sous différents formats. Les trois dernières sont des sources pour l’alimentation des systèmes d’information stratégiques et par conséquent sont importantes pour notre travail.

Dans sa forme la plus simple, un système d’information stratégique (SIS) peut être considéré comme

...

Télécharger au format  txt (63.9 Kb)   pdf (499.2 Kb)   docx (31.7 Kb)  
Voir 39 pages de plus »
Uniquement disponible sur DissertationsEnLigne.com