Qualite des donnees

Qualite des donnees

Qualité des données

Page d'aide sur l'homonymie Pour les articles homonymes, voir qualité.

La qualité des données, en informatique se référe à la conformité des données aux usages prévus, dans les modes opératoires, les processus, les prises de décision, et la planification (J.M. Juran).

De même, les données sont jugées de grande qualité si elles représentent correctement le mode de fabrication auquel elles se réfèrent.

Ces deux points de vue peuvent souvent entrer en contradiction, y compris lorsqu'un même ensemble de données est utilisé avec un objectif commun

Sommaire

Historique

La plupart des technologies sur les données informatiques sont nées du désir d'envoyer des informations par courrier. Avant l'émergence de serveurs bon marché, les mainframes étaient utilisés pour mettre à jour les données (noms, adresses, et autres attributs) afin que les courriers électroniques arrivent correctement à leur destination. Les mainframes utilisaient des règles métiers pour corriger les défauts dans les données (fautes sur les champs nom et date, défauts de structuration), ainsi que pour suivre les clients qui avaient changé d'adresse, disparu, fusionné, ou expérimenté d'autres événements.

Aux États-Unis, les agences de gouvernement commencèrent à mettre à disposition des données postales à quelques sociétés de service pour gérer les entreprises selon le registre de changement d'adresse national (NCOA). Cette technologie a fait économiser à de grandes entreprises de grandes sommes d'argent (millions de dollars) en comparaison de la gestion manuelle des données client. Les grandes entreprises ont réduit leurs coûts de Large companies saved on postage, as bills and direct marketing made its way to the intended customer more accurately. Initially sold as a service, data quality moved inside the walls of corporations, as low-cost and powerful server technology became available.

Bien que la plupart des entreprises pensent au nom et à l'adresse quand elles se préoccupent de qualité des données, on reconnaît aujourd'hui que la qualité des données est la façon d'améliorer tous les types de données, comme les données sur la chaîne logistique, les données des progiciels de gestion intégrée, les données transactionnelles, etc. Par exemple, mettre en conformité les données de la chaîne d'approvisionnement à un certain standard a une valeur pour une organisation en :

  1. évitant de surstocker des stocks similaires mais légèrement différents
  2. améliorant la compréhension d'achats en négociant des remises en quantité
  3. évitant les coûts logistiques en stockant et envoyant des pièces détachées à travers une grande organisation.

Alors que les données sur les noms et adresses ont un standard clair avec les définitions des autorités postales, les autres types de données ont peu de standards reconnus. Il y a une tendance de fond aujourd'hui dans l'industrie pour standardiser ceraines données qui ne sont pas des adresses. Le groupe GS1 fait partie des groupes qui sont fers de lance dans ce mouvement.

Importance de la qualité des données

La qualité des données est très importante pour réaliser l'interopérabilité de systèmes complexes. En particulier, elle intervient dans les exigences de traçabilité, qui se manifestent dans plusieurs secteurs économiques :

  • Santé et pharmacie,
  • Agroalimentaire et grande distribution,
  • Chimie,
  • Automobile...

Dans le même ordre d'idée, la qualité des données intervient aussi dans l'analyse du cycle de vie des produits.

La qualité des données revêt une grande importance également dans le Direct Marketing ou plus globalement le Customer Relationship Management (CRM) où les données client représentent une source de valeur importante pour les entreprises.

Sous un angle plus directement lié à la sécurité des données, elle intervient dans la gestion des documents d'archive, pour l'imputabilité.

La qualité des informations est l'un des 11 facteurs du modèle d'intelligence économique (AFDIE).

D'après le rapport du CIGREF sur le capital immatériel, la fiabilité et l'auditabilité des données conditionnent l'évaluation du capital immatériel des entreprises, et le calcul du retour sur investissement des projets d'ingénierie des connaissances. Il est donc nécessaire de disposer de référentiels de données normalisés pour évaluer la qualité des données.

On peut dire aussi que l'objectif poursuivi par la gestion de contenu de parvenir à une convergence des systèmes de gestion de contenu participe d'une démarche qualité dans le domaine des données.

Qualité des informations dans le modèle d'intelligence économique

Le modèle d'intelligence économique de l'AFDIE identifier six critères de qualité de l'information :

1. Coût et valeur de l'information :

La mise en oeuvre des normes IAS/IFRS comporte la comptabilisation du capital immatériel en immobilisations incorporelles ; elle pousse l'entreprise à mieux évaluer la valeur de l'information dans sa stratégie.

2. Connaissances capitalisées et validées,

Le moyen de capitaliser et de valider les connaissances se fait par des projets d'ingénierie des connaissances.

3. Mémoire vivante et accessible,

La mémoire peut être gérée efficacement par une démarche de gestion de contenu, qui visera à unifier les différents systèmes de gestion de contenu présents dans l'entreprise.

4. Informations et connaissances mieux partagées et protégées,

Il s'agit de mettre en place des communautés de pratique, avec des critères permettant de protéger le patrimoine informationnel.

5. Informations écrites et orales indispendables avant la prise de décision,

6. Information prospective et historique.

Il s'agit de disposer d'un référentile historisé et permettant de faire des analyses prospectives selon des axes d'analye.

Qualité des données et système décisionnel

Le système décisionnel a pour objet d’aider les décideurs à effectuer des choix pertinents à partir de données historiques. Ceci implique généralement de prendre en charge de grandes quantités de données disparates afin de les calibrer en information suffisamment précise et sûre pour qu’en confiance des actions puissent être définies et lancées. Ce défi classique pour les architectes de systèmes décisionnels est amplifié ces derniers temps par l’augmentation des exigences en matière de variété, de profondeur et de fraîcheur des données historiques à gérer. Dans ce contexte, la vitesse avec laquelle des données peuvent être « nettoyées », « transformées » et intégrées dans un entrepôt de données devient essentielle pour la compétitivité des entreprises.

La qualité d’une donnée dépend d’abord du contexte dans lequel elle a été initialement saisie, mais d’un point de vue décisionnel son intérêt dépend de l’usage qu’un utilisateur peut en faire. La qualité d’une donnée ne doit donc pas être appréciée dans l’absolu mais de façon relative à son intérêt métier. Les besoins métiers évoluant, l’appréciation de la qualité d’une donnée ne peut donc jamais être fixée de façon définitive. Les programmes d’amélioration de la qualité des données doivent être ciblés en fonction des intérêts métier, sinon il y a un fort risque de se créer une charge de travail digne de Sisyphe.

Normalisation

Il existe très peu de normes relatives spécifiquement à la qualité des données. On peut citer toutefois la norme ISO 19115 relative aux informations géographiques.

Des besoins existent aussi sur les informations contenues dans les ressources informatiques que les informaticiens appellent "non structurées". Des travaux sont en cours pour parvenir à des normalisations des données de référence qui sont utilisées dans ce type de ressources, notamment les ressources Web qui se généralisent et ont besoin de s'interfacer avec d'autres types de ressources informatiques.

Bibliographie

  • AFDIE, Modèle d'intelligence économique, préface d'Alain Juillet, collection L'intelligence économique, Economica, 2004.
  • Christophe Brasseur, Data Management : qualité des données et compétitivité, éditions Hermes Science, Collection Management et informatique, 2005.
  • Michel Fournel, Accroitre la qualité et la valeur des données de vos clients, éditions Publibook, 2007, ISBN 978-2-7483-3847-8. Ce livre sur Publibook Ce livre sur Amazon.fr

Voir aussi

Source

  • (en) Cet article est partiellement ou en totalité issu d’une traduction de l’article de Wikipédia en anglais intitulé « Data quality ».
Ce document provient de « Qualit%C3%A9 des donn%C3%A9es ».

Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Qualite des donnees de Wikipédia en français (auteurs)

Игры ⚽ Нужен реферат?

Regardez d'autres dictionnaires:

  • Qualité des données — Pour les articles homonymes, voir qualité. La qualité des données, en informatique se référe à la conformité des données aux usages prévus, dans les modes opératoires, les processus, les prises de décision, et la planification (J.M. Juran). De… …   Wikipédia en Français

  • Qualite des systemes informatiques — Qualité des systèmes informatiques Les systèmes informatiques disposent d une gestion de la qualité particulière. La qualité des systèmes informatiques intègre au projet de développement une approche permettant de contrôler autant que possible le …   Wikipédia en Français

  • Qualité des systèmes informatiques — Les systèmes informatiques disposent d une gestion de la qualité particulière. La qualité des systèmes informatiques intègre au projet de développement une approche permettant de contrôler autant que possible le produit final. Elle concerne  …   Wikipédia en Français

  • Format des données — Format de données Le format des données est la manière utilisée en informatique pour représenter des données sous forme de nombres binaires. C est une convention (éventuellement normalisée) utilisée pour représenter des données, soit des… …   Wikipédia en Français

  • Sécurité des données — En sécurité des systèmes d information, la sécurité des données est la branche qui s intéresse principalement aux données, en complément des aspects de traitement de l information. Sommaire 1 Rappel sur les données informatiques 2 Bref historique …   Wikipédia en Français

  • Gouvernance des données — La gouvernance des données est une collection de bonnes pratiques qui considère l information comme une ressource à part entière de l entreprise: l information doit être gérée avec des règles précises, des processus responsabilités clairement… …   Wikipédia en Français

  • Gestion Des Données — La gestion des données aussi appelée gestion en jargon informatique comprend toutes les disciplines relatives à la gestion des données en tant que ressources numériques valorisables. Selon la définition de DAMA, la gestion de la ressource donnée… …   Wikipédia en Français

  • Gestion des donnees — Gestion des données La gestion des données aussi appelée gestion en jargon informatique comprend toutes les disciplines relatives à la gestion des données en tant que ressources numériques valorisables. Selon la définition de DAMA, la gestion de… …   Wikipédia en Français

  • Gestion des données — La gestion des données est une discipline de gestion qui tend à valoriser les données en tant que ressources numériques. La gestion des données permet d envisager le développement d architectures, de réglementations, de pratiques et de procédures …   Wikipédia en Français

  • Gestion Des Données De Référence — La gestion des données de référence (GDR ; en anglais Reference Data Management, ou Master Data Management, dont le sigle est MDM), est la discipline des technologies de l information qui s applique aux données de référence partagées par… …   Wikipédia en Français

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”