Banque de données

Base de données

Page d'aide sur l'homonymie Pour les articles homonymes, voir base, BD, BDD et DB.
Schéma de la base de données relationnelle MediaWiki

En informatique une base de données (Abr. : « BD » ou « BDD ») est un stock d'informations organisé et structuré de manière à pouvoir être facilement manipulé. Les bases de données sont typiquement utilisées pour stocker efficacement de très grandes quantités d'informations[1].

L'organisation logique des données se fait selon un modèle de données et la structure physique des fichiers comporte des index destinés à accélérer les opérations de recherche et de tri. Le modèle de données relationnel est aujourd'hui le plus utilisé parce qu'il permet l'indépendance entre la structure physique et l'organisation logique des données - contrairement aux modèles hiérarchique et réseau.


Dans le langage courant, le terme base de données est utilisé pour désigner toute source importante de données telle qu'une encyclopédie[2]. Et les bases de données sont classées en fonction de leur contenu : bibliographique, texte, numérique, et images.

Le logiciel qui manipule les bases de données est appelé système de gestion de base de données (SGBD). Il permet d'organiser, de contrôler, de consulter et de modifier la base de données. Les opérations sont parfois formulées dans un langage de requête tel que SQL, qui est le plus connu et employé pour les modèles relationnels.

Sommaire

Le modèle de données

modèle de données relationnel

Dans une base de données, les informations sont typiquement classées par nature et les différentes natures sont connexes (exemple: dossier médical - patient - médecin - consultations - médicaments). Les données sont réunies en petits groupes appelés enregistrements. A chaque enregistrement corresponds une entité, c'est-à-dire une notion concrète ou abstraite.

Le modèle de données est l'organisation sémantique des différentes entités stockées dans une base de données. voir aussi schéma conceptuel.

  • Dans le modèle de données hiérarchique des différentes entités sont reliées entre elles par des relations père-fils selon un diagramme en arbre.
  • Dans le modèle réseau les différentes entités sont reliées entre elles par des relations de-à, selon une organisation arbitraire.

Modèle de données relationnel

En 1970, Edgar F. Codd (1923-2003), chercheur chez IBM, propose dans une thèse mathématique d'utiliser les informations présentes dans les enregistrements - en lieu et place des pointeurs - pour assurer les liens entre les informations et de regrouper les enregistrements dans des tables. Regroupement motivé par le fait que le résultat de chaque recherche dans une base de données est une table[3]. Mais IBM - qui travaillait alors sur un autre type de base de données - ne s'y est d'abord pas intéressé jusqu'en 1978, lorsque le concept intéresse Lawrence Ellison, le fondateur d'une startup qui est devenue Oracle Corporation[4][5].

Cette proposition est la base du modèle de données relationnel, modèle utilisé par la quasi-totalité des système de gestion de base de données au début du XXIe siècle[6]. Dans ce modèle, tout comme dans le modèle réseau, les entités sont reliées par des relations de-à, selon une organisation arbitraire.

Le modèle entité-relation est utilisé pour schématiser l'organisation logique (les entités et les relations) dans les bases de données relationnelles[7].

Histoire

Les disque durs, mémoire de masse de grande capacité, ont été inventés en 1956. L'invention du disque dur a permis d'utiliser les ordinateurs pour collecter, classer et stocker de grandes quantités d'informations.

Le terme database (base de données) est apparu en 1964 pour désigner une collection d'informations partagées par différents utilisateurs d'un système d'informations militaire[8].

Les premières bases de données hiérarchiques sont apparues au début des années 1960. Les informations étaient découpées en deux niveaux de hierarchie. Un niveau contenait les informations qui sont identiques sur plusieurs enregistrements de la base de données. Le découpage a ensuite été étendu pour prendre la forme d'un diagramme en arbre.[8]

Le modèle de données réseau a été créé par Charles Bachman du consortium CODASYL en 1969, pour des applications informatiques pour lesquelles le modèle hiérarchique ne convient pas.[8] Charles Bachman a recu le prix Turing en 1973 pour ces contributions exceptionelles à la technologie des bases de données.[9]

En 1970 Edgar F. Codd note dans sa thèse mathématique sur l'algèbre relationnelle qu'un ensemble d'entités est comparable à une famille en mathématique, et que les jointures sont des produits cartésiens. Cette thèse est à l'origine des bases de données relationnelles.[8] Edgar F. Codd a recu le prix Turing en 1981.

Le modèle entité-relation a été inventé par Peter Chen en 1975, il est destiné à clarifier l'organisation des données dans les bases de données relationnelles.[7][10]

Les premieres bases de données étaient calquées sur la présentation des cartes perforées: répartis en lignes et colonnes de largeur fixe. Telle répartition permet difficilement de stocker des objets de programmation, en particulier ne permettent pas l'héritage entre les entités, caractéristique de la programmation orientée objet.

Apparues dans les années 1990, les base de données orientée objet et les base de données objet-relationnel utilisent un modèle de données relationnel tout en permettant le stockage des objets. Dans ces bases de données les relations d'héritage des objets s'ajoutent aux relations entre les entités du modèle relationnel[11].

Contenu

Dans les fichiers de la base de données sont stockés les informations, ainsi que les indexes, le détail du modèle de données, des listes de contrôle d'accès et un journal des opérations.

Les informations sont placés dans les champs des enregistrements de la base de données. Les enregistrements sont reliés pour former des collections. Dans les bases de données relationnelles les collections sont des tables avec lignes et colonnes.

Arbre B

Les indexes sont des structures qui facilitent la recherche, le tri et le regroupement des informations d'une collection. Ce sont typiquement des structures en arbre B ou en table de hachage. Les index contiennent les différentes valeurs d'un ou de plusieurs champs des enregistrements d'une collection.

Une clé primaire est un champ ou une combinaison de champs dont les valeurs sont différentes pour chaque enregistrement de la collection. La clé primaire permet de retrouver un et un seul enregistrement de la collection.

Dans une base de données relationnelle une clé étrangère est un champ ou une combinaison de champs d'une table A qui sont en relation avec une clé primaire dans une table B.

Le détail du modèle de données et les listes de contrôle d'accès sont utilisés par le moteur de base de données pour contrôler et effectuer les opérations de manipulation des données.

Un journal contient la liste des dernières opérations effectuées sur la base de données. Ce journal est utilisé par le moteur de base de données pour annuler les opérations, par exemple en cas de crash informatique, ou si les opérations comportent une erreur.


Utilisations

Les bases de données sont utilisées dans de très nombreuses applications informatiques, en particulier en informatique de gestion, en informatique décisionnelle, en gestion des connaissances.

  • Un moteur de recherche est un logiciel qui permet de retrouver des ressources (fichiers, documents, pages web) associées à des mots quelconques. La liste des mots et des ressources associées sont stockés dans une base de données.
  • Un système d'informations est une application informatique qui sert à collecter, classer, regrouper et modifier un ensemble d'informations. Les systèmes d'informations sont d'usage courant dans les entreprises et les institutions telles que les douanes, les hôpitaux, la marine, les transports, ou l'armée.
    • Un enterprise resource planning est système d'informations qui sert à la collecte, et la maintenance des informations concernant l'activité d'une entreprise (ventes, achats, salaires, ...)
    • Un système d'information géographique : est un système d'informations qui permet de collecter, manipuler des renseignements de cartographie (coordonées de routes, de forêts, de plans d'eau), et réaliser des cartes géographiques.
  • Un entrepôt de données est une base de données qui est utilisée pour collecter et stocker définitivement des informations historiques qui seront utilisées pour des statistiques et des analyses. Les informations sont souvent collectées à intervalle régulier depuis un système d'informations.

Voir aussi

Articles connexes

Liens externes

Notes et références

  • Portail de l’informatique Portail de l’informatique
  • Portail des bases de données Portail des bases de données
Ce document provient de « Base de donn%C3%A9es#Utilisations ».

Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Banque de données de Wikipédia en français (auteurs)

Regardez d'autres dictionnaires:

  • Banque de données — ● Banque de données collection ordonnée d informations apparentées et traitées par ordinateur, mémorisées, qui peuvent être interrogées à distance en ligne …   Encyclopédie Universelle

  • banque de données — duomenų bazė statusas T sritis automatika atitikmenys: angl. data base; database vok. Datenbank, f; Datenbasis, f rus. база данных, f pranc. banque de données, f …   Automatikos terminų žodynas

  • banque de données — duomenų bankas statusas T sritis radioelektronika atitikmenys: angl. data bank vok. Datenbank, f rus. банк данных, m pranc. banque de données, f …   Radioelektronikos terminų žodynas

  • banque de données — ● /bank/ n. f. ►BASDON Databank en anglais. Cousine de la base de données, mais celle ci bannit (en théorie) toute redondance et repose sur une structuration très stricte. Les banques de données sont souvent de gros amas d infos en ligne produits …   Dictionnaire d'informatique francophone

  • Banque de Données Automatisée sur les Médicaments — La BIAM (sigle de « Banque d informations automatisée sur les médicaments », plus tard retitrée « Banque de données automatisée sur les médicaments ») est une base de données destinée aux médecins et pharmaciens et son accès… …   Wikipédia en Français

  • Banque de données terminologiques — Banque de terminologie Une banque de terminologie, base de terminologie, base de données terminologiques ou dictionnaire terminologique est une sorte de dictionnaire abordant la terminologie, c est à dire le langage spécifique, d une ou plusieurs …   Wikipédia en Français

  • Banque de données de protéines du RCSB — Protein Data Bank Pour les articles homonymes, voir PDB. La banque de données sur les protéines du Research Collaboratory for Structural Bioinformatics, plus communément appelée Protein Data Bank ou PDB est une collection mondiale de données sur… …   Wikipédia en Français

  • Banque de données des protéines — Protein Data Bank Pour les articles homonymes, voir PDB. La banque de données sur les protéines du Research Collaboratory for Structural Bioinformatics, plus communément appelée Protein Data Bank ou PDB est une collection mondiale de données sur… …   Wikipédia en Français

  • Banque de données santé publique — La Banque de données en santé publique (ou BDSP) est un service d’information en ligne fondé sur une couverture multidisciplinaire de la santé publique et à destination des professionnels en exercice et en formation. Créée à l’initiative de la… …   Wikipédia en Français

  • Banque de données automatisée sur les médicaments — La BIAM (sigle de « Banque d informations automatisée sur les médicaments », plus tard retitrée « Banque de données automatisée sur les médicaments ») est une base de données destinée aux médecins et pharmaciens et son accès… …   Wikipédia en Français

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”