Géostatistique intrinsèque

Géostatistique intrinsèque

La géostatistique intrinsèque est la branche de la géostatistique qui étudie une variable régionalisée en la considération comme réalisation d'une fonction aléatoire. Ce passage est nommé modèle topo-probabiliste.

Ce passage n'est pas trivial. En effet, le phénomène physique étudié est le plus généralement unique. La géostatistique intrinsèque nécessite de déduire un modèle probabiliste à partir d'une seule de ses réalisations. On parle de randomisation ou d'immersion probabiliste.

Sommaire

Notations

Les notations usuelles sont :

  • S le champ de la variable régionalisée étudiée
  • x le point courant de l'espace de travail
  • z la variable régionalisée étudiée
  • Z la fonction aléatoire associée

Dans la suite, on travaillera généralement à support borné.

La variable régionalisée z est réalisation de la fonction aléatoire Z pour un événement ω0, soit z(x) = Z(x0). L'usage est de ne pas noter l'événement dans les expressions.

On notera également, pour une fonction aléatoire Z, sa moyenne sur un domaine v (sous-ensemble de S) :
\bar Z\left(v\right)=\frac{1}{[v]}\int_v Z(x)\mathrm dx
\scriptstyle [v]=\int_v \mathrm dx est la mesure du domaine v

Concepts et propriétés utilisés

La stationnarité d'une fonction aléatoire (sous ces deux formes ci-dessous) est une propriété, réalisée ou non. Par contre, la stationnarité de la variable régionalisée est une notion empirique et approximative, qui dépend du domaine et de l'échelle de travail.

On peut également exiger la stationnarité locale, c'est-à-dire que la fonction doit, en tout point, être stationnaire sur un voisinage de ce point (voisinage glissant indépendant du point[Pourquoi ?]).

Stationnarité au sens strict

La stationnarité d'une loi est son invariance par translation. La loi spatiale d'un multiplet quelconque de points (de dimensions et orientation fixées) ne dépend pas de l'implantation de ce multiplet. Cette hypothèse n'est généralement pas faite, et est remplacée par la stationnarité d'ordre 2.

Stationnarité d'ordre 2

La stationnarité est une propriété extrêmement forte. C'est pourquoi on lui préfère souvent la stationnarité d'ordre 2, qui requiert que les espérances des valeurs ponctuelles et des doublets de points de processus existent et soient invariantes par translation. Par rapport à la définition stricte, celle-ci ne concerne que les lois au plus bivariables, cependant elle exige l'existence des moments d'ordre 1 et 2 sur les valeurs ponctuelles.

Par abus de langage, cette propriété est souvent appelée « stationnarité », et la précédente « stationnarité stricte ».

En géostatistique, la stationnarité d'ordre 2 est généralement supposée a priori, le géostatisticien contrôle a posteriori que cette hypothèse est raisonnable.

La stationnarité est utilisée lors de l'écriture de la covariance entre deux points comme fonction de leur différence : \scriptstyle C_{xy}=C(x-y).

Problèmes globaux et locaux

Un problème est dit global s'il met en jeu la totalité du champ de la variable régionalisée étudiée. Il dépend à la fois de la structure intrinsèque de la variable régionalisée et de la géométrie du champ d'étude. Un tel problème se traite par la géostatistique transitive. Il est alors demandé l'homogénéité spatiale de l'implantation des données. Dans ce cas, on pourra distinguer le problème d'estimation (qui ne nécessite pas la stationnarité de la variable régionalisée, et se résout à l'aide du comportement à l'origine du coviariogramme transitif), et le problème d'interprétation structurale sur la variable régionalisée (où les effets de la variable régionalisée et du champ d'étude doivent être séparés).

Un problème est dit local s'il se pose dans le voisinage d'un point d'étude. Sous la mème contrainte d'homogénéité de la répartition de l'information, on construira alors des estimateurs linéaires invariants par translations; la stationnarité est celle de l'estimateur, non celle du phénomène physique.

En outre, l'hypothèse de stationnarité peut être prise comme locale : il existe un voisinage glissant V tel que pour x,yV, on se trouve dans le cas stationnaire. On distinguera donc local et localisé.

Hypothèse intrinsèque

Une fonction aléatoire Z est dite intrinsèque si ses accroissements Z(x)-Z(y) sont stationnaires d'ordre 2. Il existe alors deux fonctions:

  • une dérive, fonction linéaire \scriptstyle \forall x, m\left(h\right)=\mathbf E[Z\left(x+h\right)-Z\left(x\right)]. Une fonction aléatoire intrinsèque sans dérive est telle que m(h)=0;
  • un demi-variogramme, ou variogramme \scriptstyle \forall x, \gamma\left(h\right)=\tfrac 1 2 \mathbf{Var}[Z\left(x+h\right)-Z\left(x\right)], et dans le cas sans dérive \scriptstyle \gamma\left(h\right)=\tfrac 1 2 \mathbf{E}[\left(Z\left(x+h\right)-Z\left(x\right)\right)^2].

Une fonction aléatoire intrinsèque non stationnaire d'ordre 2 est dite strictement intrinsèque.

Ergodicité

La stationnarité n'entraîne pas l'ergodicité.

On demande généralement au processus stationnaire Z de satisfaire l'hypothèse d'ergodicité : L'expression \scriptstyle M^* = \frac 1{[S]} \int_S Z(x) \mathrm dx , lorsque les domaines S tendent vers l'infini, tend vers l'espérance mathématique \mathbf E[Z].

\mathbf E[M^*]=m \mathbf{Var}[M^*]=\frac 1{[S]^2} \int \sigma(h)K(h) \mathrm dh avec K(h) le covariogramme géométrique de S et σ(h) la covariance centrée de Z.

En pratique S ne peut tendre vers l'infini. On dira que plus Var[M*] est faible, plus m présente de signification objective. Asymptotiquement, on aura : \mathbf {Var}[M^*]\sim\frac A S \sigma\left(0\right) \scriptstyle A= \frac 1{\sigma\left(0\right)} \int \sigma(h) \mathrm dh est la portée intégrale, qui a la dimension de l'espace (aire dans 2).

Tout se passe comme si l'estimateur M* était obtenu en prenant la moyenne de N=S/A variables indépendantes de variance σ(0). Plus N est grand, plus le paramètre présente de signification objective. Par conséquent, on peut supposer l'hypothèse d'ergodicité si S est grand par rapport à A.

De plus, soit un support s suffisamment grand par rapport à A. On peut écrire \scriptstyle \bar\sigma\left(v,v\right)=\frac A v. On peut contrôler si le modèle est correct en estimant la validité de la relation \scriptstyle s^2\left(s|S\right)=A \left(\frac 1 s - \frac 1 S\right).

Il existe également des modèles théoriques de portée intégrale infinie, à éviter.

Échelle de travail

L'échelle de travail est totalement absente du formalisme probabiliste, néanmoins elle détermine la manière dont le géostatisticien contrôlera a posteriori les hypothèses de stationnarité et d'ergodicité.

Géostatistique linéaire (cas stationnaire ou intrinsèque)

La géostatistique linéaire est la partie de la géostatistique intrinsèque qui étudie des combinaisons linéaires de la fonction aléatoire Z considérée, qui sera prise dans la suite comme stationnaire d'ordre 2. Une telle fonction aléatoire est décrite par sa loi spatiale pour tout n-uplet de points :

f \left( \left\{ x_1;...;x_n\right\}; \left\{ z_1;...;z_n\right\}\right) = \mathbf{P} \left( Z\left(x_1\right)\le z_1;...;Z\left(x_n\right)\le z_n\right)

En pratique, la loi spatiale est trop riche, c'est pourquoi ou se limite à la manipulation des deux premiers moments de la fonction aléatoire :

m_x = \mathbf E\left[Z \left(x\right)\right]

C_{xy}=\mathbf{Cov}\left[Z \left(x\right),Z \left(y\right)\right] (covariance centrée)

Les espérances seront utilisées pour définir la valeur des estimateurs qui seront utilisés, et les variances comme critères de qualité de ces estimateurs[1].

Cette restriction impose de n'utiliser que des combinaisons linéaires de la fonction aléatoire étudiée, seules expressions dont on saura fournir une espérance et une variance. Une conséquence est qu'il faudra travailler sur des variables régionalisées additives (c'est-à-dire telles que toute combinaison linéaire de cette variable ait le même sens physique que la variable ponctuelle).

Malgré ces restrictions, la géostatistique linéaire possède les avantages suivants : elle est simple à mettre en œuvre, et c'est souvent la seule approche possible.

Combinaisons linéaires autorisées

Une combinaison linéaire de la fonction aléatoire est \scriptstyle \sum_i \lambda_i Z_i. Une mesure sur la fonction aléatoire est \scriptstyle \int \lambda\left(\mathrm dt\right) Z\left(t\right).

Une combinaison linéaire (respectivement une mesure) est dite autorisée (en abrégé, CLA) si son espérance et sa variance sont finies.

Cas stationnaire d'ordre 2

Dans le cadre d'une fonction aléatoire stationnaire d'ordre 2, toutes les mesures sont autorisées, toutes les combinaisons linéaires sont autorisées et stationnaires. Dans ce cas, les deux premiers moments s'écrivent :

\mathbf E \left[\sum_i \lambda_i Z_i\right] = \sum_i \lambda_i m_i
\mathbf{Var}\left[\sum_i \lambda_i Z_i\right]= \sum_{ij}\lambda_i C_{ij}\lambda_j

De plus, dans les hypothèses présentes, on peut simplifier l'écriture des moments : m\left(x\right)=m constant dans l'espace</math>
C\left(x,y\right)=C\left( h\right) avec h = xy

La covariance stationnaire a les propriétés de symétrie, d'inégalité de Schwarz, de positivité. De plus, son comportement à l'origine est lié aux caractères de contiuité ou de dérivabilité en moyenne quadratique de la fonction aléatoire. Par contre, à la différence du covariogramme transitif, C(h) peut ne pas être identiquement nul au-delà d'une certaine valeur de h. Son intégrale C(h)dh n'est non plus pas forcément définie.

Cas intrinsèque

Dans l'hypothèse intrinsèque, les CLA exactement les combinaisons d'accroissement (du type \scriptstyle \sum_i \lambda_i\left(Z\left(x_i\right)-Z\left(y_i\right)\right)), c'est-à-dire les mesures de poids total nul : λ(dt) telles que λ(dt)=0. La valeur ponctuelle elle-même n'est pas une CLA.

L'espérance d'une CLA dans le cas intrinsèque sans dérive est nulle. Sa variance s'obtient comme s'il existait une covariance égale à l'opposé du variogramme : \mathbf{Var}[\sum_i \lambda_i Z_i]=\sum_{i,j}-\lambda_i \gamma_{i,j} \lambda_j. Cela reste vrai si le variogramme n'est pas stationnaire.

Variance d'extension

Cas stationnaire d'ordre 2

Soit un domaine borné v. On posera la variable aléatoire suivante, moyenne spatiale de la fonction aléatoire étudiée :
\bar Z\left(v\right)=\frac{1}{[v]}\int_v Z(x)\mathrm dx[v] est la mesure du domaine v

La variance de Z(v) s'écrit:
\mathbf{Var}\left[\bar Z\left(v\right)\right]=\frac{1}{[v]^2}\int_v \int_v Z(x-y)\mathrm dx\mathrm dy, qui est la version continue d'une variance de CLA

Posons maintenant deux domaines v et v′. Comme \scriptstyle\mathbf E\left[\bar Z\left(v\right)-Z\left(v'\right)\right]=0, Z(v′) est un estimateur sans biais de Z(v). On appelle variance d'extension de v à v′ la variance de l'erreur d'estimation :
\sigma^2_E\left(v,v'\right)=\mathbf{Var}\left[\bar Z\left(v\right)-Z\left(v'\right)\right]

On écrit alors:
\sigma^2_E=\bar C\left(v,v\right)+\bar C\left(v',v'\right)-2\bar C\left(v,v'\right)

La variance d'extension est invariante par translation identique des deux domaines v et v′ ; c'est donc une caractéristique non-locale du modèle. Dans le cas où v′ est un ensemble fini de points Z(xi), on parle de variance d'estimation de v par les prélèvements Z(xi). Cependant, \scriptstyle\sigma^2_E n'est pas une variance conditionnelle, puisque la quantité à estimer et l'estimateur y jouent un rôle symétrique. De plus, on ne peut pas en déduire d'intervalle de confiance.

Historiquement, la géostatistique s'est développé initialement pour expliquer les comportements de la variance de dispersion, ce que ne faisait pas la statistique classique.

Cas intrinsèque

On vérifie aisément que Z(v)-Z(v′) est une CLA. Alors {\sigma_{\mathrm E}}^2\left(v,v'\right)=2\bar\gamma\left(v,v'\right)-\bar\gamma\left(v,v,\right)-\bar\gamma\left(v',v'\right).

On retrouve en cas particulier : {\sigma_{\mathrm E}}^2\left(\left\{x\right\},\left\{x+h\right\}\right)=2\gamma\left(h\right), \forall x.

Dispersion statistique

Cas stationnaire d'ordre 2

Soit un domaine V de l'espace de travail et une partition de V en N sous-domaines vi identiques entre eux à une translation près. Nous poserons Z et z'i les moyennes respectivement sur V et sur vi de z(x). On généralise le concept de dispersion (ou variance) grâce à la dispersion statistique de v dans V, donnée par :
s^2\left(v|V\right)=\frac{1}{N} \sum_i\left(\bar z_i-\bar z\right)^2, où l'on retrouve la variance statistique pour un domaine v = {x} ponctuel.

Par immersion probabiliste, on définit une nouvelle variable aléatoire S2(v|V):
S^2\left(v|V\right)=\frac 1N \sum_i\left(\bar Z_i-\bar Z\right)^2

On définit la variance de dispersion de v dans V comme l'espérance mathématique de S2(v|V), et on la note σ2(v|V).

La variance de dispersion peut également s'écrire sans contrainte de partition (et même quand v est un sur-ensemble de V, auquel cas elle est négative) :
\sigma^2(v|V)=\bar C(v,v)-\bar C(V,V)

On définit également la covariance de dispersion de v et v′ dans V :
\sigma^2\left(v,v'|V\right)= \bar C(v,v)-\bar C(V,V)

On a également:
\sigma^2\left(0|V\right)= C(0)-\bar C(V,V)
\sigma^2_E\left(v,v'\right)= \sigma^2\left(v|V\right) +  \sigma^2\left(v'|V\right)  -2\sigma^2\left(v,v'|V\right), \forall V

Il existe des phénomènes où s2(v croît indéfiniment lorsque V croît. Cela oblige à proposer le cas échéant un modèle sans variance a priori.

Cas intrinsèque

On a alors : \sigma^2\left(v|V\right)=\bar\sigma\left(V,V\right)-\bar\sigma\left(v,v\right). En particulier, \sigma^2\left(\left\{o\right\}|V\right)=\bar\sigma\left(V,V\right)

Formule de Krige

La formule de Krige (également, de manière ambiguë, relation d'additivité), s'écrit :
\sigma^2\left(v,|W\right)= \sigma^2\left(v,|V\right)+\sigma^2\left(V,|W\right)
pour trois ensembles quelconques v, V, W \sigma^2\left(v,|V\right)= \sigma^2\left(0,|V\right)-\sigma^2\left(0,v\right) (cas particulier)

Représentation glissante

La représentation glissante d'une variable régionalisée z S0 est la fonction aléatoire Z définie par : Z\left(x\right)=z\left(\underline u+x\right)u est le point aléatoire uniforme sur S0.

En posant en outre la grandeur régionale suivante, qui est covariance de Z : C\left(x,y\right)=\frac 1 {[S_0]} \int_{S_0} z\left(u+x\right)z\left(u+y\right)\mathrm du
avec C\left(x,y\right)=\mathbf E[Z(x).Z(y)]

Régularisation

La régularisation d'une variable aléatoire est sa pondération par une mesure. Soit p(dt) une mesure supposée normée (p(dt)=1), on écrit la régularisée: \scriptstyle Z_p\left(x\right)=\int Z\left(x+t\right)p\left(\mathrm dt\right)

Zp est une intégrale stochastique, définie, dans le cas stationnaire d'ordre 2, ssi \int\int p\left(\mathrm dx\right)C_{x,y}p\left(\mathrm dy\right)< \inf.

En cas d'existence, Zp est stationnaire d'ordre 2 et de covariance C_p\left(h\right)=\int\int C\left(h+x-y\right)p\left(\mathrm dx\right)p\left(\mathrm dy\right).

Cela reste vrai en hypothèse intrinsèque stricte, en remplaçant alors C(·) par γ(∞)−γ(·).

Changement de support

Soit v un support quelconque, vx sont translaté d'un vecteur x : \bar Z\left(v_x\right)=\frac 1{[v]}\int_v Z\left(x+t\right)\mathrm dt. Le variogramme de Z(vx) vaut : \gamma_v\left(h\right)=\frac 12 \mathbf{Var}\left[\bar Z\left(v_{x+h}\right)-\bar Z\left(v_x\right)\right] =\frac 12 \left(\bar\gamma\left(v_x,v_{x+h}\right)-\bar\gamma\left(v_x,v_x\right)-\bar\gamma\left(v_{x+h},v_{x+h}\right)\right) car on reconnaît une variance d'extension =\bar\gamma\left(v_0,v_h\right)-\bar\gamma\left(v_0,v_0\right) (les deux derniers termes sont égaux, le premier indépendant de x)

\gamma_v\left(h\right)=\bar\gamma\left(v_0,v_h\right)-\bar\gamma\left(v_0,v_0\right)

Dans l'hypothèse stationnaire d'ordre 2, avec des notations similaires, C_v\left(h\right)=\bar C\left(v_0,v_h\right)

Géostatistique non-stationnaire

Dans cette partie, nous étudions les modèles locaux de non-stationnarité.

Deux techniques permettent de se rammener à une situation stationnaire:

  • Krigeage universel : séparation du phénomène en deux composantes;
  • géostatistique intrinsèque par les FAI-k: transformation du phénomène en phénomène stationnaire.

Notes et références

  1. On aurait pu imaginer des estimateurs fondés sur la médiane, le maximum de vraisemblance, ou des critères basés sur des intervalles de confiance, mais les outils et le modèle dépassent alors le cadre de la géostatistique linéaire. D'autre part, la géostatistique linéaire est d'autant mieux adaptée à une étude que la fonction aléatoire traitée est proche d'une gaussienne

Annexes

Articles connexes

Bibliographie

  • (fr) Pierre Chauvet, Aide-mémoire de Géostatistique linéaire, École des Mines de Paris, 1999

Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Géostatistique intrinsèque de Wikipédia en français (auteurs)

Игры ⚽ Поможем написать курсовую

Regardez d'autres dictionnaires:

  • Géostatistique — La géostatistique est une discipline à la frontière entre les mathématiques et les sciences de la Terre. Son principal domaine d utilisation a historiquement été l estimation des gisements miniers, mais son domaine d application actuel est… …   Wikipédia en Français

  • GÉOSTATISTIQUE — Pour des conditions économiques données, les réserves récupérables d’un gisement minier peuvent varier considérablement suivant la plus ou moins grande sélectivité de l’exploitation. Les contraintes géométriques, le support de la sélection, c’est …   Encyclopédie Universelle

  • Fonction aléatoire intrinsèque — Une fonction aléatoire intrinsèque d ordre k (en abrégé FAI k) est une classe de fonction aléatoire respectant certaines conditions. Cette propriété étend celle de fonction aléatoire intrinsèque. Une fonction aléatoire intrinsèque stricte est une …   Wikipédia en Français

  • Estimation (géostatistique) — En géostatistique, l estimation est la prédiction à partir d une variable régionalisée pour pallier une lacune d information. Sommaire 1 Estimation globale 1.1 Échantillonnage aléatoire pur 1.2 Échantillonnage aléatoire stratifié …   Wikipédia en Français

  • Variable régionalisée — La VR comme phénomène physique : topographie de la ville de Binche …   Wikipédia en Français

  • Projet:Mathématiques/Liste des articles de mathématiques — Cette page n est plus mise à jour depuis l arrêt de DumZiBoT. Pour demander sa remise en service, faire une requête sur WP:RBOT Cette page recense les articles relatifs aux mathématiques, qui sont liés aux portails de mathématiques, géométrie ou… …   Wikipédia en Français

  • Krigeage — Le krigeage est une méthode d’estimation issue de la géostatistique. Le terme krigeage, provient du nom de famille de l ingénieur minier sud africain Daniel Gerhardus Krige[1]. Il a été formalisé pour la prospection minière par Georges… …   Wikipédia en Français

  • Variogramme — Cette section est vide, insuffisamment détaillée ou incomplète. Votre aide est la bienvenue ! Le variogramme est une fonction mathématique utilisée en géostatistique, en particulier pour le krigeage. On parle également de semivariogramme, de …   Wikipédia en Français

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”