Processus de Galton-Watson

Le processus de Galton-Watson est un processus stochastique permettant de décrire des dynamiques de populations.

Sommaire

1 Historique
2 Formulation générale
3 Paramètre critique et classification des processus de Galton-Watson
4 Notation de Neveu
5 Étude fine de la taille des générations
- 5.1 Cas sur-critique
- 5.2 Un calcul explicite
  - 5.2.1 Cas non critique
  - 5.2.2 Cas critique
6 Probabilité d'extinction
7 A voir aussi

Historique

À l'origine, ce modèle a été introduit par Sir Francis Galton en 1873 en vue d'étudier la statistique des patronymes dans l'Angleterre victorienne. Supposons que chaque adulte mâle transmette son patronyme à chacun de ses enfants. Supposons également que le nombre d'enfants de chaque homme soit une variable aléatoire entière (et que la distribution de probabilité soit la même pour tous les hommes dans une lignée). Alors, un patronyme dont les porteurs ont un nombre d'enfant strictement inférieur à 1 en moyenne est amené à disparaître. Inversement, si le nombre moyen d'enfants est supérieur à 1, alors la probabilité de survie de ce nom est non-nulle et en cas de survie, le nombre de porteurs du patronyme connait une croissance exponentielle.

Formulation générale

On suppose l'existence d'une population d'individus qui se reproduisent de manière indépendante. Chaque individu i donne naissance à $\scriptstyle\ X_i\$ individus et meurt. On suppose que les $\scriptstyle\ X_i\$ sont des variables aléatoires indépendantes à valeurs entières suivant la distribution $\scriptstyle\ p=\left(p_k\right)_{k\in\mathbb{N}}.\$ Par exemple,

si, avec probabilité $\scriptstyle\ p_0=\mathbb{P}(X_i=0),\$ $\scriptstyle\ X_i=0,\$ alors l'individu i meurt sans se reproduire ;

si, avec probabilité $\scriptstyle\ p_1=\mathbb{P}(X_i=1),\$ $\scriptstyle\ X_i=1,\$ alors il y a un remplacement un-pour-un de l'individu i ;

etc ...

Notation — La fonction génératrice $\scriptstyle\ \varphi,\$ associée à la distribution de probabilité $\scriptstyle\ p=\left(p_k\right)_{k\in\mathbb{N}},\$ définie par :

$\varphi(s)\ =\ \sum_{n\ge 0}\,p_n\,s^n\ =\ \mathbb{E}\left[s^{X_{i}}\right],$

est d'une importance particulière dans la discussion des résultats essentiels sur les processus de Galton-Watson.

Paramètre critique et classification des processus de Galton-Watson

Notons $\scriptstyle\ Z_n\$ la taille de la population à la n-ème génération. On suppose souvent que la population possède un seul ancêtre, ce qui se traduit par

Z 0 = 1.

Le nombre

$m\ =\ \sum_k k p_k\ =\ \varphi^{\prime}(1)$

désigne le nombre moyen d'enfants d'un individu typique de la population considérée. L'évolution de la taille moyenne de la population est gouvernée par la formule de récurrence suivante :

$\mathbb{E}[Z_{n+1}]\ =\ m\ \mathbb{E}[Z_{n}],$

elle-même conséquence de la formule de Wald, d'où il résulte que

$\mathbb{E}[Z_{n}]\ =\ m^{n}.$

Définition — Si, à partir d'un certain rang, tous les termes de la suite $\scriptstyle\ \left(Z_{n}\right)_{n\ge 0}\$ sont nuls, on dit qu'il y a extinction de la population.

Classification des processus de Galton-Watson — Il existe deux régimes séparés par une valeur critique du paramètre $\scriptstyle\ m\$ :

Si $\scriptstyle\ m<1,\$ le processus de Galton-Watson est dit sous-critique. L'extinction de la population se produit avec probabilité 1 ;

Si $\scriptstyle\ m>1,\$ le processus de Galton-Watson est dit sur-critique. Alors la probabilité de survie de ce nom est non-nulle (la probabilité d'extinction est inférieure strictement à 1). En cas de survie, le nombre de porteurs du patronyme connait une croissance exponentielle.

Si $\scriptstyle\ m=1,\$ alors le processus de Galton-Watson est dit critique. Son comportement est plus complexe et sera discuté dans la suite.

Notation de Neveu

Une notation due à Neveu permet de décrire rigoureusement l'évolution de la population à l'aide d'un arbre planaire enraciné, qui est en fait l'arbre généalogique de cette population. Cet arbre planaire enraciné peut être décrit de manière non ambigüe par la liste de ses sommets, chacun désigné par une suite finie d'entiers, qui sont les positions, au sein de leur fratrie, des ancêtres (ou ascendants) de ce sommet : le sommet 2|4|3 désigne le 3ème fils du 4ème fils du 2ème fils de l'ancêtre (l'ancêtre étant lui-même désigné par la suite vide, notée $\scriptstyle\emptyset\$ ). Par convention, l'ancêtre est le sommet initial de l'arête racine, et le sommet final de l'arête racine est le fils ainé de l'ancêtre : en tant que tel, il est donc noté 1. La longueur de la suite associée à un sommet est la hauteur (ou la profondeur) du sommet, i.e. la distance entre ce sommet et le début de la racine, qui représente l'ancêtre : en filant la métaphore, un sommet de hauteur n représente un individu appartenant à la n-ème génération de la population fondée par l'ancêtre. Les 5 arbres à 3 arêtes :

sont ainsi décrits par les 5 ensembles de mots

$\{\emptyset,1,2,3\},\ \{\emptyset,1,11,2\},\ \{\emptyset,1,2,21\},\ \{\emptyset,1,11,12\},\ \{\emptyset,1,11,111\}.$

Avec cette notation, un arbre planaire encode commodément une réalisation de processus de Galton-Watson avec extinction : cet arbre est alors appelé arbre de Galton-Watson. Rien ne s'oppose à définir un arbre planaire infini à l'aide de la notation de Neveu, ce qui permet d'encoder les réalisations de processus de Galton-Watson où la population ne s'éteint pas.

Notation de Neveu pour les sommets d'un arbre planaire.

Exemple :

L'arbre de la figure ci-contre correspond à une suite de variables aléatoires $\scriptstyle\ X_i,\$ ainsi définies :

$(X_{\emptyset},X_1,X_2,X_3,X_{11},X_{12},X_{111},X_{121},X_{122},\dots)\ =\ (3,2,0,0,1,2,1,0,1, \dots).$

Ainsi, un processus de Galton-Watson peut-être vu comme une fonctionnelle déterministe d'une famille $\scriptstyle\ \left(X_i\right)_{i\in\mathbb{N}^{\star}}\$ de variables aléatoires indépendantes et de même loi $\scriptstyle\ p=\left(p_k\right)_{k\in\mathbb{N}},\$ la variable $\scriptstyle\ X_i\$ désignant la progéniture de l'individu i (le nombre d'enfants auxquels ils donne naissance en mourant). Ici $\scriptstyle\ \mathbb{N}^{\star}\$ désigne l'ensemble (dénombrable) des suites d'entiers de longueurs finies (éventuellement de longueur nulle dans le cas de $\scriptstyle\ \emptyset\$ ) :

$\mathbb{N}^{\star}=\{\emptyset\}\cup\mathbb{N}\cup\mathbb{N}^{2}\cup\mathbb{N}^{3}\cup \dots$

Exemple :

Certaines variables aléatoires de la suite $\scriptstyle\ \left(X_i\right)_{i\in\mathbb{N}^{\star}}\$ n'ont pas d'influence sur le processus de Galton-Watson : dans l'exemple ci-contre, $\scriptstyle\ X_4\$ ou $\scriptstyle\ X_{126}\$ n'ont pas d'importance car l'ancêtre a strictement moins de 4 enfants ( $\scriptstyle\ X_\emptyset=3\$ ) et l'individu 12 a strictement moins de 6 enfants ( $\scriptstyle\ X_{12}=2\$ ). De même les progénitures des individus de la 5ème génération (les $\scriptstyle\ X_i\$ correspondant aux suites i de longueur 5) n'influencent pas cette réalisation du processus de Galton-Watson, car la population s'éteint à la 4ème génération ( $\scriptstyle\ X_{1111}=X_{1221}=0\$ ).

Étude fine de la taille des générations

Notons $\scriptstyle\ \varphi_n\$ la fonction génératrice de la variable aléatoire $\scriptstyle\ Z_n,\$ définie par

$\varphi_n(s)\ =\ \sum_{k\ge 0}\,\mathbb{P}(Z_n=k)\,s^k\ =\ \mathbb{E}\left[s^{Z_{n}}\right].$

Posons

$p_{\ell}^{\star k}\ =\ [s^{\ell}]\varphi^k(s)\ =\ \mathbb{P}(X_1+\dots+X_k=\ell),$

où les X_i sont des variables aléatoires indépendantes, toutes de loi $\scriptstyle\ p\$ ; $\scriptstyle\ p^{\star k}=\left(p_{\ell}^{\star k}\right)_{\ell\ge 0}\$ est la k ème puissance de convolution de la loi $\scriptstyle\ p.\$

En vertu de la propriété de composition des fonctions génératrices, on a la relation suivante :

Relation de récurrence fondamentale — $\varphi_{n+1}\ =\ \varphi_n\circ\varphi.$

Démonstration

Pour pouvoir appliquer la propriété de composition des fonctions génératrices, il faut se convaincre que $\scriptstyle\ Z_{n+1}\$ (l'effectif de la n+1 ème génération) a même loi que la somme de $\scriptstyle\ Z_{n}\$ variables aléatoires indépendantes, toutes de loi $\scriptstyle\ p,\$ et indépendantes de $\scriptstyle\ Z_{n}.\$ Bien sûr, $\scriptstyle\ Z_{n+1}\$ est la somme des progénitures des $\scriptstyle\ Z_{n}\$ individus appartenant à la n ème génération, mais, contrairement au contexte de la propriété de composition des fonctions génératrices, on ne choisit pas les $\scriptstyle\ Z_{n}\$ premiers termes d'une suite de variables aléatoires i.i.d. indexées par $\scriptstyle\ \mathbb{N}\$ : dans la notation de Neveu, par exemple, la suite de variables aléatoires i.i.d. est indexée par $\scriptstyle\ \mathbb{N}^n, \$ et les $\scriptstyle\ Z_{n}\$ variables de la suite intervenant dans la somme sont choisies en fonction de toute l'histoire de la population, jusqu'à la n-ème génération (non incluse). Une fois qu'on s'est convaincu que, malgré cela, $\scriptstyle\ Z_{n+1}\$ (l'effectif de la n+1 ème génération) a même loi que la somme de $\scriptstyle\ Z_{n}\$ variables aléatoires indépendantes, toutes de loi $\scriptstyle\ p,\$ et indépendantes de $\scriptstyle\ Z_{n},\$ on en déduit que

$\varphi_{n+1}\ =\ \varphi_n\circ\varphi.$

Démonstration

Un énoncé précis utilise la notion de loi conditionnelle : pour pouvoir appliquer la propriété de composition des fonctions génératrices, on doit vérifier que, pour tout k, la loi conditionnelle de $\scriptstyle\ Z_{n+1}\$ sachant l'évènement $\scriptstyle\ \{Z_{n}=k\}\$ est la loi de la somme de k variables aléatoires indépendantes, toutes de loi $\scriptstyle\ p,\$ loi décrite par $\scriptstyle\ \left(p_{\ell}^{\star k}\right)_{\ell\ge 0}.\$ Pour vérifier cela, on est amené à calculer la loi conditionnelle sachant un évènement plus précis que $\scriptstyle\ \{Z_{n}=k\},\$ i.e. sachant la composition exacte de la n-ème génération. Soit L un ensemble d'éléments de $\scriptstyle\ \mathbb{N}^n. \$ Notons $\scriptstyle\ A_L \$ l'évènement :

$A_L\ =\ \{\scriptstyle{\mathrm{les~individus~formant~la~} n\,\mathrm{-\grave eme~g\acute en\acute eration~de~la~population~sont~exactement~les~\acute el\acute ements~de~}L}\}.$

En particulier les ancêtres des individus appartenant à L sont connus, donc $\scriptstyle\ A_L \$ apporte une information sur les générations 1, 2, ... jusqu'à la génération n-1. On constate que l'évènement $\scriptstyle\ A_L \$ appartient à la tribu engendrée par la famille des $\scriptstyle\ X_i, \$ où i est une suite de longueur inférieure ou égale à n-1. Par ailleurs,

$\mathbb{P}\left(Z_{n+1}=\ell\,|\,A_L\right)=\mathbb{P}\left(\left\{\sum_{j\in L}X_{j}\ =\ \ell\right\}\ \cap A_L\right)\left(\mathbb{P}(A_L)\right)^{-1}$

Comme L est disjoint de l'ensemble des suites de longueur inférieure ou égale à n-1, le lemme de regroupement entraine que

$\mathbb{P}\left(Z_{n+1}=\ell\,|\,A_L\right)=\mathbb{P}\left(\sum_{j\in L}X_{j}\ =\ \ell\right)=p_{\ell}^{\star |L|}.$

Cette dernière probabilité dépend de $\scriptstyle\ \ell,\$ mais, surtout, elle dépend de L uniquement à travers son cardinal $\scriptstyle\ |L|=Z_{n}.\$ Donc, dès que $\scriptstyle\ |L|=k,\$

$\mathbb{P}\left(Z_{n+1}=\ell\,|\,A_L\right)=\mathbb{P}\left(Z_{n+1}=\ell\,|\,Z_{n}=k\right)=p_{\ell}^{\star |L|},$

en vertu d'une variante de la formule des probabilités totales. Accessoirement ceci montre que la suite $\scriptstyle\ (Z_{n})_{n\ge0}\$ possède la propriété de Markov. Plus précisément, c'est une chaine de Markov homogène de probabilité de transition $\scriptstyle\ \left(p_{\ell}^{\star k}\right)_{k,\ell\ge 0}.\$

En remarquant que

$\varphi_{0}\ =\ \text{Id},$

on en déduit, par récurrence, que

$\varphi_{n}\ =\ \varphi^{\circ n},$

puis la relation de récurrence fondamentale. On peut aussi obtenir cette relation plus directement, en décomposant $\scriptstyle\ Z_{n+1}\$ différemment (comme somme de X copies de $\scriptstyle\ Z_{n}\$ plutôt que comme somme de $\scriptstyle\ Z_{n}\$ copies de X).

Remarques :

La relation de récurrence sur l'espérance de $\scriptstyle\ Z_{n},\$

$\mathbb{E}[Z_{n+1}]\ =\ \varphi^{\prime}\left(1\right)\ \mathbb{E}[Z_{n}],$

découle alors de la formule de dérivation des fonctions composées.

À l'aide de la relation de récurrence fondamentale, on trouve aussi, le cas échéant, une formule de récurrence pour la variance de $\scriptstyle\ Z_{n}.\$
La démonstration de la formule de récurrence fondamentale montre aussi (modulo quelques modifications) que la suite $\scriptstyle\ (Z_{n})_{n\ge0}\$ est une chaine de Markov dont la matrice de transition $\scriptstyle\ \left(p_{i,j}\right)_{i,j\ge 0}\$ est définie par $\scriptstyle\ p_{k,\ell}\,=\,p_{\ell}^{\star k}.\$

Cas sur-critique

Dans le cas sur-critique, la taille de la population croit à vitesse exponentielle sur un ensemble assez large.

Théorème — Si la loi de la progéniture est intégrable, de moyenne m>1, alors il existe une variable aléatoire M telle que, presque sûrement,

$\lim\ \dfrac{Z_n}{m^n}\ =\ M.$

Si, de plus, la loi de la progéniture est de carré intégrable, alors $\scriptstyle\ \mathbb{P}(M>0)>0.\$ Par ailleurs, $\scriptstyle\ \dfrac{Z_n}{m^n}\$ converge vers M dans L₂.

Des résultats plus précis peuvent être obtenus grâce au théorème de Kesten-Stigum^[1] ^[2].

Démonstration

Soit $\scriptstyle\ (X_{i,j})_{i,j}$ une famille indépendante et identiquement distribuée de variables aléatoires de loi $\scriptstyle\ (p_k)_k$ , de moyenne $\scriptstyle\ m\ >\ 1$ . On définit la filtration :

$\mathcal F _n\ =\ \sigma(X_{i,j}, i \in \mathbb N, j \leq n).$

Alors le processus défini par récurrence par :

$Z_0\ =\ 1,$ $Z_{n+1} \ =\ \sum_{i=1}^{Z_n} X_{i,n+1}$

est un processus de Galton-Watson de loi de reproduction $\scriptstyle\ (p_k)_k$ . On définit alors le processus :

$M_n=\dfrac{Z_n}{m^n},$

qui est une $\scriptstyle\ \mathcal F_n$ -martingale. En effet,

$\begin{align} \mathbb{E}\left[Z_{n+1}\left|\mathcal F _n\right.\right] &= \mathbb{E}\left[\sum_{i=1}^{Z_n} X_{i,n+1}\left|\mathcal F _n\right.\right] \\ &= \sum_{i=1}^{Z_n}\mathbb{E}\left[X_{i,n+1}\left|\mathcal F_n\right.\right] \\ &= m Z_n, \end{align}$

ce qui entraîne que

$\mathbb{E}\left[M_{n+1}\left|\mathcal F _n\right.\right] = M_n.$

Comme $\scriptstyle\ M_n$ est une martingale positive, elle converge presque sûrement vers une variable aléatoire réelle $\scriptstyle\ M.\$

Si on suppose de plus que $\scriptstyle\ \mathbb{E}[X_{i,j}^2]\ < \infty$ , on peut démontrer que l'ensemble $\scriptstyle\ \{\omega\in\Omega\,|\,M(\omega)\ >\ 0\}\$ est de mesure positive, et qu'il est égal presque sûrement à l'ensemble de non-extinction de l'arbre $\scriptstyle\ \{\liminf Z_n\ >\ 0\}.\$ En effet, dans ce cas, un calcul par récurrence montre que $\scriptstyle\ M_n$ est bornée dans $\scriptstyle\ L^2.\$ On en déduit alors la convergence dans $\scriptstyle\ L^2$ de $\scriptstyle\ M_n$ vers $\scriptstyle\ M$ . On a alors, en particulier,

$\mathbb{E}[M]=\lim_n\mathbb{E}[M_n]=\mathbb{E}[M_0]=\mathbb{E}[Z_0]=1.$

Par conséquent $\scriptstyle\ M\ >\ 0$ sur un ensemble de mesure non-nulle.

Ainsi, presque sûrement, $\scriptstyle\ m^n M(\omega)\$ est une bonne approximation, au premier ordre, du nombre $\scriptstyle\ Z_n(\omega)$ d'individus de la génération $\scriptstyle\ n,$ du moins sur l'ensemble $\scriptstyle\ \{\omega\in\Omega\,|\,M(\omega)\ >\ 0\},$ ensemble qui a une probabilité non nulle.

Un calcul explicite

Il y a assez peu d'exemples où la formule de récurrence fondamentale conduit à un calcul explicite de $\scriptstyle\ \varphi_{n}.\$ L'exemple le plus connu est celui où la loi de reproduction est un mélange de masse de Dirac en 0 et de loi géométrique,

$\mathbb{P}(X_{i}=k)\ =\ \alpha 1\!\!1_{k=0}+(1-\alpha)(1-p)^{k-1}p\, 1\!\!1_{k\ge1},\quad (\alpha,p)\in[0,1]\times]0,1],$

d'espérance

$m\ =\ \mathbb{E}[X_{i}]\ =\ \frac{1-\alpha}{p}.$

Cela correspond exactement aux fonctions génératrices $\scriptstyle\ \varphi\$ qui sont des homographies :

$\varphi(s)\ =\ \alpha\ +\ (1-\alpha)\ \frac{ps}{1-(1-p)s}.$

D'après la classification des homographies en fonction du nombre de points fixes, l'homographie $\scriptstyle\ \varphi\$ est conjuguée à des applications dont les itérées se calculent simplement, à savoir à $\scriptstyle\ x\ \rightarrow\ x/m\$ dans les cas non critiques (deux points fixes, 1 et $\scriptstyle\ \tfrac{\alpha}{1-p}\$ ) et à $\scriptstyle\ x\ \rightarrow\ x+c\$ dans le cas critique (un point fixe double, 1).

Cas non critique

Dès que $\scriptstyle\ \alpha\neq 1-p,\$ on trouve, par diagonalisation d'une application linéaire associée à l'homographie $\scriptstyle\ \varphi,\$

$\frac{\varphi(s)-\tfrac{\alpha}{1-p}}{\varphi(s)-1}\ =\ \frac{p}{1-\alpha}\ \frac{s-\tfrac{\alpha}{1-p}}{s-1}\ =\ \frac{1}{m}\ \frac{s-\tfrac{\alpha}{1-p}}{s-1},$

ce qui entraine

$\frac{\varphi_n(s)-\tfrac{\alpha}{1-p}}{\varphi_n(s)-1}\ =\ \frac{1}{m^n}\ \frac{s-\tfrac{\alpha}{1-p}}{s-1},$

et conduit à un calcul explicite de $\scriptstyle\ \varphi_{n}.\$

Cas critique

Le cas $\scriptstyle\ \alpha= 1-p\$ est le cas critique $\scriptstyle\ m=1.\$ On trouve, toujours en raisonnant sur une application linéaire (non diagonalisable) associée à l'homographie $\scriptstyle\ \varphi,\$

$\frac{\varphi(s)+1}{\varphi(s)-1}\ =\ \frac{s+1}{s-1}\ +\ 2\ \tfrac{p-1}{p}\ =\ \frac{s+1}{s-1}\ +\ c,$

donc

$\frac{\varphi_n(s)+1}{\varphi_n(s)-1}\ =\ \frac{s+1}{s-1}\ +\ nc.$

Finalement $\scriptstyle\ \varphi_n\$ est une homographie :

$\varphi_n(s)\ =\ \frac{(nc+2)s-nc}{ncs+2-nc},$

ce qui correspond au choix de paramètres $\scriptstyle\ (\alpha_n,p_n)\$ suivant :

$\begin{align} p_n&=\frac{p}{p+n(1-p)} \\ &=\mathbb{P}(Z_n>0) \\ &=\mathbb{P}(T>n), \\ \alpha_n&=1-p_n. \end{align}$

Ici T désigne la date d'extinction, i.e. le numéro de la première génération vide.

Probabilité d'extinction

Théorème — La probabilité d'extinction $\scriptstyle\ \mathbb{P}(\mathcal{E})\$ d'un processus de Galton-Watson dont la distribution de la progéniture est $\scriptstyle\ p=\left(p_k\right)_{k\in\mathbb{N}},\$ est la plus petite solution, dans l'intervalle [0,1], de l'équation

$\varphi(s)\ =\ s.$

Démonstration

Cela résulte de ce que

$\mathcal{E}\ =\ \bigcup_{n\ge0}\{Z_n=0\}\quad\text{et}\quad\left\{\{Z_n=0\}\Rightarrow\{Z_{n+1}=0\}\right\},$

d'où il suit, par propriété de limite croissante, que

$\mathbb{P}(\mathcal{E})\ =\ \lim_{n}\mathbb{P}(Z_n=0).$

Par ailleurs la suite

$u_n\ =\ \mathbb{P}(Z_n=0)$

est définie par $\scriptstyle\ u_0=0\$ (car $\scriptstyle\ Z_0=1\$ ), et par la relation de récurrence

$u_{n+1}\ =\ \varphi(u_n),$

ce qui conduit à voir $\scriptstyle\ \mathbb{P}(\mathcal{E})\$ comme un point fixe de φ.

Pour démontrer la relation de récurrence sur $\scriptstyle\ u_n,\$ notons que

$\varphi_n(0)\ =\ \mathbb{P}(Z_n=0)\ =\ u_n.$

Donc

$u_{n+1}\ =\ \varphi_{n+1}(0)\ =\ \varphi(\varphi_n(0))\ =\ \varphi(u_n).$

Maintenant, supposons qu'il existe un point fixe $\scriptstyle\ \ell\$ de $\scriptstyle\ \varphi\$ dans l'intervalle [0,1]. Alors, la fonction $\scriptstyle\ \varphi\$ étant croissante sur l'intervalle [0,1], $\scriptstyle\ \{u_0\le \ell\ \text{et}\ u_0\le u_1\}$ entraine $\scriptstyle\ \{u_0\le u_1\le \ell\},\$ puis, par récurrence, $\scriptstyle\ \{\forall n,\ u_n\le u_{n+1}\le\ell\}.\$ Mais, d'une part, $\scriptstyle\ \varphi(0)=p_0\ge 0\$ (ce qui peut être réécrit $\scriptstyle\ u_1\ge u_0\$ ), d'autre part $\scriptstyle\ \varphi(1)=1.\$ Ainsi, la suite $\scriptstyle\ (u_n)_{n\ge0}\$ est croissante et majorée par 1, donc convergente. De plus, on a vu que la suite $\scriptstyle\ (u_n)_{n\ge0}\$ est majorée par tout point fixe $\scriptstyle\ \ell\$ de $\scriptstyle\ \varphi\$ appartenant à l'intervalle [0,1]. La limite de la suite $\scriptstyle\ (u_n)_{n\ge0}\$ est donc, elle aussi, majorée par tout point fixe $\scriptstyle\ \ell\$ de $\scriptstyle\ \varphi\$ appartenant à l'intervalle [0,1]. Mais comme la fonction $\scriptstyle\ \varphi\$ est continue sur l'intervalle [0,1], sa limite est un des points fixes de la fonction $\scriptstyle\ \varphi,\$ donc, forcément, le plus petit d'entre eux.

Comme $\scriptstyle\ \varphi\$ est une série entière de rayon de convergence au moins égal à 1, à coefficients positifs ou nuls, $\scriptstyle\ \varphi\$ est convexe (et même strictement convexe si p₀+p₁<1), et indéfiniment dérivable sur l'intervalle ]0,1[, et possède donc au plus 2 points fixes dans l'intervalle [0,1], sauf si $\scriptstyle\ \varphi(s)\equiv s.\$ Un théorème analogue concernant les cartes planaires aléatoires (une généralisation naturelle des arbres aléatoires) a été démontré en 2007^[3].

Probabilité d'extinction (respectivement 0.25, 1 et 1) pour $\scriptstyle\ p_0(=1-p_2)\$ successivement égal à 0.2 (cas surcritique), 0.5 (cas critique), 0.7 (cas souscritique).

Exemple :

si $\scriptstyle\ \varphi(s)\equiv s,\$ le théorème dit que la probabilité d'extinction $\scriptstyle\ \mathbb{P}(\mathcal{E})\$ est nulle. Cela peut être vu directement sans difficulté, car $\scriptstyle\ \varphi(s)\equiv s\$ équivaut à $\scriptstyle\ p_1=1,\$ ce qui entraine immédiatement que chaque génération est constituée d'exactement un individu ;
plus généralement, si $\scriptstyle\ p_0=0,\$ 0 est point fixe, donc, d'après le théorème, $\scriptstyle\ \mathbb{P}(\mathcal{E})\$ est nulle (on pouvait le voir directement, puisque, en ce cas, chaque individu de la population a au moins un enfant) ;
si $\scriptstyle\ p_0+p_2=1,\$ les deux points fixes sont 1 et $\scriptstyle\ p_0/p_2,\$ donc, comme on pouvait s'y attendre, la probabilité d'extinction vaut 1 si $\scriptstyle\ p_0\ge p_2,\$ et vaut moins que 1 (en fait $\scriptstyle\ \mathbb{P}(\mathcal{E})=p_0/p_2\$ ) si $\scriptstyle\ p_0< p_2.\$ Ici, la valeur de $\scriptstyle\ \mathbb{P}(\mathcal{E})\$ est difficile à calculer directement, sans utiliser le théorème. La figure ci-contre montre plusieurs valeurs de $\scriptstyle\ p_0,\$ et la probabilité d'extinction correspondante.

Plus généralement

Théorème — On distingue 3 cas :

Cas souscritique (m<1). La probabilité d'extinction $\scriptstyle\ \mathbb{P}(\mathcal{E})\$ vaut 1.
Cas critique (m =1). La probabilité d'extinction $\scriptstyle\ \mathbb{P}(\mathcal{E})\$ vaut 1, sauf si $\scriptstyle\ p_1=1,\$ et, dans ce dernier cas, la probabilité d'extinction est nulle.
Cas surcritique (m>1). La probabilité d'extinction $\scriptstyle\ \mathbb{P}(\mathcal{E})\$ est strictement inférieure à 1 (et est le plus petit point fixe de φ dans l'intervalle [0,1]).

Démonstration

Cela résulte de ce que

$m\ =\ \varphi^{\prime}(1).$

En effet :

Cas souscritique. Si m<1, la tangente en (1,1) au graphe de φ est, dans l'intervalle [0,1[, strictement au-dessus de la droite d'équation y=x, et, φ étant convexe, le graphe de φ est au-dessus de sa tangente, donc, lui aussi, strictement au-dessus de la droite d'équation y=x : le seul point fixe de φ est 1.
Cas critique. Si m =1, la tangente en (1,1) au graphe de φ est la droite d'équation y=x. Si φ est strictement convexe, le graphe de φ est strictement au-dessus de sa tangente, donc le seul point fixe de φ est 1. Or φ est strictement convexe si et seulement si $\scriptstyle\ p_0+p_1<1\$ (comme on le voit en calculant la dérivée seconde de φ). Sinon φ est une fonction affine, donc son graphe est confondu avec ses tangentes, en particulier, ici, avec la droite d'équation y=x. Donc $\scriptstyle\ p_1=1.\$
Cas surcritique. Si m>1, la tangente en (1,1) au graphe de φ est strictement au-dessous de la droite d'équation y=x, donc, sur un intervalle [1-ε,1[ bien choisi, φ lui-même est strictement au-dessous de la droite d'équation y=x. En 0, par contre, comme $\scriptstyle\ \varphi(0)=p_0\ge 0,\$ le graphe de φ est au-dessus de la droite d'équation y=x. Donc, en vertu du théorème des valeurs intermédiaires, φ possède un point fixe strictement plus petit que 1.

Le comportement du processus de Galton-Watson dans les cas souscritique et surcritique correspond à l'intuition. Par contre, le comportement du processus de Galton-Watson dans le cas critique aléatoire (l'extinction est certaine) est radicalement différent du comportement du processus de Galton-Watson dans le cas critique déterministe (chaque individu a exactement un enfant et l'extinction est impossible).

A voir aussi

Notes

↑ (en) H. Kesten et B. P. Stigum, « A Limit Theorem for Multidimensional Galton-Watson Processes », dans The Annals of Mathematical Statistics, vol. 37, n^o 5, octobre 1966, p. 1211-1223 [texte intégral]
↑ (en) Krishna B. Athreya, « A Simple Proof of a Result of Kesten and Stigum on Supercritical Multitype Galton-Watson Branching Process », dans The Annals of Mathematical Statistics, vol. 41, n^o 1, février 1970, p. 195-202 [texte intégral]
↑ (en) Jean-François Marckert et Grégory Miermont, « Invariance principles for random bipartite planar maps », dans Ann. Probab., vol. 35, n^o 5, 2007, p. 1642-1705 [texte intégral, lien DOI] , Proposition 1.

Bibliographie

(en) Krishna B. Athreya et Peter E. Ney, Branching processes, Dover Publications, 19 mars 2004, 2^e éd., 304 p. (ISBN 978-0486434742)
(en) Theodore E. Harris, The theory of branching processes, Dover Publications, mai 2002, 2^e éd., 256 p. (ISBN 978-0486495088)
L'article original de Galton et Watson: On the Probability of the Extinction of Families
Thèse en ligne sur la dynamique des populations expliquant au chapître 1 le modèle de Galton-Watson

Liens utiles

Portail des probabilités et des statistiques

Catégories :

Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Processus de Galton-Watson de Wikipédia en français (auteurs)

Игры ⚽ Нужна курсовая?

Regardez d'autres dictionnaires:

Arbre de Galton-Watson — Pour les articles homonymes, voir Arbre (homonymie). Simulation d un arbre de Galton Watson avec une loi de Poisson de paramètre 1 pour loi de rep … Wikipédia en Français
Francis Galton — vers 1850. Biographie Naissance 16 fé … Wikipédia en Français
STOCHASTIQUES (PROCESSUS) — Le calcul des probabilités classique [cf. PROBABILITÉS (CALCUL DES)] s’applique à des épreuves où chaque résultat possible (ou éventualité) est un nombre . Or il existe beaucoup de situations réelles relevant de modèles aléatoires, mais d’une… … Encyclopédie Universelle
Arbre (graphe) — Pour les articles homonymes, voir Arbre (homonymie). Un arbre avec 4 feuilles et 3 nœuds internes. En théorie des graphes, un arbre est un graphe non orienté … Wikipédia en Français
Arbre (probabilité) — Pour les articles homonymes, voir Arbre (homonymie). En théorie des probabilités un arbre aléatoire est un arbre défini en utilisant une loi de probabilité sur un ensemble d arbres (au sens de graphe). Par exemple, un arbre aléatoire à n nœuds… … Wikipédia en Français
Projet:Mathématiques/Liste des articles de mathématiques — Cette page n est plus mise à jour depuis l arrêt de DumZiBoT. Pour demander sa remise en service, faire une requête sur WP:RBOT Cette page recense les articles relatifs aux mathématiques, qui sont liés aux portails de mathématiques, géométrie ou… … Wikipédia en Français
Notation de Neveu — pour les sommets d un arbre planaire. Un arbre planaire enraciné peut être décrit de manière non ambigüe par la liste de ses sommets, chacun désigné par une suite finie d entiers, qui sont les positions, au sein de leur fratrie, des ancêtres du… … Wikipédia en Français
Arbre (mathématiques) — Pour les articles homonymes, voir Arbre (homonymie). Pour tout ce qui concerne les arbres en théorie des graphes voir ici. Un arbre est la donnée d un ensemble E et d une relation symétrique R sur E telle que deux points distincts quelconques x… … Wikipédia en Français
Arbre (homonymie) — Cette page d’homonymie répertorie les différents sujets et articles partageant un même nom. Sur les autres projets Wikimedia : « arbre », sur le Wiktionnaire (dictionnaire universel) Au sens premier, le mot arbre, désigne en… … Wikipédia en Français
Indépendance (probabilités) — L indépendance est une notion probabiliste qualifiant de manière intuitive des événements aléatoires n ayant aucune influence l un sur l autre. Il s agit d une notion très importante en statistique et calcul de probabilités. Par exemple, la… … Wikipédia en Français

Dictionnaires et Encyclopédies sur 'Academic'

Processus de Galton-Watson

Sommaire

Historique

Formulation générale

Paramètre critique et classification des processus de Galton-Watson

Notation de Neveu