Vous pouvez marquer votre extraits intéressants de texte qui seront disponibles par le biais d'un lien unique dans votre navigateur.

Maximum De Vraisemblance

Maximum De Vraisemblance

Maximum de vraisemblance

L'estimation du maximum de vraisemblance est une méthode statistique courante utilisée pour inférer les paramètres de la distribution de probabilité d'un échantillon donné.

Cette méthode a été développée par le statisticien et généticien Ronald Fisher entre 1912 et 1922.

L'estimateur du maximum de vraisemblance peut exister et être unique, ne pas être unique, ou ne pas exister.

Sommaire

Définitions

Soit X une variable aléatoire, de loi quelconque, dont on veut estimer un paramètre θ. On note \mathcal{D}_\theta cette famille de lois paramétriques. Alors on définit une fonction f telle que : 
f(x;\theta) = \begin{cases} f_\theta(x) & \text{si X est une v.a. continue} \\ P_\theta(X=x) & \text{si X est une v.a. discrete} \end{cases}

fθ(x) représente la densité de X (où θ apparaît) et Pθ(X = x) représente une probabilité discrète (où θ apparaît).

On appelle vraisemblance de θ au vu des observations (x1,...,xi,...,xn) d'un n-échantillon indépendamment et identiquement distribué selon la loi \mathcal{D}_\theta, le nombre :

L(x_1,...,x_i,...,x_n;\theta) = f(x_1;\theta) \times f(x_2;\theta) \times ...\times f(x_n;\theta) = \prod_{i=1}^n f(x_i;\theta)

On cherche à trouver le maximum de cette vraisemblance pour que les probabilités des réalisations observées soient aussi maximum. Ceci est un problème d'optimisation. On utilise généralement le fait que si L est dérivable (ce qui n'est pas toujours le cas) et si L admet un maximum global en une valeur \theta = \hat \theta, alors la dérivée première s'annule en \theta = \hat \theta et que la dérivée seconde est négative. Réciproquement, si la dérivée première s'annule en \theta = \hat \theta et que la dérivée seconde est négative en \theta = \hat \theta, alors \theta = \hat \theta est un maximum local (et non global) de L(x1,...,xi,...,xn;θ). Il est alors nécessaire de vérifier qu'il s'agit bien d'un maximum global. La vraisemblance étant positive et le logarithme népérien une fonction croissante, il est équivalent et souvent plus simple de maximiser le logarithme népérien de la vraissemblance (le produit se transforme en somme, ce qui est plus simple à dériver). On peut facilement construire la statistique Yn = Θ qui est l'estimateur voulu.

Ainsi en pratique :

  • La condition nécessaire
\frac{\partial L(x_1,...,x_i,...,x_n;\theta)}{\partial \theta} = 0

ou

  \frac{\partial \ln L(x_1,...,x_i,...,x_n;\theta)}{\partial \theta} = 0

permet de trouver la valeur \theta = \hat \theta.

  • \theta = \hat \theta est un maximum local si la condition suffisante est remplie au point critique \theta = \hat \theta :
\frac{\partial^2 L(x_1,...,x_i,...,x_n;\theta)}{\partial \theta^2} \le 0

ou

  \frac{\partial^2 \ln L(x_1,...,x_i,...,x_n;\theta)}{\partial \theta^2} \le 0

Pour simplifier, dans les cas de lois continues, où parfois la densité de probabilité est nulle sur un certain intervalle, on peut omettre d'écrire la vraisemblance pour cet intervalle uniquement.

Propriétés

L'estimateur obtenu par la méthode du maximum de vraisemblance est :

Exemples

Avec une loi discrète

On souhaite estimer le paramètre λ d'une loi de Poisson à partir d'un n-échantillon.

f(x,\lambda) = P_\lambda(X=x) = e^{-\lambda} \frac{\lambda^x}{x!}

L'estimateur du maximum de vraisemblance est : \hat {\lambda}_{ML}= \bar x

Avec une loi continue

Loi exponentielle

On souhaite estimer le paramètre α d'une loi exponentielle à partir d'un n-échantillon.

f(x,\alpha) = f_\alpha(x) = \begin{cases} \alpha e^{-\alpha x} & \text{si} \quad x \ge 0 \\ 0 & \text{sinon} \end{cases}

L'estimateur du maximum de vraisemblance est : \hat {\alpha}_{ML}= \frac{1}{\bar x}

Loi normale

L'estimateur du maximum de vraisemblance de l'espérance μ et la variance σ2 d'une loi normale est:

   \hat{\mu}_{ML} = \bar{x} = \frac{1}{n}\sum^{n}_{i=1}x_i

   \widehat{\sigma}^2_{ML} = \frac{1}{n}\sum_{i=1}^n(x_i-\bar{x})^2

L'estimateur de la variance est un bon exemple pour montrer que le maximum de vraisemblance peut fournir des estimateurs biaisés: un estimateur sans biais est donné en effet par:    \widehat\sigma^2 = \frac{1}{n-1}\sum_{i=1}^n(x_i-\widehat{x})^2. Néanmoins, asymptotiquement, quand n tend vers l'infini, ce biais, qui est de  \frac{n}{n-1}, tend vers 1 et l'estimateur est alors asymptotiquement sans biais.

Si la dérivée ne s'annule jamais

On souhaite estimer le paramètre a d'une loi uniforme à partir d'un n-échantillon.

f(x,a) = f_a(x) = \begin{cases} \frac {1}{a} & \text{si} \quad x \in [0;a] \\ 0 & \text{sinon} \end{cases}

La vraisemblance s'écrit :

L(x_1,...,x_i,...,x_n;a) = \prod_{i=1}^n \frac {1}{a} =  \frac {1}{a^n}

Intuitivement, il est clair que cette expression de la vraisemblance ne s'annule jamais (on peut la dériver pour s'en convaincre). Graphiquement dans le repère (a, L), sa représentation est une courbe décroissante de type "inverse" (convexe tournée vers l'origine).

La valeur de L sera maximum quand a sera très près de 0, donc quand a sera le plus petit possible (l'intervalle de la densité est alors réduit). Mais, pour que la densité soit vrai, le paramètre a doit être nécessairement plus grand que tous les xi de l'échantillon.

On prend donc comme valeur qui maximise L, tout en vérifiant la définition de la loi de probabilité :

\hat a = max(x_1,...,x_n)

Wn = A = max(X1,...,Xn)

Cet exemple permet de montrer, qu'un estimateur n'est pas toujours défini par une expression numérique explicite. Ainsi on sera amené parfois à considérer le maximum ou le minimum des échantillons.

Voir aussi

  • Portail des probabilités et des statistiques Portail des probabilités et des statistiques
Ce document provient de « Maximum de vraisemblance ».

Wikimedia Foundation. 2010.

  
Share  

Regardez d'autres dictionnaires:

  • Information De Fisher — L information de Fisher est une notion de statistique introduite par R.A. Fisher qui quantifie l information relative à un paramètre contenue dans une distribution. Soit f(x;θ) la distribution de vraisemblance d une grandeur x (qui peut être… …   Wikipédia en Français

  • Information de Fisher — L information de Fisher est une notion de statistique introduite par R.A. Fisher qui quantifie l information relative à un paramètre contenue dans une distribution. Soit f(x;θ) la distribution de vraisemblance d une grandeur x (qui peut être… …   Wikipédia en Français

  • Information de fisher — L information de Fisher est une notion de statistique introduite par R.A. Fisher qui quantifie l information relative à un paramètre contenue dans une distribution. Soit f(x;θ) la distribution de vraisemblance d une grandeur x (qui peut être… …   Wikipédia en Français

  • Groupe d'intervention de la Gendarmerie nationale — Cet article possède un paronyme, voir : guigne. Groupe d’intervention de la Gendarmerie nationale (GIGN) …   Wikipédia en Français

  • Distribution De Pareto — Pareto Densité de probabilité / Fonction de masse Fonctions de masse pour plusieurs k  avec xm = 1. L axe horizontal symbolise le paramètre x . Lorsque k→∞ la distribution s approche de δ(x − x …   Wikipédia en Français

  • Distribution de Pareto — Pareto Densité de probabilité / Fonction de masse Fonctions de masse pour plusieurs k  avec xm = 1. L axe horizontal symbolise le paramètre x . Lorsque k→∞ la distribution s approche de δ(x − xm) où δ est la fonction …   Wikipédia en Français

  • Distribution de pareto — Pareto Densité de probabilité / Fonction de masse Fonctions de masse pour plusieurs k  avec xm = 1. L axe horizontal symbolise le paramètre x . Lorsque k→∞ la distribution s approche de δ(x − x …   Wikipédia en Français

  • Fontaine Intermittente De Fontestorbes — Fontestorbes Caractéristiques Longueur 0 05 km Bassin 85 …   Wikipédia en Français

  • Fontaine intermittente de Fontestorbes — Fontestorbes La fontaine intermittente de Fontestorbes. Caractéristiques Longueur 0 05 km Bassin 85 km2 …   Wikipédia en Français

  • Fontaine intermittente de fontestorbes — Fontestorbes Caractéristiques Longueur 0 05 km Bassin 85 …   Wikipédia en Français

  • Exploration De Données — L’exploration de données, aussi connue sous les noms fouille de données, data mining (forage de données) ou encore Extraction de Connaissances à partir de Données (ECD en français, KDD en Anglais), a pour objet l’extraction d un savoir ou d une… …   Wikipédia en Français