Bandit manchot (mathematiques)

Bandit manchot (mathématiques)

Page d'aide sur l'homonymie Pour l’article homonyme, voir Bandit manchot

Le problème dit du bandit manchot peut se schématiser de la façon suivante :

  • On est en face de deux machines à sous
  • L'une, A, est en ordre de marche. Elle rapporte donc 1 euro par jeton avec une probabilité p0 connue.
  • L'autre, B, est détraquée, et rapporte donc 1 euro par jeton avec une probabilité p1 inconnue.
  • On dispose de N jetons. Que faire pour maximiser raisonnablement son gain ?

Dégrossir le problème

Quelques considérations permettent d'éviter l'explosion combinatoire :

  • Seule une mise sur B peut nous apporter de l'information et seul un apport d'information peut nous amener à changer d'avis. Donc dès qu'on cesse de miser sur B, on est certain de ne jamais avoir de raison de revenir sur elle.
  • Le problème se résume en conséquence à savoir combien de jetons on misera sur B, en fonction des résultats, avant de commuter (définitivement) sur A ou non. C'est le problème classique du plan d'expérience.

Application pratique

L'application la plus typique du problème du bandit manchot est celui du choix entre une ancienne et une nouvelle posologie d'un vaccin ou médicament (ou entre deux différents) : il faut déterminer le plus vite possible si le nouveau produit doit être adopté ou l'ancien maintenu. Toute erreur se traduirait en vies humaines perdues (ou, au minimum, en personnes souffrant de troubles consécutifs soit à un traitement incomplet, soit à des effets secondaires excessifs).

Voir aussi

Ce document provient de « Bandit manchot (math%C3%A9matiques) ».

Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Bandit manchot (mathematiques) de Wikipédia en français (auteurs)

Regardez d'autres dictionnaires:

  • Bandit Manchot (Mathématiques) —  Pour l’article homonyme, voir Bandit manchot.  Le problème dit du bandit manchot peut se schématiser de la façon suivante : On est en face de deux machines à sous L une, A, est en ordre de marche. Elle rapporte donc 1 euro par… …   Wikipédia en Français

  • Bandit manchot (mathématiques) —  Pour l’article homonyme, voir Bandit manchot.  Le problème dit du bandit manchot peut se schématiser de la façon suivante : On est en face de deux machines à sous L une, A, est en ordre de marche. Elle rapporte donc 1 euro par… …   Wikipédia en Français

  • Projet:Mathématiques/Liste des articles de mathématiques — Cette page n est plus mise à jour depuis l arrêt de DumZiBoT. Pour demander sa remise en service, faire une requête sur WP:RBOT Cette page recense les articles relatifs aux mathématiques, qui sont liés aux portails de mathématiques, géométrie ou… …   Wikipédia en Français

  • Arbre de probabilité — Pour les articles homonymes, voir Arbre (homonymie). En probabilité élémentaire, un arbre de probabilité est un schéma permettant de résumer une expérience aléatoire connaissant des probabilités conditionnelles. Ces arbres sont abondamment… …   Wikipédia en Français

  • Arbre De Probabilité — Cet article fait partie de la série Mathématiques élémentaires Algèbre Logique Arithmétique Probabilités …   Wikipédia en Français

  • Arbre de probabilite — Arbre de probabilité Cet article fait partie de la série Mathématiques élémentaires Algèbre Logique Arithmétique Probabilités …   Wikipédia en Français

  • Plan d'expérience — On nomme plan d expérience la suite ordonnée d essais d une expérimentation, chacune permettant d acquérir de nouvelles connaissances en contrôlant un ou plusieurs paramètres d entrée pour obtenir des résultats validant un modèle avec une bonne… …   Wikipédia en Français

  • Probabilité bayésienne — Théorème de Bayes Le théorème de Bayes est un résultat de base en théorie des probabilités, issu des travaux du révérend Thomas Bayes et retrouvé ensuite indépendamment par Laplace. Dans son unique article, Bayes cherchait à déterminer ce que… …   Wikipédia en Français

  • Théorème de Bayes — Le théorème de Bayes est un résultat de base en théorie des probabilités, issu des travaux du révérend Thomas Bayes et retrouvé ensuite indépendamment par Laplace. Dans son unique article, Bayes cherchait à déterminer ce que l’on appellerait… …   Wikipédia en Français

  • Théorème de bayes — Le théorème de Bayes est un résultat de base en théorie des probabilités, issu des travaux du révérend Thomas Bayes et retrouvé ensuite indépendamment par Laplace. Dans son unique article, Bayes cherchait à déterminer ce que l’on appellerait… …   Wikipédia en Français

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”