Test du χ²

Un article de Freepedia.

Image:Probstats.png Cet article est une ébauche à compléter concernant les probabilités et la statistique, vous pouvez partager vos connaissances en le modifiant.

Le test d'hypothèse du χ² (prononcer khi-deux) est un des tests les plus employés en statistiques, notamment parce qu'il permet de valider des hypothèses concernant une propriété concrète d'un ensemble de données statistiques.

Par exemple son usage est très répandu en génétique où il permet de déterminer, à un seuil donné, la validité d'une hypothèse.

Sommaire

Définition du procédé


Utilisations possibles

Test du χ² d'adéquation

Il s'agira de valider/infirmer le fait qu'une série de données statistiques suit bien une loi de probabilité précise (comme une loi uniforme ou une loi de Poisson par exemple).

Dans la pratique, ce test du χ² est proche d'un calcul des écarts entre les valeurs observées et les valeurs attendues dans le cas où ces valeurs suivraient la loi qu'on cherche à leur attribuer. Si cet écart est trop grand, on rejette l'hypothèse selon laquelle les données sont distribuées selon cette loi.

On notera que, plus techniquement, la somme des écarts relatifs, numérateurs carrés, entre les valeurs observées d'un jeu de données et les valeurs attendues d'après la loi concernée suit une statistique du χ².

Exemple concret : Soit un nombre donné de cultures cellulaires rigoureusement identiques. Chacune comporte un certain nombre de colonies. Toutes les cultures sont en fait des cultures de cellules cancéreuses et on cherche à déterminer dans quelle mesure l'action d'un produit empêche leur division. Précisément on veut savoir si le nombre de colonies dont la croissance sera interrompue par le produit suit une loi de Poisson de paramètre Lambda.

Après avoir exposé les cellules au produit, on obtient des résultats précis: X1 colonies de la première culture ont subi l'influence du produit, X2 pour la deuxième culture... Xn pour la n-ième culture. On effectuera un test du χ² sur ces valeurs pour valider ou infirmer l'hypothèse selon laquelle leur distribution suit bien une loi de Poisson

Test du χ² d'homogénéité

Il s'agira de valider/infirmer le fait que deux jeux de variables aléatoires suivent une même loi.

Test du χ² d'indépendance

Il s'agit de valider/infirmer l'hypothèse selon laquelle deux jeux de variables aléatoires sont indépendantes.

Exemple concret : On cherche à déterminer s'il existe une influence entre deux caractères au sein d'une population donnée, par exemple entre le fait d'être un individu de sexe masculin et d'avoir manifesté un infarctus du myocarde avant 65 ans. Le test du χ² d'indépendance permettra de répondre avec une certitude de 95% (par exemple) à cette question.

Remarque

Les phénomènes quantifiables au sein d'une population sont soumis à des fluctuations statistiques. Considérons par exemple le taux de chômage dans un état donné, ou bien le taux de croissance.

D'une année sur l'autre, des variations dans ces taux sont systématiquement enregistrées (baisse ou hausse) pour autant elles ne signifient pas en elle-même, contrairement à une croyance trop répandue, que la variable considérée (taux de croissance ou de chômage) a bel et bien changé (rigoureusement qu'elle a changé de loi, c’est-à-dire que des procédés mis en place sont venus influencer sa distribution). Lorsque l'on considère une variable, il faut distinguer l'impact causal de la fluctuation statistique aléatoire. Ainsi, une baisse du taux de chômage de 2% d'une année à l'autre peut très bien n'être imputable qu'au caractère aléatoire de la variable « taux de chômage » et ne rien signifier sur le plan causal. Cette baisse ne signifie pas d'elle-même que des mesures efficaces ont influencé la loi de distribution du chômage. Seuls les tests statistiques sont connus actuellement pour faire foi et déterminer (à un seuil donné) si cette variation est le fruit du hasard ou non. À cet égard les tests du χ² sont exceptionnellement utiles.



Views
Outils personels
Boîte à outils
Autres langues
Autres Liens