L’analyse de la variance consiste à trouver une différence de valeur moyenne entre différents groupes de mesures, en s’appuyant sur la mesure de variance. Si tous les groupes proviennent de la même population :
- leur moyenne doit être raisonnablement identique (compte tenu de la dispersion de la population),
- leur dispersion aussi,
- et si l’on mélange toutes les mesures dans un seul groupe, sa dispersion doit être identique à la dispersion de chaque groupe.
L’idée est donc de comparer la dispersion globale obtenue en mettant ensemble toutes les mesures à la dispersion interne à chaque groupe. S’il n’y a pas une différence statistiquement significative, les groupes proviennent de la même population.
En pratique le critère est la mesure de variance et le statistique est le rapport variance inter-groupe versus variance intra-groupe. En effet, la variance totale est la somme de variance inter-groupe versus variance intra-groupe. Cette décomposition permet d’évaluer l’importance de la variance inter-groupe (ie une différence de la moyenne des groupes) versus variance intra-groupe. La variance intra-groupe est censée être raisonnable identique à la variance totale s’il n’y a pas d’écart de moyenne.[caption id=“” align=“alignnone” width=“320”] Pas de différence : la variance totale est semblable aux variances des groupes.[/caption] | [caption id=“” align=“alignnone” width=“320”] Différence : la variance totale est plus importante que la variance des groupes car elle inclut la différence des moyennes.[/caption] |
Pour réaliser une analyse de variance avec R, voici quelques liens :
- Rbloggers https://www.r-bloggers.com/one-way-analysis-of-variance-anova/
- Quick-R https://www.statmethods.net/stats/anova.html
- STHDA http://www.sthda.com/english/wiki/one-way-anova-test-in-r
- Rpubs https://rstudio-pubs-static.s3.amazonaws.com/133584_8726e36a0d4348d8918952505956e388.html
Pour un cours plus détaillé, voir les vidéos du LMA2 http://math.agrocampus-ouest.fr/infoglueDeliverLive/enseignement/support2cours/videos