Formules
Moyenne μ = Σ xᵢ / n
Variance population σ² = Σ(xᵢ − μ)² / n
Écart-type population σ = √σ²
Variance échantillon s² = Σ(xᵢ − μ)² / (n − 1)
Écart-type échantillon s = √s²Pourquoi deux écart-types ?
Population (÷ n) : à utiliser quand vos données représentent l'ensemble étudié (ex : notes de tous les élèves d'une classe).
Échantillon (÷ n−1) : correction de Bessel, à utiliser quand vos données sont un échantillon prélevé dans une population plus large (ex : sondage de 1 000 Français parmi 67 millions). Plus précis pour estimer la variance de la population mère.
Exemple chiffré pas à pas
Notes : 12, 14, 15, 18, 22, 25, 28, 30 (n=8)
- Moyenne = (12+14+15+18+22+25+28+30) / 8 = 164/8 = 20,5
- Écarts à la moyenne : −8,5 ; −6,5 ; −5,5 ; −2,5 ; 1,5 ; 4,5 ; 7,5 ; 9,5
- Carrés des écarts : 72,25 ; 42,25 ; 30,25 ; 6,25 ; 2,25 ; 20,25 ; 56,25 ; 90,25
- Somme = 320
- Variance pop = 320/8 = 40. σ = √40 ≈ 6,32
- Variance éch = 320/7 ≈ 45,71. s ≈ 6,76
Quand utiliser quoi ?
- Moyenne : centre de gravité des données. Sensible aux outliers.
- Médiane : valeur centrale après tri. Plus robuste aux outliers (revenus, prix immobiliers).
- Écart-type : dispersion absolue, même unité que les données.
- Coefficient de variation (σ/μ) : dispersion relative, comparaison entre séries.
- Étendue (max − min) : amplitude totale, simple mais limitée.
Règle 68 / 95 / 99,7
Pour une distribution normale (cloche de Gauss) :
- 68 % des valeurs sont dans [μ − σ, μ + σ]
- 95 % dans [μ − 2σ, μ + 2σ]
- 99,7 % dans [μ − 3σ, μ + 3σ]
Utile pour détecter les valeurs aberrantes : tout point à plus de 3σ de la moyenne est suspect (probabilité 0,3 %).