Create
Learn
Share

Stat I

rename
mndyass's version from 2017-05-22 15:27

Chapitre 1: Introduction & concepts principaux.

 

Question Answer
EchantillonSous ensemble de la population étudier
Echantillon aléatoireEchantillon sélectionné au hasard dans la population.
Pour que chaque membre sélectionner population = même chance d'être sélectionné.
Echantillon non-biaiséEchantillon dont on ne met pas en doute le caractère aléatoire
But de la randomisation?Créer des groupes semblable auquel des "traitements" différents seront appliqué.
VariableMesure qui peut prendre des valeurs différentes d'une unité expérimentale a l'autre
Ou d'un groupe d'unités expérimentales a un autre.
Variable Quantitativemodalités numériques
Variable Qualitative/CatégorielleDécrit une caractéristique
QuantitativeVariable discrete
Variables continues
Variables discrètesNombre fini de valeurs possibles entre 2 valeurs
Variables continuesNombre infini de valeurs possibles entre 2 valeurs
Qualitative/CategorielleVariable nominales
Variables ordinales
Variable nominalesCategories distinctes nom mais par ordre
Variables ordinalesCategorie distincte nom & ordre
Mais on ne sait pas quantifier la distance séparant les différentes catégories
memorize

Chapitre 2: Statistique descriptive univariée.

 

Question Answer
Fréquencenombre de fois que la valeur a été observée (nk)
Fréquence relative(voir formule) fk = nk/N (x100)
Moyenne arithmétique•Uniquement applicable aux variables quantitatives
Sensible aux valeurs extrêmes => "Peu robuste" Pour valeurs extrêmes
•Voir formule
Médiane -Quoi?Plus petite valeurs ≥ 50% des données
Nombre impaire observation -> Le milieu
Moyenne des 2 valeurs du milieu
Médiane -Caractéristiques•Insensible aux valeur extrêmes car elle reste toujours au milieu
•S'applique aux données quantitatives tout comme aux données qualitatives ordinales
Mode -Quoi?Valeur la plus souvent observée dans les données
Mode CaractéristiquesPas de formule mathématique
Toujours observé dans les données
Distribution unimodaleSi on a 1 mode
Distribution bimodaleSi on a 2 modes
Distribution multimodaleSi on a plusieurs modes
Mesures de dispersionIndiquent si les valeurs observées sont fort rassemblées autour de la tendance centrale
Formule étendueEtendue = Valeur max - Valeur min
Etendue -Caractéristiques•Uniquement pour les variables quantitatives
•Formtement influencée par les valeurs extrêmes
Quartile Q1Plus petite valeur ≥25% des données
Quartile Q3Plus petite valeur ≥75% des données
Ecart inter-QuartileQ3-Q1
Pas sensible aux valeurs extremes
PercentilePlus petite valeur ≥k% des données
Variance•Echantillon ->Voir formule
•Population ->Voir formule
Variance -Caractéristiques•Toujours positive
s² = 0 <=> Toutes les observations sont les mêmes
Varience augmente, variabilité des données augmente
Sensible aux valeurs extrêmes
Unité au carré
Ecart Type•Sensible aux valeurs extrêmes
•Unité = celle de nos observations
•Ecart-type petit = Valeurs proches
Ecart-type grand = Valeurs éloignées
•Voir formule
memorize

Chapitre 3: Vue d'ensemble

 

Question Answer
Echantillon aléatoire simpleEAS
•Doit être sélectionné de façon a être représentatif de la population étudiée
Chaque échantillon possible de taille n a la même chance d'être choisis
Etre représentatif de la population étudier ?Participants inclus dans une études sur une base volontaire
Echantillon pas représentatif de la population étudier
Condition obligatoire pour EAS (2)•Chaque membre d'une population a une chance égale d'être inclus dans l'échantillon
•Chaque combinaison de membre de la population à une chance égale de composer l'echantillon
Bne représentation de la population demande…?Echantillon avec remise
Si taille de échantillon augmente->Variabilité?Variabilité diminue
Densité de probabilité•Fonction permettant de représenter une loi de probabilité
=>Limite d'un histogramme
5si échantillon suffisamment important de valeurs d'une variable aléatoire à densité)
A combien est = Air sous la courbe ?1
Si on augmente la taille de l'échantillon que se passe-t-il sur la courbe ?De plus en plus symétrique
Loi normalVoir formule
P( µ-σ ≤ x ≤ µ+σ ) =68%
P( µ-2σ ≤ x ≤ µ+2σ ) =95%
P( µ-3σ ≤ x ≤ µ+3σ ) =99%
Que décrivent µ et σUne population
Théorème centrale limite TCL
Donnée influencée par une multitude de phénomènes aléatoires indépendants qui s'additionnent
=>Approximativement décrite par une loi normale
Même si les phénomènes qui la composent ne suivent pas des lois normales
Moyenne variable continue tend vers…Variable aléatoire gaussienne (ESM voir formule)
Moyenne variable binaire tend vers…Variable aléatoire gaussienne (ESM voir formule)
ESM =Erreur standard de la moyenne
Loi normale centrée & réduiteX suit une loi normal N(µ , σ²)
Loi normale Centrée -FormuleX' = X - µ
X' ~N (µ=0 , σ²)
Loi normale Réduite -FormuleZ = X-µ/σ
La Z-valeur
Z ~ N (µ=0 , σ²=1)
Z-Valeur formule -Variable XZ = X-µ/σ
Z-Valeur formule -Moyenne x̄Z = x̄-µ / (σ/√n)
Z-Valeur formule -Proportion pZ = p-π/ ( √π(1-π)/√n)
memorize

Notation conventionnelle

 

Question Answer
VariableX
Valeurs numériques de Xx
Probabilité de EP(E)
Proportion dans un échantillonp
Proportion dans une populationπ
memorize

Chapitre 4: Intervalles de prediction & de confiance

Intervalle de prédiction (=Distribution)

 

Question Answer
Autour de quoi ce construit cette intervalle ? Autour de vraie valeur (par exemple μ)
MoyenneIP95%(x̄) = [μ - 1,96σ/√n ; μ + 1,96σ/√n ]
ProportionIP95%(x̄) = [π - 1,96 √(π(1-π)/n) ; μ + 1,96 √(π(1-π)/n) ]
IP95% (X) =[μ - 1,96σ ; μ + 1,96σ ]
Intervalle de prediction valide si ?•Population suit une loi normale
•n>30 (moyenne)
•np>5 & n(1-p)>( pour une proportion
•EAS
Bonne interprétation =•Chaque nouvelle observation (moyenne, proportion, observation individuelle) a 95%de chance de se trouver dan cet intervalle
•Moyenne, on s'attend a ce que 95% de l'entièreté de la population se trouvent dans l'intervalle de prédiction
memorize

Intervalle de confiance

 

Question Answer
Autour de quoi ce construit cette intervalle ? Des données obtenues sur l'échantillon inférer les caractéristiques de la population d'origine
IC95% (μ) =[x̄ - 1,96σ/√n ; [x̄ + 1,96σ/√n ]
Formule IC95% si σ inconnuIC95% (π) = [ p - 1,96 √(pq/n) ; p + 1,96 √(pq/n) ]
Avec n>30
Distribution x̄ avec s² inconnuRemplacer la loi de Z par la loi t
La loi t est caractérisée par une degré de liberté (ddl) avec ddl = n-1
Utiliser Z si•σ connu & population normalement distribuée
•σ connu & n>30
Utiliser T si•σ inconnu (utiliser s) & proportion normalement distribué
•σ inconnu (utiliser s) & n>30
Interprétation intervalle de confiance•On ne peut parler en terme de probabilité/chance
•On a 95% de confiance que l'intervalle contienne la vraie valeur de la population
Si n augmente, alors IC?Devient plus précis
(et inversement)
Condition de validité•Distribution normale -> EAS
•Distribution pas normal -> EAS & n>30
IC pour une proportionvoir formule
Condition de validité•EAS
•n x borne inférieur de l'IC>5
•n x (1-borne inférieur de l'IC)>5
•n x borne supérieur de l'IC>5
•n x (1-borne supérieure de l'IC)>5
memorize