• <o:p> </o:p>

    Introduction aux cours de biostatistique<o:p></o:p>

    <o:p> </o:p>

    <o:p> </o:p>

    I)            Définitions<o:p></o:p>

    Biométrie : mesure des phénomènes biologiques pour l’étude quantitative et/ou qualitative des êtres vivants<o:p></o:p>

    Mesurer : comparaison d’une grandeur inconnue à une référence<o:p></o:p>

    Grandeur physique : chose pouvant être repérable et mesurable<o:p></o:p>

    Unité : grandeur choisie comme référence<o:p></o:p>

    Mesure d’une grandeur : mesure = grandeur * unité<o:p></o:p>

    <o:p> </o:p>

    II)         Unités de base<o:p></o:p>

    1)  Unités de base<o:p></o:p>

     

    2)  Préfixes SI<o:p></o:p>

     

    III)      Erreurs de mesure

    Capture d’écran 2014-08-13 à 20.06.20

     

     

     

     

     

     

     

     

     

               4)  Erreurs de mesure<o:p></o:p>

    - systématique / biais : elles sont reproductibles et donc peut-être corrigé<o:p></o:p>

    - aléatoire : elles sont non reproductibles <o:p></o:p>

    - accidentelles : elles ne sont pas prise en compte<o:p></o:p>

    - fidélité : comparaison entre une série de mesure et une moyenne <o:p></o:p>

    - justesse : comparaison entre une valeur trouvé et une valeur de référence<o:p></o:p>

    - zéro / offset : courbe affine au lieu d’être linéaire<o:p></o:p>

    - échelle / gain : s’écarte de la référence quand x grandit  (= 20 log (x/X))<o:p></o:p>

    - linéaire : n’est pas une droite<o:p></o:p>

    - phénomène d’hystérésis : la mesure 2 dépend de la mesure 1<o:p></o:p>

    - mobilité : c’est en escalier (ex : numérisation)<o:p></o:p>

    <o:p> </o:p>

    I)             Présentation des résultats<o:p></o:p>

    1)  Notation scientifique<o:p></o:p>

    - le nombre doit être compris entre 1 et 9<o:p></o:p>

    - la puissance 10 doit être entière<o:p></o:p>

    - les chiffres significatifs (il doit en avoir autant que la valeur en ayant le moins)<o:p></o:p>

    <o:p> </o:p>

    2)  Les arrondis<o:p></o:p>

    Arrondi à l’inférieur : 0 < x < 5<o:p></o:p>

    Arrondi au supérieur : 5 ≤ x < 9<o:p></o:p>

    <o:p> </o:p>

    3)  Arrondi avec log<o:p></o:p>

    X chiffres pour le nombre de départ = x chiffres après la virgule<o:p></o:p>

    <o:p> </o:p>

    4)  Arrondi avec exp<o:p></o:p>

    x chiffres après la virgule = X chiffres pour le résultat<o:p></o:p>

    <o:p> </o:p>

    II)         Éléments de biométrie

     

    Capture d’écran 2014-08-13 à 20.06.35
     

    Variables<o:p></o:p>

    Quantitative<o:p></o:p>

    Qualitative<o:p></o:p>

    Continue :<o:p></o:p>

    - caractère mesuré<o:p></o:p>

    - hauteur / poids<o:p></o:p>

    Discrète : <o:p></o:p>

    - caractère dénombré<o:p></o:p>

    - nombre d’enfant<o:p></o:p>

    Binaire :<o:p></o:p>

    - dichotomie (oui/non)<o:p></o:p>

    - pas mesurable<o:p></o:p>

    Multiple : <o:p></o:p>

    - classement<o:p></o:p>

    - ordonné (statut d’une maladie)<o:p></o:p>

    - non ordonné (statut marital)<o:p></o:p>

    Échelle<o:p></o:p>

    <o:p> </o:p>

    Par intervalle :<o:p></o:p>

    - valeur nulle arbitraire<o:p></o:p>

    - distance entre deux données connues (T°C)<o:p></o:p>

    Relative :<o:p></o:p>

    - zéro = absence ou nullité <o:p></o:p>

    - égalité dans les rapports (T°K)<o:p></o:p>

    Ordinale :<o:p></o:p>

    - classés selon un critère connus<o:p></o:p>

    - distance entre deux catégories est connu et peut varier<o:p></o:p>

    - défini rang / une progression<o:p></o:p>

    Nominale / Catégorielle :<o:p></o:p>

    - collectivement exhaustive / mutuellement exclusive<o:p></o:p>

    - ordre et distance entre catégories sont ignorés <o:p></o:p>

    - facilite le traitement informatique <o:p></o:p>

    <o:p> </o:p>

    <o:p></o:p>

    <o:p></o:p>


    votre commentaire
  • Évènements et probabilités élémentaires<o:p></o:p>

    Capture d’écran 2014-08-13 à 20.02.14Capture d’écran 2014-08-13 à 20.02.30

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

    V)            Probabilités<o:p></o:p>

    Expérience aléatoire : résultat pas prévu<o:p></o:p>

    Ensemble fondamental : ensemble résultat possible<o:p></o:p>

    Événement élémentaire : résultat unique<o:p></o:p>

    Événement impossible : ensemble vide<o:p></o:p>

    Événement certain : tous les résultats possibles

    Capture d’écran 2014-08-13 à 20.02.40

    <o:p></o:p>


    votre commentaire
  • Probabilités conditionnelles, théorème<o:p></o:p>

    <o:p> </o:p>

    <o:p> </o:p>

    A et B appartiennent à l’univers<o:p></o:p>

    La proba que A arrive sachant que B est réalisé

    Capture d’écran 2014-08-13 à 19.59.25Capture d’écran 2014-08-13 à 19.59.33Capture d’écran 2014-08-13 à 19.59.42

    <o:p></o:p>


    votre commentaire
  • Les lois de Probabilités<o:p></o:p>

    <o:p> </o:p>

    <o:p> </o:p>

    <o:p> </o:p>

    Variable aléatoire = nombre<o:p></o:p>

    à valeur dans ensemble fini è discrète<o:p></o:p>

    à valeur dans intervalle è continue

     

    Capture d’écran 2014-08-13 à 19.54.21

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

    Capture d’écran 2014-08-13 à 19.55.12Capture d’écran 2014-08-13 à 19.55.23

     

     

     

     

     

     

     

     

     

     

     

     

     

           

             III)            Approximations<o:p></o:p>

    B(n ; p) à P(λ)<o:p></o:p>

    n ≥ 50<o:p></o:p>

    p ≤ 0,10<o:p></o:p>

    np ≤5<o:p></o:p>

    B(n ; p) à N(μ ; σ)<o:p></o:p>

    np ≥ 5<o:p></o:p>

    nq ≥ 5<o:p></o:p>

    P(λ) à N(μ ; σ)<o:p></o:p>

    λ > 25<o:p></o:p>

    <o:p></o:p>

    <o:p></o:p>


    votre commentaire
  • Biostatistiques<o:p></o:p>

     

     

    I) Définitions<o:p></o:p>

     

    - Statistique : art de collecter, analyser et interpréter des données. Elle peut être descriptive ou déductive.<o:p></o:p>

    - Population : série exhaustive de tous les individus étudiés.<o:p></o:p>

    - Echantillon : ensemble fini et d’effectif limité, souvent randomisé et donc représentatif.<o:p></o:p>

    - Paramètre : grandeur apportant une information résumée sur la variable étudiée.<o:p></o:p>

    - Variabilité : ensemble des différences inter et intra-individuelles, pouvant être dues au hasard ou physiologiques.<o:p></o:p>

    - Données : résultat de l’observation d’un individu<o:p></o:p>

    - Statistique descriptive : description à l’aide de paramètres<o:p></o:p>

    - Statistique déductive : conclusions à partir d’observation et de mesure <o:p></o:p>

    - Variables quantitatives : mesurables<o:p></o:p>

    - variables qualitatives : non mesurables<o:p></o:p>

     

    II) Statistique descriptive<o:p></o:p>

     

                A) Notion de paramètre<o:p></o:p>

    - Moyenne.<o:p></o:p>

    - Variance (= écart-type²) : indique la dispersion des données autour de la moyenne.<o:p></o:p>

    - Médiane : observation centrale des valeurs, n pair médiane = n/2 // n impair médiane = n+1/2.<o:p></o:p>

    - Quartiles : valeurs de la variable qui partagent la série d’effectif n en 4 sous-séries de même effectif.<o:p></o:p>

                Ex avec n=5 : 1er quartile = 0,25.5 = 1,25 1er quartile se trouve entre les 2 premières valeurs.<o:p></o:p>

     

                B) Comparaison moyenne/médiane<o:p></o:p>

     

    Avantages<o:p></o:p>

    Inconvénients<o:p></o:p>

    Moyenne<o:p></o:p>

    - Significative si répartition symétrique des données<o:p></o:p>

    - Dispersion faible<o:p></o:p>

    - Sensible aux valeurs anormales<o:p></o:p>

    - Sensibles aux minimums et maximums<o:p></o:p>

    Médiane<o:p></o:p>

    - Peu sensible aux valeurs anormales<o:p></o:p>

    - Utilisable pour les valeurs ordinales<o:p></o:p>

    - Peu adéquat pour les calculs statistiques<o:p></o:p>

     

     

                C) Notion d’estimation statistique<o:p></o:p>

    - Estimation ponctuelle : valeur unique jugée la meilleure à un instant donné.<o:p></o:p>

    - Estimation par intervalle : intervalle de valeurs contenant la valeur cherchée intervalle de confiance, plus fiable.<o:p></o:p>

    - Pour constituer un échantillon représentatif de la population, on utilise la détermination précise des caractéristiques de la population et le TAS.<o:p></o:p>

     

                D) Estimation de données quantitatives<o:p></o:p>

    Paramètre<o:p></o:p>

    Echantillon<o:p></o:p>

    Population<o:p></o:p>

    Moyenne<o:p></o:p>

    m : estimateur de la moyenne <o:p></o:p>

    μ : moyenne vraie<o:p></o:p>

    Ecart type<o:p></o:p>

    s : estimateur de l’écart type <o:p></o:p>

    σ : écart type vrai<o:p></o:p>

    Effectif<o:p></o:p>

    n<o:p></o:p>

    N<o:p></o:p>

     

    - Ecart type : variabilité des mesures entre elles et par rapport à la moyenne, plus il est faible et plus le caractère étudié est homogène <o:p></o:p>

     

    - Les degrés de liberté représentent le nombre des écarts (xi-m) indépendants il suffit de connaître (n-1) pour les connaître tous (n-1) degrés de liberté.<o:p></o:p>

     

    - Notion d’IC = intervalle au risque α : μ ϵ [ m ± ε.s/n ], avec i = ε.s/n = indice de précision de l’IC et n = ε2 (s2 / i2) = nombre de sujets<o:p></o:p>

    IC à α = 5% ó ε = 1,96<o:p></o:p>

            α = 1% ó ε = 2,6 <o:p></o:p>

     

    - Loi de Gauss, ou loi normale : loi permettant, pour tout échantillon où n ≥30, de visualiser les notions d’IC autour de la moyenne, d’écart type et de dispersion autour de la moyenne.<o:p></o:p>

    - La loi de Gauss est toujours centrée autour de la moyenne m de l’échantillon.<o:p></o:p>

    - Plus σ augmente, plus la dispersion des données est importante, ainsi la courbe de Gauss s’aplatit, mais gardera toujours une forme en cloche.<o:p></o:p>

    [m – 1 s ; m + 1 s] = 68,2% de la population<o:p></o:p>

    [m – 1,96 s ; m + 1,96 s] = 95,4% de la population (IC à 5%)<o:p></o:p>

    [m – 2,6 s ; m + 2,6 s] = 99,6% de la population (IC à 1%)<o:p></o:p>

     

                E) Estimation de données qualitatives<o:p></o:p>

     

     

    Echantillon<o:p></o:p>

    Population<o:p></o:p>

    Proportion<o:p></o:p>

    pobs : estimateur du pourcentage inconnu <o:p></o:p>

    p : pourcentage vrai<o:p></o:p>

    Ecart type<o:p></o:p>

    s : estimateur de l’écart type inconnu<o:p></o:p>

    σ : écart type vrai<o:p></o:p>

    Effectif<o:p></o:p>

    n<o:p></o:p>

    N<o:p></o:p>

    - Ecart type : s = √(pobs.qobs/n), avec qobs = 1 - pobs.<o:p></o:p>

    - IC : p ϵ [pobs +/- ε.s ], avec i = εs.<o:p></o:p>

     

    Précision d’un sondage : i = ε (p(1 – p)/n) = indice de précision de l’estimation p et n = ε2 (p(1-p) / i2) = nombre de sujets<o:p></o:p>

     

     

                F) Ensemble des données influant sur la précision<o:p></o:p>

     

    Sans titre

     

     

     

     

     

     

    III) Statistique déductive<o:p></o:p>

     

                A) Généralités sur les tests d’hypothèse<o:p></o:p>

     

    - Les tests de comparaison :<o:p></o:p>

    ü  Entre 2 populations : 2 échantillons représentatifs existe-t-il une différence significative ?<o:p></o:p>

    ü  Entre une population A et la population générale de référence : échantillon représentatif de la pop A différence significative entre échantillon et pop générale, puis entre pop A et pop générale.<o:p></o:p>

     

    - Définition des hypothèses :<o:p></o:p>

    ü  H0 = hypothèse nulle : pas de différences entre les deux groupes, pas de lien entre les caractères étudiés.<o:p></o:p>

    ü  H1 = hypothèse alternative : différence significative entre les deux groupes, lien entre les caractères.<o:p></o:p>

    On choisit toujours pour H0 l’hypothèse qu’il serait le plus grave de rejeter à tort.<o:p></o:p>

     

    - Notion de risque :<o:p></o:p>

     

    Rejet H0<o:p></o:p>

    Non rejet H0<o:p></o:p>

    H0 Vraie<o:p></o:p>

    Erreur de 1ère espèce α<o:p></o:p>

    1 – α<o:p></o:p>

    H1 Vraie<o:p></o:p>

    Puissance 1 - β<o:p></o:p>

    Erreur de 2nde espèce β<o:p></o:p>

     

     

    Les hypothèses H0 et H1 ont des rôles symétriques = rejet de H0 implique l’acceptation de H1.<o:p></o:p>

     

    - Etapes d’un test d’hypothèse (commun à tous les tests sauf quantitatif/quantitatif et U de Mann et Whitney) :<o:p></o:p>

    1. Définir H0 et H1.<o:p></o:p>

    2. Déterminer le caractère des données à étudier/comparer :<o:p></o:p>

                qualitative/qualitative OU qualitative/quantitative OU quantitative/quantitative.<o:p></o:p>

    3. Choisir le test en fonction des données (Z est le paramètre calculé).<o:p></o:p>

    4. Choisir le seuil d’erreur de 1ère espèce (généralement α=5%).<o:p></o:p>

    5. Recueil des données, calcul de Z et comparaison de Z à une valeur théorique.<o:p></o:p>

    6. Interprétation :<o:p></o:p>

    ü  Au niveau de l’échantillon, 2 cas : Zcalculé > Zth rejet de H0 // Zcalculé < Zth acceptation de H0.<o:p></o:p>

    ü  Au niveau de la pop : extrapolation seulement si les échantillons sont représentatifs.<o:p></o:p>

     

                B) Deux caractères qualitatifs, <o:p></o:p>

    ·      Test de comparaison de pourcentages <o:p></o:p>

    Repère par rapport à la table de l’écart réduit<o:p></o:p>

     

    ·      test du X²<o:p></o:p>

    - X²th est donné par la table du X² en croisant : le risque α, et le nombre de degrés de liberté (ddl) qui vaut : <o:p></o:p>

    (nblignes - 1)x(nbcolonnes - 1), en ne prenant en compte que les lignes/colonnes de données (sauf les totaux).<o:p></o:p>

    - X²calculé est donné dans l’énoncé.<o:p></o:p>

    - X²calculé > X²th rejet de H0 // X²calculé < X²th acceptation de H0.<o:p></o:p>

     

     

                C) Caractères qualitatifs et quantitatifs<o:p></o:p>

     

    - Test de comparaison des moyennes : (pour des valeurs de n > 30)<o:p></o:p>

    ü  εth est donné par la table de l’écart réduit, en fonction de α (Ex : 1,96 pour α=5%). εcalculé est donné.<o:p></o:p>

     

    - Test du T student : (pour des valeurs de n < 30)<o:p></o:p>

    ü  T student théorique donné par la table du T student en croisant :<o:p></o:p>

                Valeur de α.<o:p></o:p>

                Nombre de ddl donné par : (n1 - 1) + (n2 - 1), avec n les effectifs des différents échantillons.<o:p></o:p>

     

    - Cas de séries appariées, méthode des couples :<o:p></o:p>

    ü  Méthode des couples lorsqu’on étudie la liaison entre 2 variables qualitatives/quantitatives dans 2 échantillons non indépendants.<o:p></o:p>

    ü  On utilise alors le test de comparaison de moyennes de n >30, et un test T student si n <30.<o:p></o:p>

     

    - Test de U de Mann et Whitney : (très petits effectifs)<o:p></o:p>

    ü  Soient A et B deux échantillons, Uth est donné par la table de U de Mann et Whitney en croisant : α avec    (nB - nA), avec nB le plus grand des effectifs.<o:p></o:p>

    ü  Ucalculé est donné par : UAB = nA x nB - UBA, avec UBA le nombre de membres de A supérieurs aux membres de B.<o:p></o:p>

    ü  Ucalculé > Uth acceptation H0 car imbrication forte // Ucalculé < Uth rejet H0 car imbrication faible.<o:p></o:p>

     

     

                D) Deux caractères quantitatifs<o:p></o:p>

     

    - Coefficient de corrélation r : (revient à regarder la pente de la droite)<o:p></o:p>

    ü  Toujours compris dans l’intervalle [-1 ; 1] avec n – 2 ddl<o:p></o:p>

    ü  Si r n’existe pas ou si r=0 pas de corrélation entre x et y au niveau de l’échantillon.<o:p></o:p>

    ü  Si r existe et r >0 x et y varient dans le même sens<o:p></o:p>

    ü  Si r existe et r <0  x et y varient en sens inverse<o:p></o:p>

     

    - Pour l’interprétation des résultats, on utilise la valeur absolue de r pour comparer :<o:p></o:p>

    ü  |rcalculé| > [rth| rejet de H0 = acceptation H1, et inversement.<o:p></o:p>

     

     

    - Coefficient de Spearman r’ : (très petits effectifs)<o:p></o:p>

    Lu dans la table r’ de Spearman : en croisant α avec n (le nombre de données)<o:p></o:p>

     

     

                E) Tests non paramétriques<o:p></o:p>

     

    - On les utilise lorsque les effectifs sont trop faibles (n compris entre 4 et 12).<o:p></o:p>

    - Présentent une excellente robustesse.<o:p></o:p>

     

     

    <3 Tableau bilan <3<o:p></o:p>

    Effectif<o:p></o:p>

    Données quantitatives<o:p></o:p>

    Données qualitatives<o:p></o:p>

    Données quantitatives/qualitatives<o:p></o:p>

    4 < n < 12<o:p></o:p>

    r’ de Spearman<o:p></o:p>

    Comparaison % ou X²<o:p></o:p>

    U de Mann et Whitney<o:p></o:p>

    12 < n < 30<o:p></o:p>

    Coeff de corrélation r<o:p></o:p>

    Comparaison % ou X²<o:p></o:p>

    T student<o:p></o:p>

    n > 30<o:p></o:p>

    Coeff de corrélation r<o:p></o:p>

    Comparaison % ou X²<o:p></o:p>

    Comparaison de moyennes<o:p></o:p>

     


    votre commentaire


    Suivre le flux RSS des articles de cette rubrique
    Suivre le flux RSS des commentaires de cette rubrique