Modele lineaire simple

Les sections suivantes discutent des tests d`hypothèses sur les coefficients de régression dans une régression linéaire simple. Ces tests peuvent être effectués s`il peut être supposé que le terme d`erreur aléatoire,, est normalement et indépendamment distribué avec une moyenne de zéro et la variance de. Par conséquent, 98% de la variabilité des données de rendement est expliquée par le modèle de régression, ce qui indique un très bon ajustement du modèle. Il peut sembler que de plus grandes valeurs indiquent un modèle de régression mieux adapté. Cependant, devrait être utilisé avec prudence car ce n`est pas toujours le cas. La valeur des augmentations comme plus de termes sont ajoutées au modèle, même si le nouveau terme ne contribue pas de manière significative au modèle. Par conséquent, une augmentation de la valeur de ne peut pas être considérée comme un signe pour conclure que le nouveau modèle est supérieur à l`ancien modèle. Ajout d`un nouveau terme peut rendre le modèle de régression pire si l`erreur moyenne carrée,, pour le nouveau modèle est plus grand que l`ancien modèle, même si le nouveau modèle affichera une valeur accrue de. Dans les résultats obtenus à partir du folio DOE, est affiché comme R-sq sous le tableau ANOVA (comme illustré dans la figure ci-dessous), qui affiche la feuille d`analyse complète pour les données dans le tableau précédent. La relation est établie. Et la précision? Quelle est la précision du modèle? Pour obtenir une impression de l`exactitude du modèle, une métrique nommée R-squared ou coefficient de détermination est importante. Le modèle de régression ici est appelé un modèle de régression linéaire simple, car il n`y a qu`une seule variable indépendante, dans le modèle.

Dans les modèles de régression, les variables indépendantes sont également appelées des variables de prédicteurs ou de régressors. La variable dépendante, est également appelée la réponse. La pente, et l`intersection, de la ligne sont appelées coefficients de régression. La pente, peut être interprétée comme la variation de la valeur moyenne d`un changement d`unité dans. Le modèle de régression linéaire peut ne pas être directement applicable à certaines données. La non-linéarité peut être détectée à partir de nuages de dispersion ou peut être connue à travers la théorie sous-jacente du produit ou du processus ou de l`expérience passée. Les transformations sur la variable prédicteur, ou la variable de réponse, peuvent souvent suffire à rendre le modèle de régression linéaire approprié pour les données transformées. S`il est connu que les données suivent la distribution logarithmique, alors une transformation logarithmique sur (c.-à-d.) peut être utile. Pour les données qui suivent la distribution de poisson, une transformation de racine carrée () est généralement applicable. L`équation de régression linéaire simple est représentée par une ligne droite. Vous pourriez prévoir que si vous viviez dans les latitudes supérieures du Nord des États-Unis, moins vous seriez exposé aux rayons nocifs du soleil, et donc, le moins de risque que vous auriez de la mort due au cancer de la peau.

Le nuage de nuages prend en charge une telle hypothèse. Il semble y avoir une relation linéaire négative entre la latitude et la mortalité due au cancer de la peau, mais la relation n`est pas parfaite. En effet, l`intrigue montre une certaine «tendance», mais il montre aussi quelques «Scatter». Par conséquent, il s`agit d`une relation statistique, et non pas déterministe. Les modèles de régression linéaire sont utilisés pour afficher ou prédire la relation entre deux variables ou facteurs. Le facteur qui est prédit (le facteur que l`équation résout pour) est appelé variable dépendante. Les facteurs utilisés pour prédire la valeur de la variable dépendante sont appelés variables indépendantes. La description des propriétés statistiques des estimateurs à partir des estimations de régression linéaire simple nécessite l`utilisation d`un modèle statistique. Ce qui suit est basé sur l`hypothèse de la validité d`un modèle sous lequel les estimations sont optimales.