Modèle linéaire généralisé loi de poisson

Étant donné que les estimations obtenues par application du GLM sur des données non transformées sont connues pour être exactes (Stroup, 2013; tableau 11,1), les estimations obtenues par les modèles appliqués aux données transformées ont été comparées à celles du GLM pour évaluer leur exactitude. Les deux modèles utilisant les données transformées ont sous-estimé la valeur de l`interception et de la pente dans les régressions par rapport aux estimations GLM (figure 4, annexes S3 – S8). Dans ces modèles, la transformation de la racine carrée a généralement les valeurs les plus basses des trois modèles, ce qui donne une estimation plus éloignée des valeurs exactes obtenues avec le GLM sur les données non transformées que l`estimation calculée pour la transformation du journal. De même, dans les modèles contenant des variables explicatives catégorielles, nous avons constaté que les coefficients calculés pour les modèles linéaires appliqués aux données transformées étaient généralement inférieurs à ceux obtenus à partir de la GLM (figure 4, appendices S9 – 1). Contrairement aux modèles de régression, les coefficients des données carrées ‐ racines ‐ transformées n`étaient pas systématiquement inférieurs à ceux des modèles à l`aide de la transformation logarithmique. où J (β (t)) {displaystyle {mathcal {J}} ({boldsymbol {beta}} ^ {(t)})} est la matrice d`information observée (la négatif de la matrice de Hesse) et vous (β (t)) {displaystyle u ({boldsymbol {beta}} ^ {(t)})} est la fonction de score; ou une méthode de notation de Fisher: la première recommandation pour la transformation que nous pouvions trouver dans un texte apparaît dans Snedecor et Cochran (1967) avec un bref traitement de la transformation de racine carrée d`arcsinus pour les proportions (c.-à-d., arcsin (√ y) où y est la réponse variable). Les recommandations textuelles pour l`utilisation de GLM commencent par McCulloch et Nelder 1983 et se poursuivent dans des textes spécialisés, axés de la même manière sur le GLM. Les recommandations pour la transformation ont continué d`apparaître dans des textes généraux pour les biologistes tout au long du XXe siècle dans le présent (figure 1, appendice S1). Plusieurs manuels consultés contenaient des recommandations à la fois pour GLM et pour les transformations lorsque les hypothèses du modèle linéaire n`étaient pas remplies (un texte entre 1980 et 1985 (Atkinson, 1985) et neuf textes depuis 2001, voir annexe S1). Dans tous les cas sauf un (Vittinghoff et al.

2012), les transformations ont été suggérées comme une solution de rechange uniquement dans les cas où l`utilisation d`un GLM ne satisfaisait pas aux hypothèses nécessaires. En dépit de quelques recommandations pour l`utilisation de GLM dans les manuels publiés depuis 1991, en plus des recommandations continues dans des textes spécialisés axés sur les BPL, les transformations demeurent la recommandation prédominante dans les textes d`usage général. Ces résultats, ainsi que la publication récente de plusieurs Articles de revues, débattent de l`utilisation des transformations et de la GLM (Ives, 2015; Lo & Andrews, 2015; O`Hara & Kotze, 2010; Warton & Hui, 2011; Warton et coll., 2016), montrent qu`il n`y a pas encore de consensus dans les textes statistiques généraux destinés aux biologistes et aux écologistes quant aux meilleures pratiques en matière de traitement des résidus non normaux. Le modèle de log-Linear saturé (ou complet) ressemble à un modèle ANOVA à plusieurs voies. Les modèles log-linéaires complets et réduits pour une conception à deux facteurs sont les suivants: begin{align *} log (f_ {IJ}) & = mu + lambda ^ A_i + lambda ^ B_j + lambda ^ {AB} _ {IJ} & mathsf{(complet ~ Model)} log (f_ {IJ}) & = mu + lambda ^ A_i + lambda ^ B_j & mathsf{(réduit ~ Model)} end{ align *} où $log (f_ {IJ}) $ est la fonction log Link, $ mu $ est la moyenne de la ($log $) des fréquences attendues ($f _ {IJ} $) et $ lambda ^ A_i $ est l`effet de la ième catégorie de la variable ($A $), $ lambda ^ B_j $ est l`effet de la catégorie JTH de $B $ et $ lambda ^ {AB } _ {IJ} $ est l`effet interactif de chaque combinaison de catégories sur les fréquences attendues ($log $).