過分散データへのGLM適用時のp値：Taglibro de H：SSブログ

	ブログをはじめるログイン

過分散データへのGLM適用時のp値　[統計] [編集]

つづいて、過分散データにGLM（誤差構造はポアソン分布、リンク関数はlog）を適用したときの検定はどうなるか、をやってみます。

きのうと同様に関数を定義しますが、返り値は切片および係数のp値としています。

test2.f <- function(N = 200, NB = 10,
                    m1 = 0, m2 = 0,
                    sd1 = 0.2, sd2 = 0.3, sd.B = 0.8,
                    intercept = 1, coef.X1 = 0.3,
                    summary = FALSE) {
    X1 <- rnorm(N, m1, sd1)
    X2 <- rnorm(N, m2, sd2)
    B <- rep(rnorm(NB, 0, sd.B), each = N / NB)
    Y <- rpois(N, exp(intercept + coef.X1 * X1 + B))

    g1 <- glm(Y ~ X1 + X2, family = poisson)
    if (summary) print(summary(g1))
    return(summary(g1)$coefficients[, "Pr(>|z|)"])
}

X2の係数は0ですので、危険率5%で、p < 0.05となるのは5%のはずです。

> set.seed(123)
> test2 <- replicate(2000, test2.f())
> sum(test2["X2", ] < 0.05) / 2000
[1] 0.2525

しかし、25%ほど「有意」になってしまいます。

ランダム効果の大きさを小さくすると、5%に近づきます。

> set.seed(123)
> test2 <- replicate(2000, test2.f(sd.B = 1e-6))
> sum(test2["X2", ] < 0.05) / 2000
[1] 0.055

タグ：GLM

2017-05-19 20:32 nice!(1) コメント(0) トラックバック(0)
共通テーマ：日記・雑感

nice! 1

コメントを書く

Facebook コメント

トラックバック 0

ツクバネソウほか｜コウライテンナンショウブログトップ

日	月	火	水	木	金	土
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

RSS1.0 | RSS2.0

Taglibro de H

過分散データへのGLM適用時のp値　[統計] [編集]

nice! 1

コメント 0

コメントを書く

Facebook コメント

トラックバック 0

hiroki さん

カレンダー

最新記事一覧

マイカテゴリー

タグクラウド

最近のコメント

最近トラックバックされた記事

検索ボックス

iNaturalist

Taglibro de H

過分散データへのGLM適用時のp値 [統計] [編集]

nice! 1

コメント 0

コメントを書く

Facebook コメント

トラックバック 0

hiroki さん

カレンダー

最新記事一覧

マイカテゴリー

タグクラウド

最近のコメント

最近トラックバックされた記事

検索ボックス

iNaturalist

過分散データへのGLM適用時のp値　[統計] [編集]