トップ   編集 凍結解除 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索   ヘルプ   最終更新のRSS

R Note/統計/線形モデル

Last-modified: 2016-10-20 (木) 19:46:41
Top / R Note / 統計 / 線形モデル

(一般)線形モデル : (General) Liner Model*1

t検定

  • 二つのデータ群(標本)について、それぞれのデータ群の平均に差(有意差)があるといえるかどうかを調べる手法。
  • 前提条件
    • 二つのデータ群がどちらも正規分布していること
    • ニつのデータ群の分散が等しいこと
    • それぞれのデータ群が独立である(相関がない、対応がない = もう一方のデータ群の影響を受けない)こと
      • 独立でない場合(両データで同じ被験者が参加しているなど) → 対応のあるt検定
      • 一般に、対応を考慮したほうが有意差は出やすくなる。

分散分析(ANalysis Of VAriance, ANOVA)*4

(対応のある/ない)一元配置分散分析

(対応のある/ない)二元配置分散分析

相関と回帰分析

  • 2つの変数間に相互依存関係があるかどうかの解析 → 相関分析
    • 一方の変数の大小にともなってもう一方の値も変わるなら(例えば身長と体重)、「相互依存関係にある」といえます。
    • 各データはそれぞれ、正規分布に従う誤差をもつと考える
      • 1 に近いとき:正の相関がある
      • -1 に近いとき:負の相関がある
      • 0 のとき:相関はない(両変数は互いに独立)
  • 2つの変数が相互依存関係にあるとき、2変数の関係を一次関数であらわす → (線形)単回帰分析*5
  • 2変数の関係をx次関数であらわす → x次回帰分析
  • 変数が三つ以上のときの回帰分析 → (線形)重回帰分析

線形単回帰分析(説明変数が一つ)

線形重回帰分析(説明変数が二つ以上)

交互作用を考慮した重回帰分析(説明変数同士の影響を考慮)

最適なモデル選択

(線形)混合(効果)モデル : Linear Mixed*6 Effect Model

  • 個人性や場所などの変量効果(ランダム要因)を考慮した上で除外できるモデル*7
  • 固定モデル、無作為モデル、混合モデルとも呼ばれる*8
  • 以下、動物行動学者のための一般化線形混合モデル:自習の手引き より引用
    • ランダム要因:独立要因のひとつではあるが、その要因間の差に興味がない場合
    • ランダム要因を入れることで、擬似反復pseudo-replicationを避けることができる
      • ある個体から10個のデータが得られていて、他の個体からは5つのデータが得られている場合(データの独立性が保たれていない場合)でも、全部のデータ15個をプールして分析することができる

独立変数が一つかつ離散変数(一要因の混合効果分散分析)

独立変数が一つかつ連続変数(混合効果単回帰分析)

独立変数が複数(混合効果分散分析/重回帰分析/共分散分析)

一般化(一般)線形モデル : Generalized Linear Model*9

  • データ群が正規分布に従わない場合も含めた統計解析
    • 正規分布を含む、様々な分布を包括した線形モデル
    • 分散分析ANOVAや回帰Regression、共分散分析ANCOVAは、原理はまったく同じ(Grafen & Hails 2002) それらを統合した分析方法が、一般線形モデルGeneral Linear Model(GLM)(参考
    • 一般線形モデルの前提条件を守らなくても良い(さまざまな分布を前提にできる)
      • データが正規分布に従うと仮定できない場合
      • 誤差が正規分布に従わない場合、応答の分布が最小2乗法の要件を満たさない場合
      • データの平均が特定の範囲内に制限されている場合
      • 等分散性が仮定できない場合
  • 以下は一般化線形モデルの一例です。

ロジスティック回帰分析

ロジスティック分散分析

  • 従属変数が離散かつ二値(二項分布)、独立変数が離散値

ポアソン分散分析

  • 従属変数が度数やカウントデータ(ポアソン分布)、独立変数が離散値

一般化(線形)混合(効果)モデル : Generalized Linear Mixed Effect Model

階層ベイズ一般化線形モデル

  • 分布の種類以外にも、(最尤法で記述可能な)様々な前提条件を考慮可能なモデル
  • ベイズ確率モデル
    • 尤度は既知の分布を仮定するか、(任意の?)尤度式を指定する。確率密度関数はMCMC法によって求めるため既知の分布の制約を受けない。
    • 事前分布は主観的に決めるか、既知の分布(正規分布)を仮定するか、分布形状を指定しない。階層型ベイズモデルでは観測データから事前分布の形状を求める。詳細は 階層ベイズモデル(北海道大 久保先生)を参照。

*1 GLMという略語は、一般線形モデルと、一般"化"線形モデルの両方を表す ため、ややこしいです。
*2 一般化線形モデルについて(北海道大 加藤先生)
*3 Rのt.test関数なら、自動的に分散を調べて適切なt検定を使ってくれる。
*4 http://www.ibaraki-kodomo.com/toukei/anova.html および ハンバーガー統計学にようこそ!(早稲田大向後先生) を参考にしています。
*5 Wikipedia - 線形回帰 より引用
*6 「混合モデル」の"mixed"と、「混合分布モデル」の"mixture"は違うものなので注意。前者はランダム要因の混合のこと。後者は確率分布の山が混合しているということ。
*7 ランダム要因になりうる様々な要因を混合モデルに入れて考慮することができる。制御要因とランダム要因に同一の要因を与えることもできるらしい。
*8 心理学のためのデータ解析テクニカルブック, 森敏昭, 吉田寿夫, 北大路書房 p.75-76
*9 一般線形モデル(General Linear Model, GLM または LM)はy=ax+bで表される線形モデルのうち、yが正規分布にしたがうもの全てをまとめたもの。一般線形モデル(Generalized Linear Model, GLM)は、一般線形モデルをyが正規分布以外の既知の分布でも良いように一般化したもの(つまり、「一般化一般線形モデル」の略称)。階層ベイズ一般化線形モデルは、一般化線形モデルを階層ベイズモデルで表現してMCMCで解かせるもの。一般線形モデルについて一般化線形モデル (generalized linear model; GLM) を簡単に紹介するペイジ一般化線形モデル入門の入門 を参照。