トップ   新規 一覧 単語検索   ヘルプ   最終更新のRSS

統計の手続き のバックアップ(No.1)


検定の手続 - 有意差

  • 各データ群の差(各条件の平均・分散の差)をみたいとき

検定手法の選択*1

比較するデータの種類が間隔尺度および比率尺度

  • 2条件比較
    • 2条件のデータに対応がある
      対応のあるt検定
    • 2条件のデータに対応がなく、標準偏差が等しい*3
      対応のない(通常の)t検定
    • 2条件のデータに対応がなく、標準偏差が等しくない
      ウェルチのt検定
  • 複数条件比較*4
    • 各条件のデータの標準偏差が等しい
      分散分析
    • 各条件のデータの標準偏差が等しくない*5
      分散分析(有意水準を上げておくとなお良い)
      クラスカル・ウォリス検定
  • 正規分布とみなせないとき
    1. 順序尺度・名義尺度のデータとして扱う。
    2. 分散分析であれば、そのまま使っても良い(有意水準を上げておくとなお良い)。

比較するデータの種類が順序尺度

  • 2変数
    1. メディアン検定
    2. サイン検定
    3. 順位相関分析
  • 複数要因の交互作用の分析は困難。

比較するデータの種類が名義尺度

  • 2変数
    1. 直接確率計算
    2. χ二乗検定
    3. 連関(相関のカテゴリカル版)係数分析
  • 複数要因の交互作用の検定には対数線型分析が用いられる。

検定の手続

対応のあるt検定、対応のないt検定、ウェルチのt検定

分散分析・クラスカル・ウォリス検定・フリードマン検定

メディアン検定

サイン検定

直接確率計算

χ二乗検定

論文の書き方*6

等分散性の検定(F検定)

  • 「~両条件の違いは分散の差に表れていると見て、検定を行った結果、有意傾向であった(両側検定:F(分子の自由度,分母の自由度)=F値, .05<p<.10)。したがって~」

対応のあるt検定、対応のないt検定、ウェルチのt検定

  • 「表0は、条件Aと条件Bの平均及び標準偏差を示したものである。t検定の結果、両条件の平均の差は有意であった(両側検定:t(自由度)=t値, p<.05)。したがって、条件Aより条件Bの方が~」。*7
  • 有意性の表記
    • p > .10 のとき「有意でない」, .05 < p < .10 のとき「有意傾向である」, p < .05 のとき「有意である」と書く。
    • p値を示す際、<0.001の場合には***,<0.01の場合には**,<0.05の場合 には*を記しましょう。(菊池先生)*8

分散分析

χ二乗検定

  • 「表Oは、各ほめられ方ごとに、それをもっとも好む児童の人数を示したものである。χ二乗検定の結果、人数の偏りは有意であった(χ^2*9(3)=12.79, p<.01)。表OOによると~はあまり好まれず、~は特に好まれると言える。」
  • (残差分析を行ったなら、以下を追記)

検定の手続 - 相関と回帰

検定手法の選択*10

比較するデータの種類が間隔尺度および比率尺度

  • 正規分布とみなせるとき
    • 2変数
      • 散布図は直線的か*11
        1. 相関係数を求め、相関係数の有意性検定を調べる。
        2. 相関係数を求めてから、回帰分析を行う。
  • 3変数以上
    • 変数間に特定の予測関係が存在しない場合
      相関マトリクスの作成→因子分析
    • 変数間に特定の予測関係が存在し、変数間の相関がない場合
      重回帰分析
    • 変数間に特定の予測関係が存在し、変数間の相関がある場合
      重回帰分析の相互作用モデル
  • 正規分布とみなせないとき
    順序尺度・名義尺度のデータとして扱う。

比較するデータの種類が順序尺度

  • 2変数
    順位相関分析

比較するデータの種類が名義尺度

  • 2変数
    連関係数分析
  • 複数の変数
    対数線型分析

検定の手続

相関係数と相関係数の有意性検定

回帰分析

相関マトリクスの作成と因子分析

重回帰分析

重回帰分析の相互作用モデル

順位相関分析

連関係数分析

対数線型分析

論文の書き方

相関係数と相関係数の有意性検定

  • 「~相関係数は.837であり、有意であった(F(1,18)=42.11, p<.01)。説明率は70.1%であり、両変数の間には強い相関があるといえる。」

回帰分析

  • 「~相関係数は.837であり、有意であった(F(1,18)=42.11, p<.01)。説明率は70.1%であり、両変数の間には強い相関があるといえる。変数Aを目的変数、変数Bを予測変数として予測式を求めると、A=1.05B-1.89, となった。予測の標準誤差は3.7である。」

重回帰分析、重回帰分析の相互作用モデル

  • 偏相関係数を使う場合
    • 「変数Aを目的変数、変数B・Cを予測変数として重相関係数を計算した結果、R^2*12=.284 であり、有意であった(F(2,47)=9.33, p<.01)。ここで、変数Cを一定とした時の変数Aと変数Bの偏相関係数は .425(F(1,47)=10.36, p<.01)、また、変数Bを一定とした時の変数Aと変数Bの偏相関係数は .173(F(1,47)=1.45, p>.10)であった。したがって、変数Aと変数Bとの間に実質的な相関関係のあることが示唆される。説明率は18%であり、相関の強さは中程度である。」
  • 偏回帰係数を使う場合
    • 「変数Aを目的変数、変数B・Cを予測変数とした回帰分析の結果、変数Bの偏回帰係数は 0.64(両側検定:t(47)=3.22, p</01)、また、変数Cの偏回帰係数は 0.18(両側検定:t(47)=1.20, p>.10)であった。したがって、変数Aに及ぼす変数Bの効果は有意であるが、変数Cの効果は実質的なものであるとは言えない。なお、この時の回帰式全体の説明率はR^2*13=.284 であり、有意であった(F(2,47)=9.33, p<.01)。」

*1 参考:田中敏, 山際勇一郎, ユーザーのための教育・心理統計と実験計画法 : 方法の理解から論文の書き方まで, 1992.
*2 ヒストグラムを目で見て、極端値がない+双峰分布や方形分布でないことが確認できればOK。L字型分布やJ字型分布は対数変換して正規分布していいればOK。ただし厳密には問題があることも覚えておく
*3 各条件の標準偏差を見て、大きく違っていなければOK。判断が難しいときは F検定 を使う。
*4 3条件をそれぞれ組み合わせてt検定をする場合、危険率が上がってしまう。参考:なぜ、多群において全ての組み合わせで t 検定をしてはいけないか。
*5 正確には、不等分散の複数条件比較には、クラスカル・ウォリス検定 を使うべきだが、分散分析は不等分散に対しても頑健である、ということらしい。(菊池研統計解析勉強会2010 より)
*6 参考:田中敏, 山際勇一郎, ユーザーのための教育・心理統計と実験計画法 : 方法の理解から論文の書き方まで, 1992.
*7 参考文献では、ウェルチのt検定を行ったときは「分散の大きさが等質とみなせなかったので、ウェルチの法によるt検定を行った。」という文を付け加えている。
*8 アスタリスクの解釈には注意が必要。参考:勘違いされているアスタリスク(有意水準) t検定結果の読み方について
*9 χ二乗
*10 参考:田中敏, 山際勇一郎, ユーザーのための教育・心理統計と実験計画法 : 方法の理解から論文の書き方まで, 1992.
*11 散布図が弧を描いている場合は、縦軸・横軸のどちらかを対数変換すればOK。
*12 Rの二乗
*13 Rの二乗