統計の手続き のバックアップ(No.1)
検定の手続 - 有意差 †
- 各データ群の差(各条件の平均・分散の差)をみたいとき
検定手法の選択*1 †
- 用語参考
- データの種類(変数の尺度)
- 正規分布とみなせるかどうか ... 前準備&ヒストグラム 正規分布との適合度を調べる
- 標準偏差が等しい(等分散)とみなせるかどうか ... 等分散性について
比較するデータの種類が間隔尺度および比率尺度 †
- データ尺度については 量的分析法 勉強会/確率分布/データの性質と分類 を参照。
- 正規分布とみなせるとき*2
- 2条件比較
- 2条件のデータに対応がある
対応のあるt検定
- 2条件のデータに対応がなく、標準偏差が等しい*3
対応のない(通常の)t検定
- 2条件のデータに対応がなく、標準偏差が等しくない
ウェルチのt検定
- 2条件のデータに対応がある
- 正規分布とみなせないとき
1. 順序尺度・名義尺度のデータとして扱う。 2. 分散分析であれば、そのまま使っても良い(有意水準を上げておくとなお良い)。
- 離散データのとき
- 対応がないなら
クラスカル・ウォリス検定
- 対応があるなら(参考)
フリードマン検定
- 対応がないなら
比較するデータの種類が順序尺度 †
- 2変数
1. メディアン検定 2. サイン検定 3. 順位相関分析
- 複数要因の交互作用の分析は困難。
比較するデータの種類が名義尺度 †
- 2変数
1. 直接確率計算 2. χ二乗検定 3. 連関(相関のカテゴリカル版)係数分析
- 複数要因の交互作用の検定には対数線型分析が用いられる。
検定の手続 †
対応のあるt検定、対応のないt検定、ウェルチのt検定 †
分散分析・クラスカル・ウォリス検定・フリードマン検定 †
- 量的分析法 勉強会/分散分析?
- R Note/統計/分散分析
メディアン検定 †
サイン検定 †
直接確率計算 †
χ二乗検定 †
論文の書き方*6 †
等分散性の検定(F検定) †
- 「~両条件の違いは分散の差に表れていると見て、検定を行った結果、有意傾向であった(両側検定:F(分子の自由度,分母の自由度)=F値, .05<p<.10)。したがって~」
対応のあるt検定、対応のないt検定、ウェルチのt検定 †
- 「表0は、条件Aと条件Bの平均及び標準偏差を示したものである。t検定の結果、両条件の平均の差は有意であった(両側検定:t(自由度)=t値, p<.05)。したがって、条件Aより条件Bの方が~」。*7
- 有意性の表記
- p > .10 のとき「有意でない」, .05 < p < .10 のとき「有意傾向である」, p < .05 のとき「有意である」と書く。
- p値を示す際、<0.001の場合には***,<0.01の場合には**,<0.05の場合 には*を記しましょう。(菊池先生)*8
分散分析 †
χ二乗検定 †
- 「表Oは、各ほめられ方ごとに、それをもっとも好む児童の人数を示したものである。χ二乗検定の結果、人数の偏りは有意であった(χ^2*9(3)=12.79, p<.01)。表OOによると~はあまり好まれず、~は特に好まれると言える。」
- (残差分析を行ったなら、以下を追記)
検定の手続 - 相関と回帰 †
- 各データ群の関係性をみたいとき
- 各条件のデータ間に対応があることが前提
- 統計解析の概要と手法/相関と回帰分析
検定手法の選択*10 †
比較するデータの種類が間隔尺度および比率尺度 †
- 正規分布とみなせるとき
- 2変数
- 散布図は直線的か*11
1. 相関係数を求め、相関係数の有意性検定を調べる。 2. 相関係数を求めてから、回帰分析を行う。
- 散布図は直線的か*11
- 2変数
- 3変数以上
- 変数間に特定の予測関係が存在しない場合
相関マトリクスの作成→因子分析
- 変数間に特定の予測関係が存在し、変数間の相関がない場合
重回帰分析
- 変数間に特定の予測関係が存在し、変数間の相関がある場合
重回帰分析の相互作用モデル
- 変数間に特定の予測関係が存在しない場合
- 正規分布とみなせないとき
順序尺度・名義尺度のデータとして扱う。
比較するデータの種類が順序尺度 †
- 2変数
順位相関分析
比較するデータの種類が名義尺度 †
- 2変数
連関係数分析
- 複数の変数
対数線型分析
検定の手続 †
相関係数と相関係数の有意性検定 †
回帰分析 †
相関マトリクスの作成と因子分析 †
重回帰分析 †
重回帰分析の相互作用モデル †
順位相関分析 †
連関係数分析 †
対数線型分析 †
論文の書き方 †
相関係数と相関係数の有意性検定 †
- 「~相関係数は.837であり、有意であった(F(1,18)=42.11, p<.01)。説明率は70.1%であり、両変数の間には強い相関があるといえる。」
回帰分析 †
- 「~相関係数は.837であり、有意であった(F(1,18)=42.11, p<.01)。説明率は70.1%であり、両変数の間には強い相関があるといえる。変数Aを目的変数、変数Bを予測変数として予測式を求めると、A=1.05B-1.89, となった。予測の標準誤差は3.7である。」
重回帰分析、重回帰分析の相互作用モデル †
- 偏相関係数を使う場合
- 「変数Aを目的変数、変数B・Cを予測変数として重相関係数を計算した結果、R^2*12=.284 であり、有意であった(F(2,47)=9.33, p<.01)。ここで、変数Cを一定とした時の変数Aと変数Bの偏相関係数は .425(F(1,47)=10.36, p<.01)、また、変数Bを一定とした時の変数Aと変数Bの偏相関係数は .173(F(1,47)=1.45, p>.10)であった。したがって、変数Aと変数Bとの間に実質的な相関関係のあることが示唆される。説明率は18%であり、相関の強さは中程度である。」
- 偏回帰係数を使う場合
- 「変数Aを目的変数、変数B・Cを予測変数とした回帰分析の結果、変数Bの偏回帰係数は 0.64(両側検定:t(47)=3.22, p</01)、また、変数Cの偏回帰係数は 0.18(両側検定:t(47)=1.20, p>.10)であった。したがって、変数Aに及ぼす変数Bの効果は有意であるが、変数Cの効果は実質的なものであるとは言えない。なお、この時の回帰式全体の説明率はR^2*13=.284 であり、有意であった(F(2,47)=9.33, p<.01)。」
*1 参考:田中敏, 山際勇一郎, ユーザーのための教育・心理統計と実験計画法 : 方法の理解から論文の書き方まで, 1992.
*2 ヒストグラムを目で見て、極端値がない+双峰分布や方形分布でないことが確認できればOK。L字型分布やJ字型分布は対数変換して正規分布していいればOK。ただし厳密には問題があることも覚えておく。
*3 各条件の標準偏差を見て、大きく違っていなければOK。判断が難しいときは F検定 を使う。
*4 3条件をそれぞれ組み合わせてt検定をする場合、危険率が上がってしまう。参考:なぜ、多群において全ての組み合わせで t 検定をしてはいけないか。
*5 正確には、不等分散の複数条件比較には、クラスカル・ウォリス検定 を使うべきだが、分散分析は不等分散に対しても頑健である、ということらしい。(菊池研統計解析勉強会2010 より)
*6 参考:田中敏, 山際勇一郎, ユーザーのための教育・心理統計と実験計画法 : 方法の理解から論文の書き方まで, 1992.
*7 参考文献では、ウェルチのt検定を行ったときは「分散の大きさが等質とみなせなかったので、ウェルチの法によるt検定を行った。」という文を付け加えている。
*8 アスタリスクの解釈には注意が必要。参考:勘違いされているアスタリスク(有意水準) t検定結果の読み方について
*9 χ二乗
*10 参考:田中敏, 山際勇一郎, ユーザーのための教育・心理統計と実験計画法 : 方法の理解から論文の書き方まで, 1992.
*11 散布図が弧を描いている場合は、縦軸・横軸のどちらかを対数変換すればOK。
*12 Rの二乗
*13 Rの二乗