Miyazawa’s Pukiwiki
R Note/統計/確率分布
はすでに存在します。
開始行:
*確率分布(確率密度関数) [#l9080f24]
-Rのサンプルデータを使ってさまざまな確率分布を再現してみ...
-参考
--[[R と確率分布(同志社大 金先生):http://mjin.doshisha....
--[[R による統計解析の基礎(確率密度関数,分布関数,分位点...
--[[Rにおける確率分布(RjpWiki):http://www.okada.jp.org/...
#contents
**連続変数(continuous variable) [#j5bf8607]
***正規分布(Normal distribution)、ガウス分布(Gaussian ...
-[0,10]区間でランダムに生成した10000個の値のヒストグラム
> hist(runif(10000) * 10, main = "")
#ref(Rstudy1i.png,,70%);
-[0,10]区間で、1回につき5個の値をランダムに生成し、その平...
> means<-numeric(10000)
> for (i in 1:10000){
> means[i]<- mean(runif(5)*10)
> }
> hist(means,ylim=c(0,1600))
#ref(Rstudy1j.png,,70%);
--0~10からランダムに生成した5個の平均なので、値は5の近く...
-このヒストグラムは、どの程度正規分布に一致しているか?
--平均と分散を求める
> mean(means)
[1] 5.003137
> sd(means)
[1] 1.286634
--確率密度曲線の横軸の分割点のベクトルを作る(0から10まで...
> xv <- seq(0, 10, 0.1)
> xv
[1] 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 ...
[15] 1.4 1.5 1.6 1.7 1.8 1.9 2.0 2.1 2.2 2.3 ...
[29] 2.8 2.9 3.0 3.1 3.2 3.3 3.4 3.5 3.6 3.7 ...
[43] 4.2 4.3 4.4 4.5 4.6 4.7 4.8 4.9 5.0 5.1 ...
[57] 5.6 5.7 5.8 5.9 6.0 6.1 6.2 6.3 6.4 6.5 ...
[71] 7.0 7.1 7.2 7.3 7.4 7.5 7.6 7.7 7.8 7.9 ...
[85] 8.4 8.5 8.6 8.7 8.8 8.9 9.0 9.1 9.2 9.3 ...
[99] 9.8 9.9 10.0
--ヒストグラムの面積を求める
---データ数 10000、ヒストグラムの一つのビンの幅が 0.5 な...
---求める正規分布の面積は1.0なので、各値に5000をかける必...
-Rの関数を使って正規分布の確率密度関数を生成するには
--上記に加えて、以下を実行
> yv<-dnorm(xv,mean=5.003137,sd=1.286634)*5000
> lines(xv,yv)
#ref(Rstudy1k.png,,70%);
-標準正規分布(平均0,分散1)
> nd<-seq(-3,3,0.01)
> y<-dnorm(nd)
> plot(nd,y,type="l")
#ref(Rstudy1l.png,,70%);
--以下のようにしても作れる。
> curve(dnorm(x, 0, 1), -3, 3)
***混合正規分布 [#b2444351]
-参考:[[苦労する遊び人の覚え書き/ガウス混合分布(GMM...
***指数分布 [#yf70e89e]
***t分布 [#e4aabe66]
***カイ2乗分布 [#p596b125]
***ガンマ分布 [#bed7e603]
***ベータ分布 [#l8a50109]
***F分布 [#o9ea1711]
-分子の自由度3、分母の自由度16のF分布((Rによるやさしい統...
> curve(df(x, 3, 16), 0, 5)
***コーシー分布 [#y6f41dc7]
***アーラン分布 [#o01b2832]
***三角分布 [#db52fad7]
***ラプラス分布 [#k4fdff28]
***レイリー分布 [#le32514e]
***ロジスティック分布 [#faa32112]
***パレート分布 [#ra7a9f8b]
***ワイブル分布 [#fd5d9655]
**連続変数の分布の種類を特定する [#n37e1e32]
-例として、[[Fisher のアヤメのデータ:http://speechresearc...
> data(iris)
> iris
--
Sepal.Length Sepal.Width Petal.Length Petal.Width ...
1 5.1 3.5 1.4 0.2 ...
2 4.9 3.0 1.4 0.2 ...
(略)
51 7.0 3.2 4.7 1.4 ve...
52 6.4 3.2 4.5 1.5 ve...
(略)
101 6.3 3.3 6.0 2.5 v...
102 5.8 2.7 5.1 1.9 v...
(略)
150 5.9 3.0 5.1 1.8 v...
-ここでは、「がくの長さ(Sepal.Length)」にのみ注目します...
>setosa.Length = subset(iris, Species=="setosa")$Sepal.Le...
>versicolor.Length = subset(iris, Species=="versicolor")$...
>virginica.Length = subset(iris, Species=="virginica")$Se...
-ヒストグラムを作ります。
>par(mfrow=c(3,1)) #三段組みのプロットをする
>brk = seq(4, 8, 0.3) #分割範囲を指定、4~8まで、0.3ずつ
>hist(setosa.Length, breaks=brk)
>hist(versicolor.Length, breaks=brk)
>hist(virginica.Length, breaks=brk)
#ref(R_002.png,,80%);
-t検定やANOVAを使うためには、「標本分布が正規分布をしてい...
>par(mfrow=c(3,1))
>hist(setosa.Length, breaks=brk)
>setosa.Norm <- dnorm(brk, mean=mean(setosa.Length), sd=s...
>lines(brk,setosa.Norm) #重ねてプロット
>hist(versicolor.Length, breaks=brk)
>versicolor.Norm <- dnorm(brk, mean=mean(versicolor.Lengt...
>lines(brk,versicolor.Norm)
>hist(virginica.Length, breaks=brk)
>virginica.Norm <- dnorm(brk, mean=mean(virginica.Length)...
>lines(brk,virginica.Norm)
#ref(R_003.png,,80%);
--標本分布と正規分布は、あまり大きくずれてはいないようで...
-続けて、'''[[コルモゴロフ-スミルノフ検定(KS検定):http:...
--最終的にANOVAを使うなら、正規分布へ適合するかどうかだけ...
--[[一般化線形モデル:http://speechresearch.fiw-web.net/12...
-setosaについて関数ks.testを実行します。((参考:[[Rでt検...
> ks.test(setosa.Length,"pnorm",mean=mean(setosa.Length),...
--
One-sample Kolmogorov-Smirnov test
data: setosa.Length
D = 0.1149, p-value = 0.5245
alternative hypothesis: two-sided
警告メッセージ:
In ks.test(setosa.Length, "pnorm", mean = mean(setosa.Le...
タイがあるため、正しい p 値を計算することができません
--ks.testのオプションとして、「比較したい既知の分布」の名...
--帰無仮説は「標本分布と、既知の分布に差がない」です。し...
--「タイがあるため~」の警告は、まったく同じ数値のデータ...
-KS検定以外の方法として、'''[[カイ二乗検定によって標本分...
***一群のヒストグラムの歪度と尖度を求める(([[統計学:Rを...
-[[統計解析フリーソフト R の備忘録頁 ver.3.1 59. 基本統計...
-尖度(kurtosis)は分布の頂点の尖り方が正規分布とどの程度...
-歪度(skewness)が負の値をとるときは左に、正の値をとると...
-[[MATLAB Note/統計/確率分布/尖度 kurtosis と 歪度 skewne...
**正規分布でない標本を正規分布に近づける [#x381a770]
-検討1. 標本数を増やす(中心極限定理)
--'''t 検定をするとき、サンプリングしたデータが正規分布に...
--'''統計法をある程度学習している者にとって,次のような反...
--'''t 検定,分散分析,多重比較法は標本データの正規分布性...
---もしもt検定や分散分析以外の方法、例えば&color(red){''...
-検討2. 正規分布に近づくような変換を施す
--L字型(左(0方向)に山が寄っている)分布を正規分布に近...
---開平変換(平方根変換)(square root transformation)
---''角変換(逆正弦変換、アークサイン変換)(Angular tran...
---対数変換((対数をとると正規分布になるような分布のことを...
---逆数変換
--J字型(右に山が寄っている)分布を正規分布に近づけるには
---Log変換 → &color(red){''逆対数変換でなくて?要確認。'...
--形が分からない分布を正規分布に近づけるには
---'''[[Box-Cox変換:http://speechresearch.fiw-web.net/res...
---形状のゆがみを統計的に解析する方法として、[[一群のヒス...
--'''分布の正規性と分散の等質性という2つの条件は、一般に1...
-ただし、検討2について、''これらの変換にかけても、データ...
--強制選択変数(forced-choice variables)、質問の正解率(...
--比例尺度にアークサイン平方根変換を適用しても、ANOVAの結...
--ポアソン分布(L字型)を平方根変換しても、すそ野のフィッ...
--はじめに、L字型のポアソン分布に従う標本集団を作ります((...
> set.seed(1) # 乱数系列の初期化
> n <- 1000 # 処理あたりの標本数
> m <- 4 # 無処理の場合、平均4個の実生が発生...
> ex <- 6 # 処理Xの効果: 6倍とする。
> ey <- 0.25 # 処理Yの効果: 0.25倍とする。
> x <- c(rep(0, n), rep(0, n), rep(1, n), rep(1, n))
> # 処理Xの有無(なし->0,あり->1)のベク...
> y <- c(rep(0, n), rep(1, n), rep(0, n), rep(1, n))
> # 処理Yの有無(なし->0,あり->1)のベク...
> z <- c(rpois(n, m), rpois(n, m*ey), rpois(n, m*ex), rp...
> # 結果zを乱数を使って生成
> data <- data.frame(x, y, z)
> # データフレームdataを作成
> data.x0y0 <- data[(data$x == 0 & data$y == 0),]
> # x==0かつy==0のデータだけとりだす
> hist(data.x0y0$z) # 頻度分布を確認
#ref(R_004.png,,50%);
--ポアソン分布への適合度検定の結果(群馬大青木先生のスク...
> pois.Hist <- hist(data.x0y0$z)$counts
> source("http://aoki2.si.gunma-u.ac.jp/R/src/poissondist...
> result.pois <- poissondist(pois.Hist)
> result.pois
--
ポアソン分布への適合度の検定
data: pois.Hist
X-squared = 58.8944, df = 9, p-value = 2.188e-09
sample estimates:
n lambda
1000.000 3.034
---p-value が0.05より小さいので、ポアソン分布に適合してい...
---注:ここではp値は小さいほどポアソン分布に適合していま...
--正規分布との適合度も判定してみます。
> ks.test(data.x0y0$z,"pnorm",mean=mean(data.x0y0$z),sd=s...
--
One-sample Kolmogorov-Smirnov test
data: data.x0y0$z
D = 0.1323, p-value = 1.221e-15
alternative hypothesis: two-sided
警告メッセージ:
In ks.test(data.x0y0$z, "pnorm", mean = mean(data.x0y0$z...
タイがあるため、正しい p 値を計算することができません
---「データ内に同順位がある」という警告が出ています(とり...
---p-value は0.05より小さく、正規分布に適合していません。...
--なお、正確な正規分布を作って適合度をみると以下くらいのp...
> means<-numeric(10000)
> for (i in 1:10000){
> means[i]<- mean(runif(5)*10)
> }
> hist(means,ylim=c(0,1600))
> ks.test(means,"pnorm",mean=mean(means),sd=sd(means))
--
One-sample Kolmogorov-Smirnov test
data: means
D = 0.0085, p-value = 0.4595
alternative hypothesis: two-sided
--開平変換(平方根変換)をしてみます。
> z2 = sqrt(data.x0y0$z)
> hist(z2)
#ref(R_006.png,,50%);
--正規分布と一致しているかどうか検定します。
> ks.test(z2,"pnorm",mean=mean(z2),sd=sd(z2))
--
One-sample Kolmogorov-Smirnov test
data: z2
D = 0.1297, p-value = 4.774e-15
alternative hypothesis: two-sided
警告メッセージ:
In ks.test(z2, "pnorm", mean = mean(z2), sd = sd(z2)) :
タイがあるため、正しい p 値を計算することがで
---警告が出たものの、p-value は0.05より小さく、正規分布に...
---注:ここではp値は大きいほど正規分布に適合しています(...
--角変換(逆正弦変換、アークサイン変換)をしてみます。
>z3 = asin(sqrt(data.x0y0$z/length(data.x0y0$z)))
>##ヒストグラムを作る
>hist(z3)
#ref(R_007.png,,50%);
--正規分布と一致しているかどうか検定します。
> ks.test(z3,"pnorm",mean=mean(z3),sd=sd(z3))
--
One-sample Kolmogorov-Smirnov test
data: z3
D = 0.1296, p-value = 5.218e-15
alternative hypothesis: two-sided
(警告は省略)
---p-value は0.05より小さく、正規分布に適合していません。
--このように、&color(red){L字型分布を変換して、左右対称(...
**離散変数(categorical variable) [#p6cdf4e3]
***二項分布 [#odea2b90]
-試行回数 n = 20、各試行における成功確率 p = 0.7 の二項分...
> x <- 0:40
> plot(x, dbinom(x,20,0.7),type="h")
#ref(Rstudy_dbinom1.png,,70%);
***ポアソン分布 [#lb2eaa87]
***負の二項分布 [#b1e876f9]
***ベルヌーイ分布 [#lf2dc99b]
***超幾何分布 [#j8131a6a]
***多項分布 [#tf6b9bfc]
***ゼータ分布、ジップ分布 [#t33c3243]
終了行:
*確率分布(確率密度関数) [#l9080f24]
-Rのサンプルデータを使ってさまざまな確率分布を再現してみ...
-参考
--[[R と確率分布(同志社大 金先生):http://mjin.doshisha....
--[[R による統計解析の基礎(確率密度関数,分布関数,分位点...
--[[Rにおける確率分布(RjpWiki):http://www.okada.jp.org/...
#contents
**連続変数(continuous variable) [#j5bf8607]
***正規分布(Normal distribution)、ガウス分布(Gaussian ...
-[0,10]区間でランダムに生成した10000個の値のヒストグラム
> hist(runif(10000) * 10, main = "")
#ref(Rstudy1i.png,,70%);
-[0,10]区間で、1回につき5個の値をランダムに生成し、その平...
> means<-numeric(10000)
> for (i in 1:10000){
> means[i]<- mean(runif(5)*10)
> }
> hist(means,ylim=c(0,1600))
#ref(Rstudy1j.png,,70%);
--0~10からランダムに生成した5個の平均なので、値は5の近く...
-このヒストグラムは、どの程度正規分布に一致しているか?
--平均と分散を求める
> mean(means)
[1] 5.003137
> sd(means)
[1] 1.286634
--確率密度曲線の横軸の分割点のベクトルを作る(0から10まで...
> xv <- seq(0, 10, 0.1)
> xv
[1] 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 ...
[15] 1.4 1.5 1.6 1.7 1.8 1.9 2.0 2.1 2.2 2.3 ...
[29] 2.8 2.9 3.0 3.1 3.2 3.3 3.4 3.5 3.6 3.7 ...
[43] 4.2 4.3 4.4 4.5 4.6 4.7 4.8 4.9 5.0 5.1 ...
[57] 5.6 5.7 5.8 5.9 6.0 6.1 6.2 6.3 6.4 6.5 ...
[71] 7.0 7.1 7.2 7.3 7.4 7.5 7.6 7.7 7.8 7.9 ...
[85] 8.4 8.5 8.6 8.7 8.8 8.9 9.0 9.1 9.2 9.3 ...
[99] 9.8 9.9 10.0
--ヒストグラムの面積を求める
---データ数 10000、ヒストグラムの一つのビンの幅が 0.5 な...
---求める正規分布の面積は1.0なので、各値に5000をかける必...
-Rの関数を使って正規分布の確率密度関数を生成するには
--上記に加えて、以下を実行
> yv<-dnorm(xv,mean=5.003137,sd=1.286634)*5000
> lines(xv,yv)
#ref(Rstudy1k.png,,70%);
-標準正規分布(平均0,分散1)
> nd<-seq(-3,3,0.01)
> y<-dnorm(nd)
> plot(nd,y,type="l")
#ref(Rstudy1l.png,,70%);
--以下のようにしても作れる。
> curve(dnorm(x, 0, 1), -3, 3)
***混合正規分布 [#b2444351]
-参考:[[苦労する遊び人の覚え書き/ガウス混合分布(GMM...
***指数分布 [#yf70e89e]
***t分布 [#e4aabe66]
***カイ2乗分布 [#p596b125]
***ガンマ分布 [#bed7e603]
***ベータ分布 [#l8a50109]
***F分布 [#o9ea1711]
-分子の自由度3、分母の自由度16のF分布((Rによるやさしい統...
> curve(df(x, 3, 16), 0, 5)
***コーシー分布 [#y6f41dc7]
***アーラン分布 [#o01b2832]
***三角分布 [#db52fad7]
***ラプラス分布 [#k4fdff28]
***レイリー分布 [#le32514e]
***ロジスティック分布 [#faa32112]
***パレート分布 [#ra7a9f8b]
***ワイブル分布 [#fd5d9655]
**連続変数の分布の種類を特定する [#n37e1e32]
-例として、[[Fisher のアヤメのデータ:http://speechresearc...
> data(iris)
> iris
--
Sepal.Length Sepal.Width Petal.Length Petal.Width ...
1 5.1 3.5 1.4 0.2 ...
2 4.9 3.0 1.4 0.2 ...
(略)
51 7.0 3.2 4.7 1.4 ve...
52 6.4 3.2 4.5 1.5 ve...
(略)
101 6.3 3.3 6.0 2.5 v...
102 5.8 2.7 5.1 1.9 v...
(略)
150 5.9 3.0 5.1 1.8 v...
-ここでは、「がくの長さ(Sepal.Length)」にのみ注目します...
>setosa.Length = subset(iris, Species=="setosa")$Sepal.Le...
>versicolor.Length = subset(iris, Species=="versicolor")$...
>virginica.Length = subset(iris, Species=="virginica")$Se...
-ヒストグラムを作ります。
>par(mfrow=c(3,1)) #三段組みのプロットをする
>brk = seq(4, 8, 0.3) #分割範囲を指定、4~8まで、0.3ずつ
>hist(setosa.Length, breaks=brk)
>hist(versicolor.Length, breaks=brk)
>hist(virginica.Length, breaks=brk)
#ref(R_002.png,,80%);
-t検定やANOVAを使うためには、「標本分布が正規分布をしてい...
>par(mfrow=c(3,1))
>hist(setosa.Length, breaks=brk)
>setosa.Norm <- dnorm(brk, mean=mean(setosa.Length), sd=s...
>lines(brk,setosa.Norm) #重ねてプロット
>hist(versicolor.Length, breaks=brk)
>versicolor.Norm <- dnorm(brk, mean=mean(versicolor.Lengt...
>lines(brk,versicolor.Norm)
>hist(virginica.Length, breaks=brk)
>virginica.Norm <- dnorm(brk, mean=mean(virginica.Length)...
>lines(brk,virginica.Norm)
#ref(R_003.png,,80%);
--標本分布と正規分布は、あまり大きくずれてはいないようで...
-続けて、'''[[コルモゴロフ-スミルノフ検定(KS検定):http:...
--最終的にANOVAを使うなら、正規分布へ適合するかどうかだけ...
--[[一般化線形モデル:http://speechresearch.fiw-web.net/12...
-setosaについて関数ks.testを実行します。((参考:[[Rでt検...
> ks.test(setosa.Length,"pnorm",mean=mean(setosa.Length),...
--
One-sample Kolmogorov-Smirnov test
data: setosa.Length
D = 0.1149, p-value = 0.5245
alternative hypothesis: two-sided
警告メッセージ:
In ks.test(setosa.Length, "pnorm", mean = mean(setosa.Le...
タイがあるため、正しい p 値を計算することができません
--ks.testのオプションとして、「比較したい既知の分布」の名...
--帰無仮説は「標本分布と、既知の分布に差がない」です。し...
--「タイがあるため~」の警告は、まったく同じ数値のデータ...
-KS検定以外の方法として、'''[[カイ二乗検定によって標本分...
***一群のヒストグラムの歪度と尖度を求める(([[統計学:Rを...
-[[統計解析フリーソフト R の備忘録頁 ver.3.1 59. 基本統計...
-尖度(kurtosis)は分布の頂点の尖り方が正規分布とどの程度...
-歪度(skewness)が負の値をとるときは左に、正の値をとると...
-[[MATLAB Note/統計/確率分布/尖度 kurtosis と 歪度 skewne...
**正規分布でない標本を正規分布に近づける [#x381a770]
-検討1. 標本数を増やす(中心極限定理)
--'''t 検定をするとき、サンプリングしたデータが正規分布に...
--'''統計法をある程度学習している者にとって,次のような反...
--'''t 検定,分散分析,多重比較法は標本データの正規分布性...
---もしもt検定や分散分析以外の方法、例えば&color(red){''...
-検討2. 正規分布に近づくような変換を施す
--L字型(左(0方向)に山が寄っている)分布を正規分布に近...
---開平変換(平方根変換)(square root transformation)
---''角変換(逆正弦変換、アークサイン変換)(Angular tran...
---対数変換((対数をとると正規分布になるような分布のことを...
---逆数変換
--J字型(右に山が寄っている)分布を正規分布に近づけるには
---Log変換 → &color(red){''逆対数変換でなくて?要確認。'...
--形が分からない分布を正規分布に近づけるには
---'''[[Box-Cox変換:http://speechresearch.fiw-web.net/res...
---形状のゆがみを統計的に解析する方法として、[[一群のヒス...
--'''分布の正規性と分散の等質性という2つの条件は、一般に1...
-ただし、検討2について、''これらの変換にかけても、データ...
--強制選択変数(forced-choice variables)、質問の正解率(...
--比例尺度にアークサイン平方根変換を適用しても、ANOVAの結...
--ポアソン分布(L字型)を平方根変換しても、すそ野のフィッ...
--はじめに、L字型のポアソン分布に従う標本集団を作ります((...
> set.seed(1) # 乱数系列の初期化
> n <- 1000 # 処理あたりの標本数
> m <- 4 # 無処理の場合、平均4個の実生が発生...
> ex <- 6 # 処理Xの効果: 6倍とする。
> ey <- 0.25 # 処理Yの効果: 0.25倍とする。
> x <- c(rep(0, n), rep(0, n), rep(1, n), rep(1, n))
> # 処理Xの有無(なし->0,あり->1)のベク...
> y <- c(rep(0, n), rep(1, n), rep(0, n), rep(1, n))
> # 処理Yの有無(なし->0,あり->1)のベク...
> z <- c(rpois(n, m), rpois(n, m*ey), rpois(n, m*ex), rp...
> # 結果zを乱数を使って生成
> data <- data.frame(x, y, z)
> # データフレームdataを作成
> data.x0y0 <- data[(data$x == 0 & data$y == 0),]
> # x==0かつy==0のデータだけとりだす
> hist(data.x0y0$z) # 頻度分布を確認
#ref(R_004.png,,50%);
--ポアソン分布への適合度検定の結果(群馬大青木先生のスク...
> pois.Hist <- hist(data.x0y0$z)$counts
> source("http://aoki2.si.gunma-u.ac.jp/R/src/poissondist...
> result.pois <- poissondist(pois.Hist)
> result.pois
--
ポアソン分布への適合度の検定
data: pois.Hist
X-squared = 58.8944, df = 9, p-value = 2.188e-09
sample estimates:
n lambda
1000.000 3.034
---p-value が0.05より小さいので、ポアソン分布に適合してい...
---注:ここではp値は小さいほどポアソン分布に適合していま...
--正規分布との適合度も判定してみます。
> ks.test(data.x0y0$z,"pnorm",mean=mean(data.x0y0$z),sd=s...
--
One-sample Kolmogorov-Smirnov test
data: data.x0y0$z
D = 0.1323, p-value = 1.221e-15
alternative hypothesis: two-sided
警告メッセージ:
In ks.test(data.x0y0$z, "pnorm", mean = mean(data.x0y0$z...
タイがあるため、正しい p 値を計算することができません
---「データ内に同順位がある」という警告が出ています(とり...
---p-value は0.05より小さく、正規分布に適合していません。...
--なお、正確な正規分布を作って適合度をみると以下くらいのp...
> means<-numeric(10000)
> for (i in 1:10000){
> means[i]<- mean(runif(5)*10)
> }
> hist(means,ylim=c(0,1600))
> ks.test(means,"pnorm",mean=mean(means),sd=sd(means))
--
One-sample Kolmogorov-Smirnov test
data: means
D = 0.0085, p-value = 0.4595
alternative hypothesis: two-sided
--開平変換(平方根変換)をしてみます。
> z2 = sqrt(data.x0y0$z)
> hist(z2)
#ref(R_006.png,,50%);
--正規分布と一致しているかどうか検定します。
> ks.test(z2,"pnorm",mean=mean(z2),sd=sd(z2))
--
One-sample Kolmogorov-Smirnov test
data: z2
D = 0.1297, p-value = 4.774e-15
alternative hypothesis: two-sided
警告メッセージ:
In ks.test(z2, "pnorm", mean = mean(z2), sd = sd(z2)) :
タイがあるため、正しい p 値を計算することがで
---警告が出たものの、p-value は0.05より小さく、正規分布に...
---注:ここではp値は大きいほど正規分布に適合しています(...
--角変換(逆正弦変換、アークサイン変換)をしてみます。
>z3 = asin(sqrt(data.x0y0$z/length(data.x0y0$z)))
>##ヒストグラムを作る
>hist(z3)
#ref(R_007.png,,50%);
--正規分布と一致しているかどうか検定します。
> ks.test(z3,"pnorm",mean=mean(z3),sd=sd(z3))
--
One-sample Kolmogorov-Smirnov test
data: z3
D = 0.1296, p-value = 5.218e-15
alternative hypothesis: two-sided
(警告は省略)
---p-value は0.05より小さく、正規分布に適合していません。
--このように、&color(red){L字型分布を変換して、左右対称(...
**離散変数(categorical variable) [#p6cdf4e3]
***二項分布 [#odea2b90]
-試行回数 n = 20、各試行における成功確率 p = 0.7 の二項分...
> x <- 0:40
> plot(x, dbinom(x,20,0.7),type="h")
#ref(Rstudy_dbinom1.png,,70%);
***ポアソン分布 [#lb2eaa87]
***負の二項分布 [#b1e876f9]
***ベルヌーイ分布 [#lf2dc99b]
***超幾何分布 [#j8131a6a]
***多項分布 [#tf6b9bfc]
***ゼータ分布、ジップ分布 [#t33c3243]
ページ名:
既存のページ名で編集する