Member-only story
若要分析類別型資料的話,最入門的就是卡方檢定
今天要介紹如何用R來使用卡方檢定
免費閱讀文章:[R]Chi-square 卡方檢定
三種卡方檢定
卡方適合度檢定
卡方同質性檢定
卡方獨立性檢定
卡方適合度檢定
主要使用於抽樣一組(次)的樣本
H0 : 資料分配符合期望值
H1 : 資料分配不符合期望值
我們想知道這顆骰子是不是公正的,那我們檢查骰子出現1到6的機率是不是都是1/6
首先我們紀錄每次投骰子的結果,總共六百次(使用sample.int產生投骰子的資料)
使用table就可以看到每個數字出現的次數
接下來使用卡方檢定
可以看到圖中的卡方值是7.12 而 p-value = 0.2119
因為 p-value >0.05 所以不拒絕 H0,表示這顆骰子是公正的
若我們想要知道特定的機率,也可以在chisq.test函數裡面調整
在裡面使用 p=c(2/6,0/6,1/6,1/6,1/6,1/6)
表示我們想要知道投骰子的機率是否為 : 數字1出現的機率為 2/6,而出現的機率為 0 , 而其他的機率同樣為 1/6
可以看到圖中的卡方值是Inf 而 p-value = <0.0001
因為 p-value <0.05 所以拒絕 H0
set.seed(53) #使用 set.seed可以 設定產生隨機樹的初始值
x <- factor(sample.int(6,size = 600,replace = T))
table(x)
chisq.test(table(x))
chisq.test(table(x),p = c(2/6,0/6,1/6,1/6,1/6,1/6))
卡方獨立性檢定
主要使用於抽樣兩組(次)與兩組(次)以上的樣本