很多次樣本平均數這時候母群的平均數會在所有樣本平均數的中間裡面(例如:母群範圍1-10,平均數為5.5,樣本平均數會在1-10之間。)
平均數的考驗(Test) 1 – 10 例如 抽取五個數字其樣本平均數為8 又可能為同母群抽出,但若為8.2不可能為同一母群 1-10 抽五個數平均值最高為8
兩個母群 兩個樣本 找出屬於哪一個種類的錯誤A或B類
單因子分析:兩個樣本是否為同一母群
班級為40個人的態度良表 最低分為1分 最高分為5分
ANOVA 組區間為組別-1(每一組的區間有幾個)
自由度為數量-1(最後一個的自由度為 0 )
顯著性P值:推論發生錯誤的機率(第一類錯誤的機率)
(假設發生錯誤的機率;例 <0.05;錯誤率為<5% 正確率>95%;
則推論測試組為同一母群的機率>95%)
獨立樣本檢定:顯著式(雙尾檢定) 表示 左右/2 為上限與下限的機率。
T檢定-平均差異數檢定
(1)使用時機:
A 獨立樣本T檢定:比較單一樣本中,平均值與某一定值間之差異。
B 成對樣本T檢定:比較兩組樣本的平均值間是否存在差異。
(2)前提假設:
A 虛無假設:H0:μ1=μ2,即兩母體平均數相同。
B 對立假設:H1:μ1≠μ2,即兩母體平均數不相同。
è若H1:μ1≠μ2時,需進行「雙尾檢定」;若H1:μ1>μ2或μ1<μ2時,則進行「雙尾檢
定」。C T檢定的結果不是拒絕H0,就是接受H0。在檢定時可能會犯兩種錯誤: 當H0
應該要被接受時,卻被推翻;當H0 應該被推翻時,卻被接受。
(3)有時候得到的T值會是極端值,比在P值得到的更為極端。例如在95%的信賴區間上,
(3)有時候得到的T值會是極端值,比在P值得到的更為極端。例如在95%的信賴區間上,
若P值小於0.05,則會推翻H0;在99%的信賴區間上,若P值小於0.01,則會推翻H0虛
無假設。
實驗 運用亂數 INT(RAND()*5+1);INT(RAND()*3+2) 兩組不同的母群取得樣本30個
做分析時(ANOVA)發現 ,因母群的差異使得顯著性變化為0.00由此可以證實不為相同母群。
顯著性差異(significance level),當數據之間具有了顯著性差異,就說明參與比對的數據不是來自於同一總體(Population),而是來自於具有差異的兩個不同總體,這種差異可能因參與比對的數據是來自不同實驗對象的。
顯著性差異是一種有量度的或然性評價。比如,我們說A、B兩數據在.05水平上具備顯著性差異,這是說兩組數據具備顯著性差異的可能性為95%。兩個數據所代表的樣本還有5%的可能性是沒有差異的。這5%的差異是由於隨機誤差造成的。
顯著性:發生機率多大。
希望正確率是99.5%,所以就是0.05的誤差。
希望正確率是99.5%,所以就是0.05的誤差。
希望正確率是99%,所以所以就是 0.01的誤差。
理論上我們這次做的不應該有顯著性
顯著性用來推論發生錯誤的機率。推論又叫假設(hypothesis),發生錯誤的機率是小於0.05(有顯著)。所以是對的。
如果大於.05,就代表他們發現錯誤的機率是一樣的,你就不能說他們是不一樣的(沒有顯著)。
95% p<0.05*
99% p<0.01**
99.9% p <0.001***
例1:
一班30人次的問卷量表,量表分數最低1分,最高5分。共三組(90人)。
其自由度(df)=89,即
組間=2(3組-1組)
組內=89(90人-1人)
df=89-2=87
一班30人次的問卷量表,量表分數最低1分,最高5分。共三組(90人)。
其自由度(df)=89,即
組間=2(3組-1組)
組內=89(90人-1人)
df=89-2=87
同一母群產生的值,其顯著性(p:推論發生錯誤的機率),只針對第一類型錯誤作觀察。
假設三組其中有人為不同母群產生,看p值,如<0.05 ,則發生錯誤的機率<5%,正確率>95%,則表示沒有顯著差異,即三組為同一母群的數值。
如果 改變第三組資料,將分數1.2置換成較高分的4.5則得到以下數據
用anova找出有顯著性(<0.05)差異最大的兩組為 VAR00005(.001) 和 VAR00010(.943)
利用單一樣本t檢定找出第三組和第一二組差別時,得到以下數據
<1.3組>
ANOVA | ||||||
平方和 | 自由度 | 平均平方和 | F | 顯著性 | ||
VAR00002 | 組間 | 7.022 | 2 | 3.511 | 2.471 | .090 |
組內 | 123.600 | 87 | 1.421 | |||
總和 | 130.622 | 89 | ||||
VAR00003 | 組間 | 8.467 | 2 | 4.233 | 2.913 | .060 |
組內 | 126.433 | 87 | 1.453 | |||
總和 | 134.900 | 89 | ||||
VAR00004 | 組間 | 5.422 | 2 | 2.711 | 2.454 | .092 |
組內 | 96.133 | 87 | 1.105 | |||
總和 | 101.556 | 89 | ||||
VAR00005 | 組間 | 16.022 | 2 | 8.011 | 7.175 | .001 |
組內 | 97.133 | 87 | 1.116 | |||
總和 | 113.156 | 89 | ||||
VAR00006 | 組間 | 17.222 | 2 | 8.611 | 5.785 | .004 |
組內 | 129.500 | 87 | 1.489 | |||
總和 | 146.722 | 89 | ||||
VAR00007 | 組間 | 1.800 | 2 | .900 | .731 | .484 |
組內 | 107.100 | 87 | 1.231 | |||
總和 | 108.900 | 89 | ||||
VAR00008 | 組間 | 12.289 | 2 | 6.144 | 4.277 | .017 |
組內 | 125.000 | 87 | 1.437 | |||
總和 | 137.289 | 89 | ||||
VAR00009 | 組間 | 4.467 | 2 | 2.233 | 1.834 | .166 |
組內 | 105.933 | 87 | 1.218 | |||
總和 | 110.400 | 89 | ||||
VAR00010 | 組間 | .156 | 2 | .078 | .059 | .943 |
組內 | 114.333 | 87 | 1.314 | |||
總和 | 114.489 | 89 | ||||
VAR00011 | 組間 | 7.800 | 2 | 3.900 | 3.512 | .034 |
組內 總和 | 96.600 104.400 | 87 89 | 1.110 | |||
用anova找出有顯著性(<0.05)差異最大的兩組為 VAR00005(.001) 和 VAR00010(.943)
利用單一樣本t檢定找出第三組和第一二組差別時,得到以下數據
<1.3組>
組別統計量 | ||||||
VAR00001 | 個數 | 平均數 | 標準差 | 平均數的標準誤 | ||
VAR00005 | dimension1 | 1.00 | 30 | 2.6667 | 1.24106 | .22659 |
3.00 | 30 | 3.7000 | .91539 | .16713 | ||
VAR00010 | dimension1 | 1.00 3.00 | 30 30 | 3.3000 3.3333 | 1.26355 .92227 | .23069 .16838 |
獨立樣本檢定 | ||||||
變異數相等的 Levene 檢定 | 平均數相等的 t 檢定 | |||||
F 檢定 | 顯著性 | t | 自由度 | 顯著性 (雙尾) | ||
VAR00005 | 假設變異數相等 | 5.169 | .027 | -3.670 | 58 | .001 |
不假設變異數相等 | -3.670 | 53.348 | .001 | |||
VAR00010 | 假設變異數相等 不假設變異數相等 | 4.859 | .031 | -.117 -.117 | 58 53.069 | .907 .908 |
獨立樣本檢定 | |||||
平均數相等的 t 檢定 | |||||
平均差異 | 標準誤差異 | 差異的 95% 信賴區間 | |||
下界 | 上界 | ||||
VAR00005 | 假設變異數相等 | -1.03333 | .28155 | -1.59692 | -.46974 |
不假設變異數相等 | -1.03333 | .28155 | -1.59797 | -.46870 | |
VAR00010 | 假設變異數相等 不假設變異數相等 | -.03333 -.03333 | .28561 .28561 | -.60504 -.60617 | .53837 .53950 |
<2.3組>
4.比較t檢定報表之不同,得到
組別統計量 | ||||||
VAR00001 | 個數 | 平均數 | 標準差 | 平均數的標準誤 | ||
VAR00005 | dimension1 | 2.00 | 30 | 3.1667 | .98553 | .17993 |
3.00 | 30 | 3.7000 | .91539 | .16713 | ||
VAR00010 | dimension1 | 2.00 3.00 | 30 30 | 3.2333 3.3333 | 1.22287 .92227 | .22326 .16838 |
獨立樣本檢定 | ||||||
變異數相等的 Levene 檢定 | 平均數相等的 t 檢定 | |||||
F 檢定 | 顯著性 | t | 自由度 | 顯著性 (雙尾) | ||
VAR00005 | 假設變異數相等 | .022 | .882 | -2.172 | 58 | .034 |
不假設變異數相等 | -2.172 | 57.687 | .034 | |||
VAR00010 | 假設變異數相等 不假設變異數相等 | 2.426 | .125 | -.358 -.358 | 58 53.926 | .722 .722 |
獨立樣本檢定 | |||||
平均數相等的 t 檢定 | |||||
平均差異 | 標準誤差異 | 差異的 95% 信賴區間 | |||
下界 | 上界 | ||||
VAR00005 | 假設變異數相等 | -.53333 | .24557 | -1.02490 | -.04176 |
不假設變異數相等 | -.53333 | .24557 | -1.02496 | -.04171 | |
VAR00010 | 假設變異數相等 不假設變異數相等 | -.10000 -.10000 | .27964 .27964 | -.65976 -.66066 | .45976 .46066 |
4.比較t檢定報表之不同,得到
*第三組的平均數,不論是 VAR00005 或 VAR00010,皆高於第一、二組。
沒有留言:
張貼留言