2010年11月28日 星期日

11/17



很多次樣本平均數這時候母群的平均數會在所有樣本平均數的中間裡面(例如:母群範圍1-10,平均數為5.5,樣本平均數會在1-10之間。)
平均數的考驗(Test) 1 – 10 例如 抽取五個數字其樣本平均數為又可能為同母群抽出,但若為8.2不可能為同一母群 1-10 抽五個數平均值最高為8

兩個母群 兩個樣本 找出屬於哪一個種類的錯誤AB

單因子分析:兩個樣本是否為同一母群

班級為40個人的態度良表 最低分為1 最高分為5

ANOVA 組區間為組別-1(每一組的區間有幾個)
自由度為數量-1(最後一個的自由度為 0 )
顯著性P值:推論發生錯誤的機率(第一類錯誤的機率)
(假設發生錯誤的機率;例 <0.05;錯誤率為<5% 正確率>95% 
則推論測試組為同一母群的機率>95%)

獨立樣本檢定:顯著式(雙尾檢定表示 左右/2 為上限與下限的機率。

 T檢定-平均差異數檢定

1)使用時機:
       獨立樣本T檢定:比較單一樣本中,平均值與某一定值間之差異。
       成對樣本T檢定:比較兩組樣本的平均值間是否存在差異。
2)前提假設:
         A 虛無假設:H0μ1μ2,即兩母體平均數相同。
         B 對立假設:H1μ1≠μ2,即兩母體平均數不相同。
  èH1μ1≠μ2時,需進行「雙尾檢定」;若H1μ1μ2μ1μ2時,則進行「雙尾檢
        定」。C T檢定的結果不是拒絕H0,就是接受H0。在檢定時可能會犯兩種錯誤: 當H0
        應該要被接受時,卻被推翻;當H0 應該被推翻時,卻被接受。
3)有時候得到的T值會是極端值,比在P值得到的更為極端。例如在95%的信賴區間上,
       若P值小於0.05,則會推翻H0;在99%的信賴區間上,若P值小於0.01,則會推翻H0
       無假設。


實驗 運用亂數 INT(RAND()*5+1);INT(RAND()*3+2) 兩組不同的母群取得樣本30個
做分析時(ANOVA)發現 ,因母群的差異使得顯著性變化為0.00由此可以證實不為相同母群。



顯著性差異(significance level)當數據之間具有了顯著性差異,就說明參與比對的數據不是來自於同一總體(Population),而是來自於具有差異的兩個不同總體,這種差異可能因參與比對的數據是來自不同實驗對象的。
顯著性差異是一種有量度的或然性評價。比如,我們說AB兩數據在.05水平上具備顯著性差異,這是說兩組數據具備顯著性差異的可能性為95%。兩個數據所代表的樣本還有5%的可能性是沒有差異的。這5%的差異是由於隨機誤差造成的。
實驗結果達到.05水平.01水平,才可以說數據之間具備了顯著性差異。在作結論時,應確實描述方向性(例如顯著大於或顯著小於)。
顯著性:發生機率多大。
希望正確率是99.5%,所以就是0.05的誤差。
 
希望正確率是99%,所以所以就是 0.01的誤差。
理論上我們這次做的不應該有顯著性
顯著性用來推論發生錯誤的機率。推論又叫假設(hypothesis),發生錯誤的機率是小於0.05(有顯著)。所以是對的。
如果大於.05,就代表他們發現錯誤的機率是一樣的,你就不能說他們是不一樣的(沒有顯著)

95%  p<0.05*
99%  p<0.01**
99.9% p <0.001***
例1
一班30人次的問卷量表,量表分數最低1分,最高5分。共三組(90人)。
其自由度(df)=89,即
組間=2(3組-1組)
組內=89(90人-1人)
df=89-2=87
同一母群產生的值,其顯著性(p:推論發生錯誤的機率),只針對第一類型錯誤作觀察。

假設三組其中有人為不同母群產生,看p值,如<0.05 ,則發生錯誤的機率<5%,正確率>95%,則表示沒有顯著差異,即三組為同一母群的數值。

如果  改變第三組資料,將分數1.2置換成較高分的4.5則得到以下數據

ANOVA

平方和
自由度
平均平方和
F
顯著性
VAR00002
組間
7.022
2
3.511
2.471
.090
組內
123.600
87
1.421


總和
130.622
89



VAR00003
組間
8.467
2
4.233
2.913
.060
組內
126.433
87
1.453


總和
134.900
89



VAR00004
組間
5.422
2
2.711
2.454
.092
組內
96.133
87
1.105


總和
101.556
89



VAR00005
組間
16.022
2
8.011
7.175
.001
組內
97.133
87
1.116


總和
113.156
89



VAR00006
組間
17.222
2
8.611
5.785
.004
組內
129.500
87
1.489


總和
146.722
89



VAR00007
組間
1.800
2
.900
.731
.484
組內
107.100
87
1.231


總和
108.900
89



VAR00008
組間
12.289
2
6.144
4.277
.017
組內
125.000
87
1.437


總和
137.289
89



VAR00009
組間
4.467
2
2.233
1.834
.166
組內
105.933
87
1.218


總和
110.400
89



VAR00010
組間
.156
2
.078
.059
.943
組內
114.333
87
1.314


總和
114.489
89



VAR00011
組間
7.800
2
3.900
3.512
.034
組內

總和
96.600

104.400
87

89
1.110

 






用anova找出有顯著性(<0.05)差異最大的兩組為 VAR00005(.001) 和  VAR00010(.943)

利用單一樣本t檢定找出第三組和第一二組差別時,得到以下數據

<1.3組>
組別統計量

VAR00001
個數
平均數
標準差
平均數的標準誤
VAR00005
dimension1
1.00
30
2.6667
1.24106
.22659
3.00
30
3.7000
.91539
.16713
VAR00010
dimension1
1.00

3.00
30

30
3.3000

3.3333
1.26355

.92227
.23069

.16838





獨立樣本檢定

變異數相等的 Levene 檢定
平均數相等的 t 檢定
F 檢定
顯著性
t
自由度
顯著性 (雙尾)
VAR00005
假設變異數相等
5.169
.027
-3.670
58
.001
不假設變異數相等


-3.670
53.348
.001
VAR00010
假設變異數相等

不假設變異數相等
4.859

.031

-.117

  -.117 
58

53.069
.907
.908



獨立樣本檢定

平均數相等的 t 檢定
平均差異
標準誤差異
差異的 95% 信賴區間
下界
上界
VAR00005
假設變異數相等
-1.03333
.28155
-1.59692
-.46974
不假設變異數相等
-1.03333
.28155
-1.59797
-.46870
VAR00010
假設變異數相等

不假設變異數相等
-.03333

-.03333
.28561

.28561
-.60504

-.60617
.53837

.53950
<2.3組>
組別統計量

VAR00001
個數
平均數
標準差
平均數的標準誤
VAR00005
dimension1
2.00
30
3.1667
.98553
.17993
3.00
30
3.7000
.91539
.16713
VAR00010
dimension1
2.00
3.00
30
30
3.2333
3.3333
1.22287
.92227
.22326
.16838



獨立樣本檢定

變異數相等的 Levene 檢定
平均數相等的 t 檢定
F 檢定
顯著性
t
自由度
顯著性 (雙尾)
VAR00005
假設變異數相等
.022
.882
-2.172
58
.034
不假設變異數相等


-2.172
57.687
.034
VAR00010
假設變異數相等
不假設變異數相等
2.426
.125
-.358
-.358
58
53.926
.722
.722




獨立樣本檢定

平均數相等的 t 檢定
平均差異
標準誤差異
差異的 95% 信賴區間
下界
上界
VAR00005
假設變異數相等
-.53333
.24557
-1.02490
-.04176
不假設變異數相等
-.53333
.24557
-1.02496
-.04171
VAR00010
假設變異數相等
不假設變異數相等
-.10000
-.10000
.27964
.27964
-.65976
-.66066
.45976
.46066


4.比較t檢定報表之不同,得到

*第三組的平均數,不論是 VAR00005 VAR00010,皆高於第一、二組。


沒有留言:

張貼留言