Viewpoint: 11/17

很多次樣本平均數這時候母群的平均數會在所有樣本平均數的中間裡面（例如：母群範圍1-10，平均數為5.5，樣本平均數會在1-10之間。）

平均數的考驗(Test) 1 – 10 例如抽取五個數字其樣本平均數為8 又可能為同母群抽出，但若為8.2不可能為同一母群 1-10 抽五個數平均值最高為8

兩個母群兩個樣本找出屬於哪一個種類的錯誤A或B類

單因子分析：兩個樣本是否為同一母群

班級為40個人的態度良表最低分為1分最高分為5分

ANOVA 組區間為組別-1(每一組的區間有幾個)

自由度為數量-1(最後一個的自由度為 0 )

顯著性P值：推論發生錯誤的機率(第一類錯誤的機率)

(假設發生錯誤的機率；例 <0.05；錯誤率為<5% 正確率>95%；

則推論測試組為同一母群的機率>95%)

獨立樣本檢定：顯著式(雙尾檢定) 表示左右/2 為上限與下限的機率。

T檢定－平均差異數檢定

（1）使用時機：
　      A 獨立樣本T檢定：比較單一樣本中，平均值與某一定值間之差異。
　      B 成對樣本T檢定：比較兩組樣本的平均值間是否存在差異。
（2）前提假設：
         A 虛無假設：H0：μ1＝μ2，即兩母體平均數相同。
         B 對立假設：H1：μ1≠μ2，即兩母體平均數不相同。
　　è若H1：μ1≠μ2時，需進行「雙尾檢定」；若H1：μ1＞μ2或μ1＜μ2時，則進行「雙尾檢

定」。C T檢定的結果不是拒絕H0，就是接受H0。在檢定時可能會犯兩種錯誤：　當H0

應該要被接受時，卻被推翻；當H0 應該被推翻時，卻被接受。
（3）有時候得到的T值會是極端值，比在P值得到的更為極端。例如在95％的信賴區間上，

若P值小於0.05，則會推翻H0；在99％的信賴區間上，若P值小於0.01，則會推翻H0虛

無假設。

實驗運用亂數 INT(RAND()*5+1)；INT(RAND()*3+2) 兩組不同的母群取得樣本30個

做分析時(ANOVA)發現，因母群的差異使得顯著性變化為0.00由此可以證實不為相同母群。

顯著性差異(significance level)，當數據之間具有了顯著性差異，就說明參與比對的數據不是來自於同一總體（Population），而是來自於具有差異的兩個不同總體，這種差異可能因參與比對的數據是來自不同實驗對象的。

顯著性差異是一種有量度的或然性評價。比如，我們說A、B兩數據在.05水平上具備顯著性差異，這是說兩組數據具備顯著性差異的可能性為95％。兩個數據所代表的樣本還有5％的可能性是沒有差異的。這5％的差異是由於隨機誤差造成的。

實驗結果達到.05水平或.01水平，才可以說數據之間具備了顯著性差異。在作結論時，應確實描述方向性（例如顯著大於或顯著小於）。

顯著性:發生機率多大。
希望正確率是99.5%，所以就是0.05的誤差。

希望正確率是99%，所以所以就是 0.01的誤差。

理論上我們這次做的不應該有顯著性

顯著性用來推論發生錯誤的機率。推論又叫假設(hypothesis)，發生錯誤的機率是小於0.05(有顯著)。所以是對的。

如果大於.05，就代表他們發現錯誤的機率是一樣的，你就不能說他們是不一樣的(沒有顯著)。

95% p<0.05*

99% p<0.01**

99.9% p <0.001***

例1：
一班30人次的問卷量表，量表分數最低1分，最高5分。共三組(90人)。
其自由度(df)=89，即
組間=2(3組-1組)
組內=89(90人-1人)
df=89-2=87

同一母群產生的值，其顯著性(p:推論發生錯誤的機率），只針對第一類型錯誤作觀察。

假設三組其中有人為不同母群產生，看p值，如<0.05 ，則發生錯誤的機率<5%，正確率>95%，則表示沒有顯著差異，即三組為同一母群的數值。

如果改變第三組資料，將分數1.2置換成較高分的4.5則得到以下數據

ANOVA
		平方和	自由度	平均平方和	F	顯著性
VAR00002	組間	7.022	2	3.511	2.471	.090
	組內	123.600	87	1.421
	總和	130.622	89
VAR00003	組間	8.467	2	4.233	2.913	.060
	組內	126.433	87	1.453
	總和	134.900	89
VAR00004	組間	5.422	2	2.711	2.454	.092
	組內	96.133	87	1.105
	總和	101.556	89
VAR00005	組間	16.022	2	8.011	7.175	.001
	組內	97.133	87	1.116
	總和	113.156	89
VAR00006	組間	17.222	2	8.611	5.785	.004
	組內	129.500	87	1.489
	總和	146.722	89
VAR00007	組間	1.800	2	.900	.731	.484
	組內	107.100	87	1.231
	總和	108.900	89
VAR00008	組間	12.289	2	6.144	4.277	.017
	組內	125.000	87	1.437
	總和	137.289	89
VAR00009	組間	4.467	2	2.233	1.834	.166
	組內	105.933	87	1.218
	總和	110.400	89
VAR00010	組間	.156	2	.078	.059	.943
	組內	114.333	87	1.314
	總和	114.489	89
VAR00011	組間	7.800	2	3.900	3.512	.034
VAR00011	組內總和	96.600 104.400	87 89	1.110

用anova找出有顯著性（<0.05）差異最大的兩組為 VAR00005(.001) 和 VAR00010(.943)

利用單一樣本t檢定找出第三組和第一二組差別時，得到以下數據

<1.3組>

組別統計量
	VAR00001		個數	平均數	標準差	平均數的標準誤
VAR00005	dimension1	1.00	30	2.6667	1.24106	.22659
VAR00005	dimension1	3.00	30	3.7000	.91539	.16713
VAR00010	dimension1	1.00 3.00	30 30	3.3000 3.3333	1.26355 .92227	.23069 .16838

獨立樣本檢定
		變異數相等的 Levene 檢定		平均數相等的 t 檢定
		F 檢定	顯著性	t	自由度	顯著性 (雙尾)
VAR00005	假設變異數相等	5.169	.027	-3.670	58	.001
VAR00005	不假設變異數相等			-3.670	53.348	.001
VAR00010	假設變異數相等不假設變異數相等	4.859	.031	-.117 -.117	58 53.069	.907 .908

獨立樣本檢定
		平均數相等的 t 檢定
		平均差異	標準誤差異	差異的 95% 信賴區間
		平均差異	標準誤差異	下界	上界
VAR00005	假設變異數相等	-1.03333	.28155	-1.59692	-.46974
VAR00005	不假設變異數相等	-1.03333	.28155	-1.59797	-.46870
VAR00010	假設變異數相等不假設變異數相等	-.03333 -.03333	.28561 .28561	-.60504 -.60617	.53837 .53950

<2.3組>

組別統計量
	VAR00001		個數	平均數	標準差	平均數的標準誤
VAR00005	dimension1	2.00	30	3.1667	.98553	.17993
VAR00005	dimension1	3.00	30	3.7000	.91539	.16713
VAR00010	dimension1	2.00 3.00	30 30	3.2333 3.3333	1.22287 .92227	.22326 .16838

獨立樣本檢定
		變異數相等的 Levene 檢定		平均數相等的 t 檢定
		F 檢定	顯著性	t	自由度	顯著性 (雙尾)
VAR00005	假設變異數相等	.022	.882	-2.172	58	.034
VAR00005	不假設變異數相等			-2.172	57.687	.034
VAR00010	假設變異數相等不假設變異數相等	2.426	.125	-.358 -.358	58 53.926	.722 .722

獨立樣本檢定
		平均數相等的 t 檢定
		平均差異	標準誤差異	差異的 95% 信賴區間
		平均差異	標準誤差異	下界	上界
VAR00005	假設變異數相等	-.53333	.24557	-1.02490	-.04176
VAR00005	不假設變異數相等	-.53333	.24557	-1.02496	-.04171
VAR00010	假設變異數相等不假設變異數相等	-.10000 -.10000	.27964 .27964	-.65976 -.66066	.45976 .46066

4.比較t檢定報表之不同，得到

*第三組的平均數，不論是 VAR00005 或 VAR00010，皆高於第一、二組。

Viewpoint

2010年11月28日星期日

11/17

沒有留言:

張貼留言

2010年11月28日 星期日

11/17

沒有留言:

張貼留言

2010年11月28日星期日