文華軒 » 統計 » 如何選擇統計方法和統計工具?

如何選擇統計方法和統計工具?

來源:文華軒網  作者: admin  時間:2012-09-20 09:20:14 網友投稿字體:[ ]

  如何選擇統計方法和統計工具?
1.連續性資料
1.1 兩組獨立樣本比較
1.1.1 資料符合正態分佈,且兩組方差齊性,直接採用t檢驗。
1.1.2 資料不符合正態分佈,(1)可進行資料轉換,如對數轉換等,使之服從正態分佈,然後對轉換後的資料採用t檢驗;(2)採用非參數檢驗,如Wilcoxon檢驗。
1.1.3 資料方差不齊,(1)採用Satterthwate 的t’檢驗;(2)採用非參數檢驗,如Wilcoxon檢驗。
1.2 兩組配對樣本的比較
1.2.1 兩組差值服從正態分佈,採用配對t檢驗。
1.2.2 兩組差值不服從正態分佈,採用wilcoxon的符號配對秩和檢驗。
1.3 多組完全隨機樣本比較
1.3.1資料符合正態分佈,且各組方差齊性,直接採用完全隨機的方差分析。如果檢驗結果為有統計學意義,則進一步作兩兩比較,兩兩比較的方法有LSD檢驗,Bonferroni法,tukey法,Scheffe法,SNK法等。
1.3.2資料不符合正態分佈,或各組方差不齊,則採用非參數檢驗的Kruscal-Wallis法。如果檢驗結果為有統計學意義,則進一步作兩兩比較,一般採用Bonferroni法校正P值,然後用成組的Wilcoxon檢驗。
1.4 多組隨機區組樣本比較
1.4.1資料符合正態分佈,且各組方差齊性,直接採用隨機區組的方差分析。如果檢驗結果為有統計學意義,則進一步作兩兩比較,兩兩比較的方法有LSD檢驗,Bonferroni法,tukey法,Scheffe法,SNK法等。
1.4.2資料不符合正態分佈,或各組方差不齊,則採用非參數檢驗的Fridman檢驗法。如果檢驗結果為有統計學意義,則進一步作兩兩比較,一般採用Bonferroni法校正P值,然後用符號配對的Wilcoxon檢驗。
****需要注意的問題:
(1) 一般來說,如果是大樣本,比如各組例數大於50,可以不作正態性檢驗,直接採用t檢驗或方差分析。因為統計學上有中心極限定理,假定大樣本是服從正態分佈的。
(2) 當進行多組比較時,最容易犯的錯誤是僅比較其中的兩組,而不顧其他組,這樣作容易增大犯假陽性錯誤的概率。正確的做法應該是,先作總的各組間的比較,如果總的來說差別有統計學意義,然後才能作其中任意兩組的比較,這些兩兩比較有特定的統計方法,如上面提到的LSD檢驗,Bonferroni法,tukey法,Scheffe法,SNK法等。**絕不能對其中的兩組直接採用t檢驗,這樣即使得出結果也未必正確**
(3) 關於常用的設計方法:多組資料儘管最終分析都是採用方差分析,但不同設計會有差別。常用的設計如完全隨即設計,隨機區組設計,析因設計,裂區設計,嵌套設計等。
2.分類資料
2.1 四格表資料
2.1.1 例數大於40,且所有理論數大於5,則用普通的Pearson 檢驗。
2.1.2 例數大於40,所有理論數大於1,且至少一個理論數小於5,則用校正的 檢驗或Fisher’s確切概率法檢驗。
2.1.3 例數小於40,或有理論數小於2,則用Fisher’s確切概率法檢驗。
2.2 2×C表或R×2表資料的統計分析
2.2.1 列變數&行變數均為無序分類變數,則(1)例數大於40,且理論數小於5的格子數目<總格子數目的25%,則用普通的Pearson 檢驗。(2)例數小於40,或理論數小於5的格子數目>總格子數目的25%,則用Fisher’s確切概率法檢驗。
2.2.2列變數為效應指標,且為有序多分類變數,行變數為分組變數,用普通的Pearson 檢驗只說明組間構成比不同,如要說明療效,則可用行平均分差檢驗或成組的Wilcoxon秩和檢驗。
2.2.3 列變數為效應指標,且為二分類變數,行變數為有序多分類變數,則可採用普通的Pearson 檢驗比較各組之間有無差別,如果總的來說有差別,還可進一步作兩兩比較,以說明是否任意兩組之間的差別都有統計學意義。
2.3 R×C表資料的統計分析
2.2.1 列變數&行變數均為無序分類變數,則(1)例數大於40,且理論數小於5的格子數目<總格子數目的25%,則用普通的Pearson 檢驗。(2)例數小於40,或理論數小於5的格子數目>總格子數目的25%,則用Fisher’s確切概率法檢驗。(3)如果要作相關性分析,可採用Pearson相關係數。
2.2.2列變數為效應指標,且為有序多分類變數,行變數為分組變數,用普通的Pearson 檢驗只說明組間構成比不同,如要說明療效或強弱程度的不同,則可用行平均分差檢驗或成組的Wilcoxon秩和檢驗或Ridit分析。
2.2.3 列變數為效應指標,且為無序多分類變數,行變數為有序多分類變數,則可採用普通的Pearson 檢驗比較各組之間有無差別,如果有差別,還可進一步作兩兩比較,以說明是否任意兩組之間的差別都有統計學意義。
2.2.4 列變數&行變數均為有序多分類變數,(1)如要做組間差別分析,則可用行平均分差檢驗或成組的Wilcoxon秩和檢驗或Ridit分析。如果總的來說有差別,還可進一步作兩兩比較,以說明是否任意兩組之間的差別都有統計學意義。(2)如果要做兩變數之間的相關性,可採用Spearson相關分析。
2.4 配對分類資料的統計分析
2.4.1 四格表配對資料,(1)b+c>40,則用McNemar配對 檢驗。(2)b+c<40,則用校正的配對 檢驗。
2.4.1 C×C資料,(1)配對比較:用McNemar配對 檢驗。(2)一致性檢驗,用Kappa檢驗。
在SPSS軟體相關分析中,pearson(皮爾遜), kendall(肯德爾) 和spearman(斯伯曼/斯皮爾曼)三種相關分析方法有什麼異同
兩個連續變數間呈線性相關時,使用Pearson積差相關係數,不滿足積差相關分析的適用條件時,使用Spearman秩相關係數來描述.
Spearman相關係數又稱秩相關係數,是利用兩變數的秩次大小作線性相關分析,對原始變數的分佈不作要求,屬於非參數統計方法,適用範圍要廣些。對於服從Pearson相關係數的資料亦可計算Spearman相關係數,但統計效能要低一些。Pearson相關係數的計算公式可以完全套用Spearman相關係數計算公式,但公式中的x和y用相應的秩次代替即可。
Kendall's tau-b等級相關係數:用於反映分類變數相關性的指標,適用於兩個分類變數均為有序分類的情況。對相關的有序變數進行非參數相關檢驗; 取值範圍在-1-1之間,此檢驗適合於正方形表格;
計算積距pearson相關係數,連續性變數才可採用;計算Spearman秩相關係數,適合於定序變數或不滿足正態分佈假設的等間隔數據; 計算Kendall秩相關係數,適合於定序變數或不滿足正態分佈假設的等間隔數據。
計算相關係數:當資料不服從雙變數正態分佈或總體分佈未知,或原始資料用等級表示時,宜用 spearman或kendall相關
Pearson 相關複選項 積差相關 計算連續變數或是等間距測度的變數間的相關分析
Kendall 複選項 等級相關 計算分類變數間的秩相關,適用於合併等級資料
Spearman 複選項 等級相關 計算斯皮爾曼相關,適用於連續等級資料
注:
1若非等間距測度的連續變數 因為分佈不明-可用等級相關/也可用Pearson 相關,對於完全等級離散變數必用等級相關
2當資料不服從雙變數正態分佈或總體分佈型未知或原始資料是用等級表示時,宜用 Spearman 或 Kendall相關。
3 若不恰當用了Kendall 等級相關分析則可能得出相關係數偏小的結論。則若不恰當使用,可能得相關係數偏小或偏大結論而考察不到不同變數間存在的密切關係。對一般情況默認資料服從正態分佈的,故用Pearson分析方法。
在SPSS媔i入Correlate-》Bivariate,在變數下麵Correlation Coefficients核取方塊組埵3個選項:
Pearson
Kendall's tau-b
Spearman:Spearman
spearman(斯伯曼/斯皮爾曼)相關係數
斯皮爾曼等級相關是根據等級資料研究兩個變數間相關關係的方法。它是依據兩列成對等級的各對等級數之差來進行計算的,所以又稱為“等級差數法”
斯皮爾曼等級相關對資料條件的要求沒有積差相關係數嚴格,只要兩個變數的觀測值是成對的等級評定資料,或者是由連續變數觀測資料轉化得到的等級資料,不論兩個變數的總體分佈形態、樣本容量的大小如何,都可以用斯皮爾曼等級相關來進行研究
Kendall's相關係數
肯德爾(Kendall)W係數又稱和諧係數,是表示多列等級變數相關程度的一種方法。適用這種方法的資料資料一般是採用等級評定的方法收集的,即讓K個評委(被試)評定N件事物,或1個評委(被試)先後K次評定N件事物。等級評定法每個評價者對N件事物排出一個等級順序,最小的等級序數為1 ,最大的為N,若並列等級時,則平分共同應該佔據的等級,如,平時所說的兩個並列第一名,他們應該佔據1,2名,所以它們的等級應是1.5,又如一個第一名,兩個並列第二名,三個並列第三名,則它們對應的等級應該是1,2.5,2.5,5,5,5,這2.5是2,3的平均,5是4,5,6的平均。
肯德爾(Kendall)U係數又稱一致性係數,是表示多列等級變數相關程度的一種方法。該方法同樣適用於讓K個評委(被試)評定N件事物,或1個評委(被試)先後K次評定N件事物所得的資料資料,只不過評定時採用對偶評定的方法,即每一次評定都要將N個事物兩兩比較,評定結果如下表所示,表格中空白位元元(陰影部分可以不管)填入的資料為:若i比j好記1,若i比j差記0,兩者相同則記0.5。一共將得到K張這樣的表格,將這K張表格重疊起來,對應位置的資料累加起來作為最後進行計算的資料,這些資料記為γij。
正態分佈的相關檢驗
對來自正態總體的兩個樣本進行均值比較常使用T檢驗的方法。T檢驗要求兩個被比較的樣本來自正態總體。兩個樣本方差相等與不等時用的計算T值的公式不同。
進行方差齊次性檢驗使用F檢驗。對應的零假設是:兩組樣本方差相等。P值小於0.05說明在該水準上否定原假設,方差不齊;否則兩組方差無顯著性差異。
U檢驗時用服從正態分佈的檢驗量去檢驗總體均值差異情況的方法。在這種情況下總體方差通常是已知的。
雖然T檢驗法與U檢驗法所解決的問題大體相同,但在小樣本(樣本數n)=30作為大樣本)且均方差未知的情況下就不能用U檢驗法了。
均值檢驗時不同的資料使用不同的統計量
使用MEANS過程求若干組的描述統計量,目的在於比較。因此必須分組求均值。這是與Descriptives過程不同之處。
檢驗單個變數的均值是否與給定的常數之間存在差異,用One-Sample T Test 單樣本T檢驗過程。
檢驗兩個不相關的樣本是否來自來具有相同均值的總體,用Independent-Samples T test 獨立樣本t檢驗過程。
如果分組樣本不獨立,用Paired Sample T test 配對t檢驗。
如果分組不止兩個,應使用One-Way ANOVO一元方差分析(用於檢驗幾個獨立的組,是否來自均值相等的總體)過程進行單變數方差分析。
如果試圖比較的變數明顯不服從正態分佈,則應該考慮使用一種非參數檢驗過程Nonparametric test.
如果用戶相比較的變數是分類變數,應該使用Crosstabs技術。
當樣本值不能為負值時用右側單邊檢驗。
文華軒公司提供spss、stata等統計分析服務,包括醫學統計、醫學資料處理等服務,如果有委託,請發email諮詢:haobole99@yahoo.com.tw
Email: haobole99@yahoo.com.tw
Tel: 0956068876
www.933.com.tw