第十章 分類分析

  文件類別:其它

  文件格式:文件格式

  文件大小:25K

  下載次數(shù):86

  所需積分:1點(diǎn)

  解壓密碼:qg68.cn

  下載地址:[下載地址]

清華大學(xué)卓越生產(chǎn)運(yùn)營總監(jiān)高級(jí)研修班

綜合能力考核表詳細(xì)內(nèi)容

第十章 分類分析
第十章 分類分析 第一節(jié) K-Means Cluster過程 10.1.1 主要功能 10.1.2 實(shí)例操作 第二節(jié) Hierarchical Cluster過程 10.2.1 主要功能 10.2.2 實(shí)例操作 第三節(jié) Discriminant過程 10.3.1 主要功能 10.3.2 實(shí)例操作 人們認(rèn)識(shí)事物時(shí)往往先把被認(rèn)識(shí)的對象進(jìn)行分類,以便尋找其中同與不同的特征,因而 分類學(xué)是人們認(rèn)識(shí)世界的基礎(chǔ)科學(xué)。在醫(yī)學(xué)實(shí)踐中也經(jīng)常需要做分類的工作,如根據(jù)病 人的一系列癥狀、體征和生化檢查的結(jié)果,判斷病人所患疾病的類型;或?qū)σ幌盗袡z查 方法及其結(jié)果,將之劃分成某幾種方法適合用于甲類病的檢查,另幾種方法適合用于乙 類病的檢查;等等。統(tǒng)計(jì)學(xué)中常用的分類統(tǒng)計(jì)方法主要是聚類分析與判別分析。 聚類分析是直接比較各事物之間的性質(zhì),將性質(zhì)相近的歸為一類,將性質(zhì)差別較大的歸 入不同的類。判別分析則先根據(jù)已知類別的事物的性質(zhì),利用某種技術(shù)建立函數(shù)式,然 后對未知類別的新事物進(jìn)行判斷以將之歸入已知的類別中。聚類分析與判別分析有很大 的不同,聚類分析事先并不知道對象類別的面貌,甚至連共有幾個(gè)類別也不確定;判別 分析事先已知對象的類別和類別數(shù),它正是從這樣的情形下總結(jié)出分類方法,用于對新 對象的分類。 第一節(jié) K-Means Cluster過程 10.1.1 主要功能 調(diào)用此過程可完成由用戶指定類別數(shù)的大樣本資料的逐步聚類分析。所謂逐步聚類分析 就是先把被聚對象進(jìn)行初始分類,然后逐步調(diào)整,得到最終分類。 返回目錄[pic] [pic]返回全書目錄 10.1.2 實(shí)例操作 [例10.1]為研究兒童生長發(fā)育的分期,調(diào)查1253名1月至7歲兒童的身高(cm)、體重 (kg)、胸圍(cm)和坐高(cm)資料。資料作如下整理:先把1月至7歲劃成19個(gè)月份 段,分月份算出各指標(biāo)的平均值,將第1月的各指標(biāo)平均值與出生時(shí)的各指標(biāo)平均值比較 ,求出月平均增長率(%),然后第2月起的各月份指標(biāo)平均值均與前一月比較,亦求出 月平均增長率(%),結(jié)果見下表。欲將兒童生長發(fā)育分為四期,故指定聚類的類別數(shù)為 4,請通過聚類分析確定四個(gè)兒童生長發(fā)育期的起止區(qū)間。 |月份 |月平均增長率(%) | | |身高 |體重 |胸圍 |坐高 | |1 |11.03 |50.30 |11.81 |11.27 | |2 |5.47 |19.30 |5.20 |7.18 | |3 |3.58 |9.85 |3.14 |2.11 | |4 |2.01 |4.17 |1.47 |1.58 | |6 |2.13 |5.65 |1.04 |2.11 | |8 |2.06 |1.74 |0.17 |1.57 | |10 |1.63 |2.04 |1.04 |1.46 | |12 |1.17 |1.60 |0.89 |0.76 | |15 |1.03 |2.34 |0.53 |0.89 | |18 |0.69 |1.33 |0.48 |0.58 | |24 |0.77 |1.41 |0.52 |0.42 | |30 |0.59 |1.25 |0.30 |0.14 | |36 |0.65 |1.19 |0.49 |0.38 | |42 |0.51 |0.93 |0.16 |0.25 | |48 |0.73 |1.13 |0.35 |0.55 | |54 |0.53 |0.82 |0.16 |0.34 | |60 |0.36 |0.52 |0.19 |0.21 | |66 |0.52 |1.03 |0.30 |0.55 | |72 |0.34 |0.49 |0.18 |0.16 | 10.1.2.1 數(shù)據(jù)準(zhǔn)備 激活數(shù)據(jù)管理窗口,定義變量名:雖然月份分組不作分析變量,但為了更直觀地了解聚 類結(jié)果,也將之輸入數(shù)據(jù)庫,其變量名為month;身高、體重、胸圍和坐高的變量名分別 為x1、x2、x3和x4,輸入原始數(shù)額。 10.1.2.2 統(tǒng)計(jì)分析 激活Statistics菜單選Classify中的K-Means Cluster...項(xiàng),彈出K-Means Cluster Analysis對話框(如圖10.1示)。從對話框左側(cè)的變量列表中選x1、x2、x3、x4,點(diǎn)擊 (鈕使之進(jìn)入Variables框;在Number of Clusters(即聚類分析的類別數(shù))處輸入需要聚合的組數(shù),本例為4;在聚類方法上有兩 種:Iterate and classify指先定初始類別中心點(diǎn),而后按K- means算法作疊代分類,Classify only指僅按初始類別中心點(diǎn)分類,本例選用前一方法。 | | |[pic] | |圖10.1 逐步聚類分析對話框 | 為在原始數(shù)據(jù)庫中逐一顯示分類結(jié)果,點(diǎn)擊Save...鈕彈出K-Means Cluster:Save New Variables對話框,選擇Cluster membership項(xiàng),點(diǎn)擊Continue鈕返回K-Means Cluster Analysis對話框。 本例還要求對聚類結(jié)果進(jìn)行方差分析,故點(diǎn)擊Options...鈕彈出K-Means Cluster:來Options對話框,在Statistics欄中選擇ANOVA table項(xiàng),點(diǎn)擊Continue鈕返回K-Means Cluster Analysis對話框,再點(diǎn)擊OK鈕即完成分析。 10.1.2.3 結(jié)果解釋 在結(jié)果輸出窗口中將看到如下統(tǒng)計(jì)數(shù)據(jù): 首先系統(tǒng)根據(jù)用戶的指定,按4類聚合確定初始聚類的各變量中心點(diǎn),未經(jīng)K- means算法疊代,其類別間距離并非最優(yōu);經(jīng)疊代運(yùn)算后類別間各變量中心值得到修正。 |Initial Cluster Centers. | |Cluster X1 X2 X3 X4 | |1 11.0300 50.3000 11.8100 11.2700| |2 5.4700 19.3000 5.2000 7.1800| |3 3.5800 9.8500 3.1400 2.1100| |4 .3400 .4900 .1800 .1600| | | |Convergence achieved due to no or small distance change. | |The maximum distance by which any center has changed is | |.0000 | |Current iteration is 2 | | | |Minimum distance between initial centers is 10.5200 | | | |Iteration Change in Cluster Centers | |1 2 3 4 | |1 .0000 .0000 2.46E+00 1.27E+00 | |2 .0000 .0000 .0000 .0000 | | | |Case listing of Cluster membership. | |Case ID Cluster Distance | |1 1 .000 | |2 2 .000 | |3 3 2.457 | |4 4 3.219 | |5 3 2.457 | |6 4 1.530 | |7 4 1.346 | |8 4 .515 | |9 4 .915 | |10 4 .266 | |11 4 .281 | |12 4 .668 | |13 4 .467 | |14 4 .844 | |15 4 .415 | |16 4 .873 | |17 4 1.215 | |18 4 .619 | |19 4 1.269 | | | |Final Cluster Centers. | |Cluster X1 X2 X3 X4 | |1 11.0300 50.3000 11.8100 11.2700| |2 5.4700 19.3000 5.2000 7.1800| |3 2.8550 7.7500 2.0900 2.1100| |4 .9060 1.4660 .4820 .6560| | | 之后對聚類結(jié)果的類別間距離進(jìn)行方差分析,方差分析表明,類別間距離差異的概率值 均
第十章 分類分析
 

[下載聲明]
1.本站的所有資料均為資料作者提供和網(wǎng)友推薦收集整理而來,僅供學(xué)習(xí)和研究交流使用。如有侵犯到您版權(quán)的,請來電指出,本站將立即改正。電話:010-82593357。
2、訪問管理資源網(wǎng)的用戶必須明白,本站對提供下載的學(xué)習(xí)資料等不擁有任何權(quán)利,版權(quán)歸該下載資源的合法擁有者所有。
3、本站保證站內(nèi)提供的所有可下載資源都是按“原樣”提供,本站未做過任何改動(dòng);但本網(wǎng)站不保證本站提供的下載資源的準(zhǔn)確性、安全性和完整性;同時(shí)本網(wǎng)站也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的損失或傷害。
4、未經(jīng)本網(wǎng)站的明確許可,任何人不得大量鏈接本站下載資源;不得復(fù)制或仿造本網(wǎng)站。本網(wǎng)站對其自行開發(fā)的或和他人共同開發(fā)的所有內(nèi)容、技術(shù)手段和服務(wù)擁有全部知識(shí)產(chǎn)權(quán),任何人不得侵害或破壞,也不得擅自使用。

 我要上傳資料,請點(diǎn)我!
 管理工具分類
COPYRIGT @ 2001-2018 HTTP://fanshiren.cn INC. ALL RIGHTS RESERVED. 管理資源網(wǎng) 版權(quán)所有