首页 【精品】2010《华人性研究》编辑部发31

【精品】2010《华人性研究》编辑部发31

举报
开通vip

【精品】2010《华人性研究》编辑部发31第8章群集分析(fēnxī):基本概念與演算法            ©2008台灣培生教育(jiàoyù)出版(PearsonEducationTaiwan)第一页,共49页。群集分析(fēnxī)群集分析將資料分成許多有意義或有用的群體(群集)若以有意義的群體為目標,則群集應捕捉資料的基本結構。但在一些情況下,群集分析對其他應用而言只是一個起點而已,例如資料彙總不論是針對理解性(understanding)或使用性(utility)而言,群集分析在心理學與其他社會科學、生物學、統計學、樣式辨識(patternr...

【精品】2010《华人性研究》编辑部发31
第8章群集分析(fēnxī):基本概念與演算法            ©2008台灣培生教育(jiàoyù)出版(PearsonEducationTaiwan)第一页,共49页。群集分析(fēnxī)群集分析將資料分成許多有意義或有用的群體(群集)若以有意義的群體為目標,則群集應捕捉資料的基本結構。但在一些情況下,群集分析對其他應用而言只是一個起點而已,例如資料彙總不論是針對理解性(understanding)或使用性(utility)而言,群集分析在心理學與其他社會科學、生物學、統計學、樣式辨識(patternrecognition)、資訊檢索、機器學習與資料探勘等領域上,都扮演(bànyǎn)很重要的角色第二页,共49页。為理解(lǐjiě)而分群:生物(shēngwù)學(Biology)資訊檢索(informationretrieval)天氣心理學與醫學商業第三页,共49页。為使用(shǐyòng)而分群彙總(summarization)壓縮有效(yǒuxiào)地發掘最近鄰居第四页,共49页。什麼是群集分析(fēnxī)?群集分析是根據物件(wùjiàn)的資料,以及物件(wùjiàn)之間的關係資訊為基礎來進行物件(wùjiàn)的群集群集分析的目的是要使同群內的物件(wùjiàn)彼此相似(或相關)的,且與其他群中的物件(wùjiàn)不同(不相關)當群內的相似度(或同質性)很大,且群間的差異很大時,則有較好或更具區別性的群體第五页,共49页。以不同方式對相同集合(jíhé)之資料點做分群第六页,共49页。不同(bùtónɡ)的分群類型階層式的與分割式的:最常見的分群類型,是根據群集的集合為巢狀(nested)的或非巢狀的(unnested)來區分,而在傳統的術語中則稱為階層的或分割的互斥的與重疊的與模糊的:當指派每個物件至單一群集中(jízhōng),圖8.1中的分群為唯一的(exclusive)。有許多情況是一個點可被合理地指定到一個以上的群集中(jízhōng),這種情況最好是由非互斥分群(non-exclusiveclustering)來描述。在最一般的意義中,使用重疊的或非互斥分群可用來反應一個物件會同時屬於一個以上的群體(類別)完整的與部份的:完整分群(completeclustering)將每個物件指定至一個群集中(jízhōng),而部份分群(partialclustering)卻不是。部份分群的動機為資料集中(jízhōng)的一些物件可能不屬於已定義清楚(well-defined)的群集,許多在資料集中(jízhōng)的物件可被 关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf 示為雜訊(noise)、離群值(outlier)或「不有趣的背景」(uninterestingbackground)第七页,共49页。不同(bùtónɡ)的群集類型分散良好的(Well-Separated):群集是物件的集合,相較於其他不在群集中的物件,每個物件與群集中的其他物件會較接近(或很相似)。有時是使用門檻值來說明一個群中的所有物件必須彼此(bǐcǐ)是夠接近的(或相似的)。只要當資料包含自然的群集(naturalclusters)且彼此(bǐcǐ)是相距很遠的,這個群集的理想定義會被滿足第八页,共49页。不同(bùtónɡ)的群集類型以雛型為基礎的(Prototype-Based):群集是物件的集合,其中每個物件會接近(相當相似(xiānɡsì))所屬群集之雛型。針對連續屬性資料,群集的雛型通常為質量中心(centroid),即在群集中所有點的平均值(mean)。當質量中心沒有意義時,例如當資料有類別的屬性時,則雛型通常是medoid,亦即為群中最具代表性的點第九页,共49页。不同(bùtónɡ)的群集類型以圖形為基礎(Graph-Based):若資料表示成圖形,這裡的節點為物件,而鏈結表示物件之間的連結,則群集可被定義為連結的元件(connectedcomponent);即一群(yīqún)彼此相連的物件,但沒有和此群體外的物件相連第十页,共49页。不同(bùtónɡ)的群集類型以密度為基礎(Density-Based):群集為一個物件(wùjiàn)密集的區域且由低密度的區域所圍繞共享屬性(Shared-Property,概念的群集):一般來說,我們定義群集為物件(wùjiàn)的集合且共有一些屬性,這個定義包含之前所有群集的定義;例如,在以中心為基礎的群集中的物件(wùjiàn)共享一個特性,就是它們全部與相同的質量中心點(centroid)或medoid非常接近第十一页,共49页。準則(RoadMap)K-means:這是一個以雛型為主的分割式分群技術,以試圖找出使用者指定之群集個數(K),並以群中心為代表凝聚式層階分群法(AgglomerativeHierarchicalClustering):這個分群方法是指一群為緊密相關之分群技術,藉由每一點為一個單一群集開始,接著多次合併兩個最接近的群集,直到剩下包含所有群集之單一群集為止,以產生階層式分群DBSCAN:這是以密度(mìdù)為基礎的分群演算法,可以產生分割式分群,其分群數可由演算法自動決定,在低密度(mìdù)區域的點會被歸類為雜訊而被省略;因此,DBSCAN不能產生完整的分群第十二页,共49页。利用(lìyòng)二維之資料點說明不同類型的群集第十三页,共49页。K-means以雛形為基礎之群集技術可建立具有(jùyǒu)一個階層之資料分割,這樣的技術有一些,但最常見的兩個技術是K-means與K-medoid。K-means使用雛型的中心,通常是一群資料點的平均,且典型地被應用於連續n維度空間的物件上。K-medoid使用雛型之中心點,以一個最具代表性的點來表示一群資料點,可應用的範圍很廣,因為它需要對成一對的資料點做鄰近值測量,使得中心點不會對應至實際的資料點,而中心點根據其定義必須是實際的資料點第十四页,共49页。使用(shǐyòng)K-means演算法來找尋樣本資料中的三個群集第十五页,共49页。K-means:其他(qítā)議題處理空的群集:之前基本K-means演算法的問題是,在分配步驟執行間,若沒有資料點被分配到群集,則會得到空的群集。若這個問題發生,則需要一個策略去選擇一個替代的中心點,否則平方誤差將會很大離群值:當平方誤差評估準則被使用時,離群值會影響所發現的群集。尤其,當離群值出現時,所產生的群集中心點(雛型)就可能不具(bùjù)代表性,所以SSE也會較高,因為這樣,預先發掘離群值並刪除它們通常是有用的第十六页,共49页。K-means:其他(qítā)議題減少SSE與後處理:一個用來減少SSE的顯著方法是去找尋多個群集,即使用較大的K。然而,在許多情況中,我們可能會去改善SSE,但不會要去增加群集的數量,這通常是可能的,因為K-means基本上會收斂到一個區域最小值。有很多技術可用來改進所產生的群集,以產生有較小SSE的分群(fēnqún),這樣的策略是著重於個別的群集,因為總和SSE為每個群集對SSE貢獻的加總第十七页,共49页。藉由增加(zēngjiā)群集數量以減少總和SSE的策略分裂(fēnliè)群集:有最大SSE值的群集通常會被選擇,但也可針對某一個特定屬性,將群體根據最大的標準差進行分割提出新的群集中心點:通常會選擇遠離任何群中心的點。若記錄每個點對SSE的貢獻,則可以很簡單地決定這個點。另一個方法是從所有的點中隨機選擇或從有最大SSE的點選擇第十八页,共49页。總和SSE的增量(zēnɡliànɡ)最小化時,減少群集數量的策略解散群集:這個是藉由移除群集所對應之中心點,以及重新分配資料點給其他群集來達成。理想上,被分散的群集會增加總和SSE合併兩個群集:基本上會選擇最近的群中心,雖然其他方法是去合併兩個群集,使得總和SSE有最小增量兩個合併策略是相同的,皆使用(shǐyòng)在階層式分群技術,如中心點方法和Ward’smethod第十九页,共49页。遞增式更新中心點:為了取代在分配所有的資料點至群集後才會更新群中心的方式,我們可以(kěyǐ)在每一次分配點給群中心後就進行更新。要注意的是:因為資料點會移動到新的群集(兩次更新),或停留在它現在的群集(零次更新),因此每一步驟需要零次或兩次更新。第二十页,共49页。K-means與不同(bùtónɡ)類型的群集K-means和它的變型在找尋不同類型的群集時有一些限制,尤其(yóuqí)是當群集是非球型(non-sphericalshapes),或有各種不同之大小或密度時。K-means在發現「自然的」(natural)群集會有困難第二十一页,共49页。有不同(bùtónɡ)大小之K-means群集第二十二页,共49页。有不同(bùtónɡ)密度之K-means群集第二十三页,共49页。非球狀之K-means群集第二十四页,共49页。優點與缺點K-means很簡單且廣泛地使用在各種不同的資料型態上,即使執行多次也同樣是相當有效率的。一些變型,包含bisectingK-means,會更有效率且不會受到初始問題的影響K-means並不適用於所有類型的資料,它不能處理非球狀(non-globular)的群集,或是有不同大小與密度(mìdù)之群集,然而若有足夠多的群集,基本上它可以找到乾淨的子群集對有包含離群值之資料,K-means在做分群時會有困難K-means會因為中心(中心點)的標示而受資料的限制,相關技術-K-medoid分群法並沒有這個限制,但是成本很昂貴第二十五页,共49页。凝聚(níngjù)式階層分群階層分群技術(hierarchicalclusteringtechniques)是第二重要的分群方法(fāngfǎ)類別如同K-means,這些方法(fāngfǎ)和許多分群演算法比起來相對較久遠,但它們仍然被廣泛使用第二十六页,共49页。產生階層分群(fēnqún)的方法凝聚式的(Agglomerative):將資料點當成個別群集開始,在每一步驟,合併最接近的一組群集。這需要定義群集鄰近值(clusterproximity)的概念分裂式的(Divisive):從包含所有群集開始,在每一步驟,分割一個群集直到個別資料點仍留在單獨的群集中(jízhōng)為止。在這個情況下,需要決定在每一步驟中哪一個群集要被切割,以及如何做切割第二十七页,共49页。階層分群法通常可用樹狀圖表示(稱為dendrogram),可顯示群集-子群集的關係,以及群集被合併(凝聚(níngjù)式觀點)或分割(分裂式觀點)順序。第二十八页,共49页。四個資料點的階層分群(fēnqún)以樹狀圖和巢狀群集表示第二十九页,共49页。基本的凝聚(níngjù)式階層分群演算法第三十页,共49页。完全(wánquán)鏈結或MAX或CLIQUE針對完全鏈結(completelink)或階層式分群的MAX版本,兩個群集的鄰近值被定義為在兩個不同群集中任意兩個點之間的最大距離(最小相似度)使用圖形的專有名詞來看,若把所有點當成單一群(yīqún)集開始,每次在兩個點之間加入一個鏈結,最短鏈結優先加入,直到所有的點在群集中,且完全地連結為止,即形成clique完全鏈結不易受雜訊或離群值的影響,但它可分割大的群集並支持球狀群集第三十一页,共49页。6個點之完全(wánquán)鏈結分群第三十二页,共49页。群平均(píngjūn)針對階層分群(fēnqún)的群平均(groupaverage)版本,兩個群集的鄰近定義為在不同群集中所有兩兩資料點之間的平均成對鄰近值(averagepairwiseproximity)這是介於單一鏈結(singlelink)與完全鏈結(completelink)方法之間的中間方法第三十三页,共49页。6個資料點的群平均分群第三十四页,共49页。階層分群法的重要(zhòngyào)議題缺乏全域目標函數處理不同群集大小(dàxiǎo)之能力最後的合併決策第三十五页,共49页。DBSCAN以密度為基礎之分群法(density-basedclustering)會找出遠離低密度區域之高密度的區域DBSCAN為一個簡單且有效(yǒuxiào)之以密度為基礎分群演算法第三十六页,共49页。傳統的密度定義方法(fāngfǎ):以中心點為基礎之方法(fāngfǎ)以中心點為基礎的方法中,會對資料集合中的特定(tèdìng)點,計算點的某個Eps範圍內點的數量來估計密度。這也包含點本身第三十七页,共49页。以中心(zhōngxīn)點為基礎之密度第三十八页,共49页。核心(héxīn)點、邊緣點與雜訊點第三十九页,共49页。DBSCAN演算法根據之前對核心點、邊緣點以及雜訊點的定義,DBSCAN演算法可解釋如下:任何足夠接近的兩個核心點(在彼此的Eps距離中)是會被放入同一(tóngyī)群集。同樣地,任何與核心點足夠接近的邊緣點會被放入相同群集中當成核心點(若邊緣點是接近不同群集之核心點,則必須解決其關連)1:Labelallpointsascore,border,ornoisepoints.2:Eliminatenoisepoints.3:PutanedgebetweenallcorepointsthatarewithinEpsofeachother.4:Makeeachgroupofconnectedcorepointsintoaseparatecluster.5:Assigneachborderpointtooneoftheclustersofitsassociatedcorepoints.第四十页,共49页。DBSCAN的優點與缺點由於DBSCAN使用以密度為基礎之群集定義,使得DBSCAN相對地較能抵抗雜訊,且能處理任意形狀和大小的群集DBSCAN可以發現許多K-means無法發現的群集當群集有不同密度時,DBSCAN的執行會有困難,同時在高維度的資料中執行也會有困難,因為很難定義資料的密度在高維度資料中,因為最近鄰近點需要先計算所有資料兩兩的鄰近值,所以(suǒyǐ)DBSCAN就非常耗時第四十一页,共49页。群集評估在發展監督式分類模型的過程中,分類模型的評估為一個不可缺少的部份,且這裡有完全被接受(jiēshòu)的評估方法和程序,例如正確性(accuracy)和交叉驗證(cross-validation)因為群集評估(clusterevaluation)的本質,因而沒有很好的發展或是常被使用於群集分析中,但群集評估(或傳統上稱為群集驗證,clustervalidation)是很重要的第四十二页,共49页。為了能區分資料中的非隨機結構(non-randomstructure)是否為群集驗證中的重要概念,以下(yǐxià)是關於群集驗證的一些重要議題:決定資料集合群集趨勢,即識別非隨機結構是否真的存在資料中決定群集的正確數量評估群集分析結果與資料有多符合,而不必參考外部資訊將外部已知結果,如外部提供的類別標記,與群集分析結果比較比較兩個集合的群集以決定哪一個比較好第四十三页,共49页。判斷分群(fēnqún)正確性的評估測量方法非監督式(unsupervised):測量分群結構不需使用到外部資訊,SSE即為一例監督式(supervised):測量哪個群集演算法發掘的分群結構會與一些外部結構相配比較式(relative):比較不同(bùtónɡ)的分群法或群集。比較群集的評估方法有監督式,或用於比較目的之非監督評估方法第四十四页,共49页。群集內聚力與分散力之圖形觀點第四十五页,共49页。以圖形為基礎之群集的測量方法(fāngfǎ)列表第四十六页,共49页。側影係數側影係數(silhouettecoefficient)方法是結合內聚力和分散力,下面步驟解釋如何對個別的點計算側影係數,其流程是由下列三個步驟所組成。我們可使用距離,但也可使用類似相似度的方法:對第i個物件,計算它至群集內所有(suǒyǒu)點的平均距離,稱這個值為ai。對第i個物件和任何沒有包含這個物件的群集,計算它至特定群集內所有(suǒyǒu)物件之平均距離,找到所有(suǒyǒu)群集的最小值bi。對第i個物件,其側影係數為si=(bi-ai)/max(ai,bi)。第四十七页,共49页。SkVnZq$u*x-A2D5G8KbNfQiTlXo#r%v(y0B3E6I9LcOgRjUmYp!t&w)z1C4F7JaMePhSkWnZq$u*x+A2D5H8KbNfQiUlXo#s%v(y0B3F6I9LdOgRjVmYq!t&w-z1C4G7JbMePhTkWnZr$u*x+A2E5H8KcNfQiUlXp#s%v)y0B3F6IaLdOgSjVmYq!t*w-z1D4G7JbMeQhTkWoZr$u(x+B2E5H9KcNfRiUmXp#s&v)y0C3F7IaLdPgSjVnYq!t*w-A1D4G8JbMeQhTlWoZr%u(x+B2E6H9KcOfRiUmXp!s&v)z0C3F7IaMdPgSkVnYq$t*x-A1D5G8JbNeQiTlWo#r%u(y+B2E6H9LcOfRjUmXp!s&w)z0C4F7IaMdPhSkVnZq$t*x-A2D5G8KbNeQiTlXo#r%v(y+B3E6I9LcOgRjUmYp!t&w)z1C4F7JaMePhSkWnZq$u*x-A2D5H8KbNfQiTlXo#s%v(y0B3E6I9LdOgRjVmYp!t&w-z1C4G7JaMePhTkWnZr$u*x+A2E5H8KcNfQiUlXp#s%v)y0B3F6I9LdOgSjVmYq!t&w-z1D4G7JbMePhTkWoZr$u(x+A2E5H9KcNfRiUlXp#s&v)y0C3F6IaLdPgSjVnYq!t*w-A1D4G8JbMeQhTkWoZr%u(x+B2E5H9KcOfRiUmXp#s&v)z0C3F7IaLdPgSkVnYq$t*w-A1D5G8JbNeQhTlWo#r%u(y+B2E6H9LcOfRjUmXp!s&w)z0C4F7IaMdPgSkVnZq$t*x-A1D5G8KbNeQiTlWo#r%v(y+B3E6H9LcOgRjUmYp!s&w)z1C4F7JaMdPhSkWnZq$u*x-A2D5H8KbNfQiTlXo#r%v(y0B3E6I9LcOgRjVmYp!t&w)z1C4G7JaMePhSkWnZr$u*x+A2D5H8KcNfQiUlXo#s%v)y0B3F6I9LdOgSjVmYq!t&w-z1C4G7JbMePhTkWnZr$u(x+A2E5H8KcNfRiUlXp#s%v)y0C3F6IaLdOgSjVnYq!t*w-z1D4cNfQiUlXo#s%v)y0B3F6I9LdOgRjVmYq!t&w-z1C4G7JbMePhTkWnZr$u(x+A2E5H8KcNfRiUlXp#s%v)y0C3F6IaLdOgSjVnYq!t*w-z1D4G8JbMeQhTkWoZr$u(x+B2E5H9KcNfRiUmXp#s&v)y0C3F7IaLdPgSjVnYq$t*w-A1D4G8JbNeQhTlWoZr%u(y+B2E6H9KcOfRjUmXp!s&v)z0C4F7IaMdPgSkVnYq$t*x-A1D5G8JbNeQiTlWo#r%u(y+B3E6H9LcOfRjUmYp!s&w)z0C4F7JaMdPhSkVnZq$u*x-A2D5G8KbNfQiTlXo#r%v(y+B3E6I9LcOgRjUmYp!t&w)z1C4F7JaMePhSkWnZq$u*x+A2D5H8KbNfQiUlXo#s%v(y0B3F6I9LdOgRjVmYq!t&w-z1C4G7JbMePhTkWnZr$u*x+A2E5H8KcNfQiUlXp#s%v)y0B3F6IaLdOgSjVmYq!t*w-z1D4G7JbMeQhTkWoZr$u(x+B2E5H9KcNfRiUmXp#s&v)y0C3F6IaLdPgSjVnYq!t*w-A1D4G8JbMeQhTlWoZr%u(x+B2E6H9KcOfRiUmXp!s&v)z0C3F7IaMdPgSkVnYq$t*x-A1D5G8JbNeQhTlWo#r%u(y+B2E6H9LcOfRjUmXp!s&w)z0C4F7IaMdPhSkVnZq$t*x-A2D5G8KbNeQiTlXo#r%v(y+B3E6I9LcOgRjUmYp!t&w)z1C4F7JaMdPhSkWnZq$u*x-A2D5H8KbNfQiTlXo#s%v(y0B3E6I9LdOgRjVmYp!t&w-z1C4G7JaMePhTkWnZr$u*x+A2E5H8KcNfQiUlXo#s%v)y0B3F6I9LdOgSjVmYq!t&w-z1D4G7JbMePhTkWoZr$u(B3E6I9LdOgRjVmYp!t&w-z1C4G7JaMePhTkWnZr$u*x+A2D5H8KcNfQiUlXo#s%v)y0B3F6I9LdOgSjVmYq!t&w-z1D4G7JbMePhTkWoZr$u(x+A2E5H9KcNfRiUlXp#s&v)y0C3F6IaLdOgSjVnYq!t*w-z1D4G8JbMeQhTkWoZr%u(x+B2E5H9KcOfRiUmXp#s&v)z0C3F7IaLdPgSkVnYq$t*w-A1D5G8JbNeQhTlWoZr%u(y+B2E6H9KcOfRjUmXp!s&v)z0C4F7IaMdPgSkVnZq$t*x-A1D5G8KbNeQiTlWo#r%v(y+B3E6H9LcOgRjUmYp!s&w)z1C4F7JaMdPhSkVnZq$u*x-A2D5G8KbNfQiTlXo#r%v(y0B3E6I9LcOgRjVmYp!t&w)z1C4G7JaMePhSkWnZr$u*x+A2D5H8KcNfQiUlXo#s%v(y0B3F6I9LdOgRjVmYq!t&w-z1C4G7JbMePhTkWnZr$u(x+A2E5H8KcNfRiUlXp#s%v)y0C3F6IaLdOgSjVnYq!t*w-z1D4G7JbMeQhTkWoZr$u(x+B2E5H9KcNfRiUmXp#s&v)y0C3F7IaLdPgSjVnYq$t*w-A1D4G8JbNeQhTlWoZr%u(y+B2E6H9KcOfRjUmXp!s&v)z0C3F7IaMdPkWoZr$u(x+B2E5H9KcNfRiUmXp#s&v)y0C3F7IaLdPgSjVnYq$t*w-A1D4G8JbNeQhTlWoZr%u(x+B2E6H9KcOfRiUmXp!s&v)z0C3F7IaMdPgSkVnYq$t*x-A1D5G8JbNeQiTlWo#r%u(y+B3E6H9LcOfRjUmYp!s&w)z0C4F7JaMdPhSkVnZq$t*x-A2D5G8KbNeQiTlXo#r%v(y+B3E6I9LcOgRjUmYp!t&w)z1C4F7JaMePhSkWnZq$u*x+A2D5H8KbNfQiUlXo#s%v(y0B3E6I9LdOgRjVmYp!t&w-z1C4G7JaMePhTkWnZr$u*x+A2E5H8KcNfQiUlXp#s%v)y0B3F6IaLdOgSjVmYq!t*w-z1D4G7JbMeQhTkWoZr$u(x+A2E5H9KcNfRiUlXp#s&v)y0C3F6IaLdPgSjVnYq!t*w-A1D4G8JbMeQhTlWoZr%u(x+B2E6H9KcOfRiUmXp!s&v)z0C3F7IaLdPgSkVnYq$t*w-A1D5G8JbNeQhTlWo#r%u(y+B2E6H9LcOfRjUmXp!s&w)z0C4FMeQhTlWoZr%u(x+B2E5H9KcOfRiUmXp#s&v)z0C3F7IaLdPgSkVnYq$t*w-A1D5G8JbNeQhTlWo#r%u(y+B2E6H9LcOfRjUmXp!s&w)z0C4F7IaMdPhSkVnZq$t*x-A1D5G8KbNeQiTlWo#r%v(y+B3E6H9LcOgRjUmYp!s&w)z1C4F7JaMdPhSkWnZq$u*x-A2D5H8KbNfQiTlXo#s%v(y0B3E6I9LcOgRjVmYp!t&w)z1C4G7JaMePhSkWnZr$u*x+A2D5H8KcNfQiUlXo#s%v)y0B3F6I9LdOgSjVmYq!t&w-z1D4G7JbMePhTkWoZr$u(x+A2E5H8KcNfRiUlXp#s%v)y0C3F6IaLdOgSjVnYq!t*w-z1D4G8JbMeQhTkWoZr%u(x+B2E5H9KcOfRiUmXp#s&v)z0C3F7IaLdPgSjVnYq$t*w-A1D4G8JbNeQhTlWoZr%u(y+B2E6H9KcOfRjUmXp!s&v)z0C4F7IaMdPgSkVnZq$t*x-A1D5G8KbNeQiTlWo#r%u(y+B3E6H9LcOfRjUmYp!s&w)z0C4F7JaMdPhSkVnZq$u*x-A2H9KcOfRjUmXp!s&v)z0C4F7IaMdPgSkVnZq$t*x-A1D5G8JbNeQiTlWo#r%u(y+B3E6H9LcOfRjUmYp!s&w)z0C4F7JaMdPhSkVnZq$u*x-A2D5G8KbNfQiTlXo#r%v(y0B3E6I9LcOgRjUmYp!t&w)z1C4F7JaMePhSkWnZq$u*x+A2D5H8KbNfQiUlXo#s%v(y0B3F6I9LdOgRjVmYq!t&w-z1C4G7JbMePhTkWnZr$u(x+A2E5H8KcNfQiUlXp#s%v)y0B3F6IaLdOgSjVmYq!t*w-z1D4G7JbMeQhTkWoZr$u(x+B2E5H9KcNfRiUmXp#s&v)y0C3F7IaLdPgSjVnYq!t*w-A1D4G8JbMeQhTlWoZr%u(x+B2E6H9KcOfRiUmXp!s&v)z0C3F7IaMdPgSkVnYq$t*x-A1D5G8JbNeQiTlWo#r%u(y+B2E6H9LcOfRjUmXp!s&w)z0C4F7IaMdPhSkVnZq$t*x-A2D5G8KbNeQiTlXo#r%v(y+B3EMdPgSkVnYq$t*x-A1D5G8JbNeQhTlWo#r%u(y+B2E6H9LcOfRjUmXp!s&w)z0C4F7IaMdPhSkVnZq$t*x-A2D5G8KbNeQiTlXo#r%v(y+B3E6I9LcOgRjUmYp!s&w)z1C4F7JaMdPhSkWnZq$u*x-A2D5H8KbNfQiTlXo#s%v(y0B3E6I9LdOgRjVmYp!t&w-z1C4G7JaMePhTkWnZr$u*x+A2E5H8KcNfQiUlXo#s%v)y0B3F6I9LdOgSjVmYq!t&w-z1D4G7JbMePhTkWoZr$u(x+A2E5H9KcNfRiUlXp#s&v)y0C3F6IaLdPgSjVnYq!t*w-z1D4G8JbMeQhTkWoZr%u(x+B2E5H9KcOfRiUmXp#s&v)z0C3F7IaLdPgSkVnYq$t*w-A1D5G8JbNeQhTlWo#r%u(y+B2E6H9KcOfRjUmXp!s&v)z0C4F7IaMdPgSkVnZq$t*B2E5H9KcOfRiUmXp#s&v)z0C3F7IaLdPgSkVnYq$t*w-A1D5G8JbNeQhTlWoZr%u(y+B2E6H9KcOfRjUmXp!s&v)z0C4F7IaMdPgSkVnZq$t*x-A1D5G8KbNeQiTlWo#r%v(y+B3E6H9LcOgRjUmYp!s&w)z0C4F7JaMdPhSkVnZq$u*x-A2D5G8KbNfQiTlXo#r%v(y0B3E6I9LcOgRjVmYp!t&w)z1C4G7JaMePhSkWnZr$u*x+A2D5H8KcNfQiUlXo#s%v(y0B3F6I9LdOgRjVmYq!t&w-z1C4G7JbMePhTkWnZr$u(x+A2E5H8KcNfRiUlXp#s%v)y0C3F6IaLdOgSjVn第四十八页,共49页。内容(nèiróng)总结第8章。離群值:當平方誤差評估準則被使用時,離群值會影響所發現的群集。DBSCAN可以(kěyǐ)發現許多K-means無法發現的群集。比較式(relative):比較不同的分群法或群集。t&w-z1C4G7JbMePhTkWnZr$u(x+A2E5H8KcNfRiUlXp#s%v)y0C3F6IaLdOgSjVn第四十九页,共49页。
本文档为【【精品】2010《华人性研究》编辑部发31】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
个人认证用户
志宏
暂无简介~
格式:ppt
大小:983KB
软件:PowerPoint
页数:49
分类:修理服务/居民服务
上传时间:2021-12-01
浏览量:1