夜夜爽一区二区三区精品,精品一区二区三区免费毛片爱,日本美女一区二区三区,色窝窝无码一区二区三区色欲

美林數據
ABOUT US
美林數據技術股份有限公司(簡稱:美林數據,NEEQ:831546)是國內知名的數據治理和數據分析服務提供商。

大話數據挖掘之聚類分析(下篇)

2021-02-02 15:59:00
人物介紹
許教授:國內數據挖掘專家、某985高校智能信息處理學術帶頭人
趙總:某電力公司總經理
萬總:某超市集團營銷副總
李部長:某鋼鐵集團生產部部長
 
某985高校管理學院第五屆EMBA班的《數據挖掘及其應用》課程上。
國內數據挖掘專家、智能信息處理學術帶頭人徐教授站在講臺上打開PPT說:“同學們,大家好!今天我們接著上一節課關于聚類分析的內容展開。”
徐教授:“上節課我們講了k-Means算法和k-Medoids算法的第一個不足。第二個不足就是這兩種算法不適用于發現非球狀的簇。原因是這類算法使用距離來描述數據之間的相似性,但是,對于非球狀數據集,只用距離來描述是不夠的。”
“那遇到非球狀的聚類問題可怎么辦呢?”萬總問道。
徐教授答道:“對于這種情況,要用密度來代替相似性設計聚類算法,這就是基于密度的聚類算法即Density-based Method?;诿芏鹊乃惴◤臄祿ο蟮姆植济芏瘸霭l,把密度足夠大的區域連接起來,從而可以發現任意形狀的簇,而且此類算法還能夠有效去除噪聲。常見的基于密度的聚類算法有DBSCAN,OPTICS,DENCLUE等。”
李部長已經沉默了好長時間,他擔心萬總又有什么問題影響徐教授的教學進度,趕緊插話道:“徐老師,您剛才說還有一種層次方法,這種聚類方法的思想……”
徐教授:“好,我現在就介紹一下層次方法即Hierarchical Method的基本思想。這種方法按數據分層建立簇,形成一棵以簇為節點的樹。如果自底向上進行層次聚集,則稱為凝聚的(Aggalomerative)層次聚類;如果自頂向下的進行層次分解,則稱為分裂法(Divisive)的層次聚類。”
徐教授潤了潤嗓子,繼續講道:“凝聚的層次聚類首先將每個對象作為一個簇,然后逐漸合并這些簇形成較大的簇,直到所有的對象都在同一個簇中,或者滿足某個終止條件。分裂的層次聚類與之相反,它首先將所有的對象置于一個簇中,然后逐漸劃分為越來越小的簇,直到每個對象自成一簇,或者達到了某個終止條件,例如達到了某個希望的簇數目,或兩個最近的簇之間的距離超過了一定的閾值。”
李部長一直認真地聽著,不斷地點頭表示他明白了層次聚類的思想。隨后,他提問道:“徐老師,層次聚類算法有什么缺點?”
徐教授:“層次方法可以在不同粒度水平上對數據進行探測,而且容易實現相似度量或距離度量。但是,單純的層次聚類算法的終止條件含糊,而且執行合并或分裂簇的操作不可修正,這很可能導致聚類結果質量很低。另外,由于需要檢查和估算大量的對象或簇才能決定簇的合并或分裂,所以這種方法的可擴展性較差。因此,通常在解決實際聚類問題時要把層次方法與其他方法結合起來。層次方法和其他聚類方法的有效結合可以形成多階段聚類,能夠改善聚類質量。這類方法包括BIRCH、CURE、ROCK、Chameleon算法等。”
李部長迫不及待地說:“徐老師,您剛才講了這么多聚類方法,我發現它們有一個共同的缺點,就是算法無法回答數據對象到底可以聚集為多少類,據說你們研究團隊發明了一種視覺聚類算法,很好地解決了這一問題。我們幾個人昨天晚上還打賭,我說您今天肯定會講視覺聚類算法,可都要快下課了,您根本沒有提及視覺兩字。我們都等不及了,您還是讓我們大家欣賞一下視覺聚類的神奇魅力吧!”
說到視覺聚類算法,徐教授臉上露出了會心的微笑。
“好的。視覺聚類算法是基于我們所建立的尺度空間理論建立的,運用這種算法可以對衛星傳回的原始圖像進行分析,把具有相似屬性的事物聚到同一簇中,例如將其用于香港地區地表高精度遙感圖像聚類、混雜遙感圖像中線狀目標如地震帶、高速公路、機場跑道等目標識別等。”
李部長聽到這里,激動得跳了起來:“徐老師,看來視覺聚類算法有可能用于我們板材表面條紋、夾雜、重皮等質量問題的自動檢測,我們試試吧!”
蛋白質分析
蛋白質分析

 
徐教授接著說:“李部長的聯想很豐富呀,國內外不少已經將這種方法試驗過了。美國喬治亞大學Lan小組、美國馬里蘭大學DeMenthon小組、中科環境與地理信息重點實驗室等先后將視覺聚類算法用于地理數據的圖像處理,還有比利時Namur大學著名的化學家Leherte教授所領導的實驗室將視覺聚類算法應用到生物計算,進行胃蛋白酶配合體的匹配、分子電流密度函數、蛋白質分子的結構表達等研究。”
趙總:“徐老師,視覺聚類算法可太有用了,真棒!”
徐教授非常高興:“不謙虛地說,視覺聚類算法確實有其獨到之處,其基本思想非常獨特:將數據集看作圖像,將數據建模問題看作認知問題,通過模擬認知心理學的格式塔原理原理與生物視覺原理解決問題。”
“且慢且慢,什么是格式塔原理?”李部長打斷了徐教授的話語。
徐教授翻動了一下PPT:“很簡單,格式塔原理就是物體的整體是由局部特征組織在一起的認知原則,請看屏幕。”


格式塔原理

“我們將相似率、連續率、閉合率、近鄰率和對稱率作為聚類的基本原則,模擬人的眼睛由近到遠觀察景物的過程設計算法進行聚類。隨著人由近及遠,也就是觀察尺度由小變大,所看到的景物的層次會逐漸變化,實際上這就是一個聚類的過程。”徐教授邊說邊翻了一下PPT。

聚類分析

李部長聽得如醉如癡,看著PPT上視覺聚類的示意圖,突然,他冒出了一個新的問題:“徐老師,我明白了,在近處,所聚的類會很多,在遠處,所聚的類會很少,在很遠處,所看到的東西就成為一個類別了。您說,到底聚為多少類最為合適呢?”
徐教授點了點頭:“李部長的雙核腦袋就是轉得快,一下子問道了視覺聚類的關鍵。隨著尺度σ由小變大,聚類的個數在發生變化,但會出現尺度σ在很大范圍內變化,而聚類的個數卻穩定不變的情況。這個聚類個數存活周期最長,它就是最佳的聚類個數!”
“太妙了,視覺聚類理論通過引進類的生存壽命概念,給出了類的認知定義,解決了聚類有效性問題。數學上嚴格證明了結構的因果性即類的演化單調性,由此形成了尺度空間聚類的一般性理論框架。”李部長流利地對視覺聚類進行了總結。
徐教授對李部長的話感到納悶:“李部長,你不是做數據挖掘研究的,不可能給出這么深刻的總結吧!”
李部長笑了笑:“嘿嘿,這是我從網上看到的有人對視覺聚類方法的評價。”
下課鈴響了,徐教授邊合上電腦邊說:“聚類方法我們就簡單學習到這兒,下一節可咱們一起討論數據挖掘非常重要的內容——預測。”
“今天關于關聯規則挖掘的內容就介紹到這里。同學們,下節課見!”

服務熱線
400-608-2558
咨詢熱線
15502965860-
美林數據
微信掃描二維碼,立即在線咨詢
夜夜爽一区二区三区精品,精品一区二区三区免费毛片爱,日本美女一区二区三区,色窝窝无码一区二区三区色欲

  • <center id="vcica"><optgroup id="vcica"></optgroup></center>
  • 主站蜘蛛池模板: 狼人社综合社区| 国产精品99久久久久久有的能看| 国内精品久久久久国产盗摄免费观看完整版| 欧美日韩一区二区在线播放| 欧美美女bb生活片| 欧美三级特黄| 国产精品一区二区你懂的| 黑人操亚洲美女惩罚| 国产美女扒开尿口久久久| 国产精品一区二区三区久久 | 国产欧美一区二区视频| 国产老肥熟一区二区三区| 国产视频综合在线| 狠狠88综合久久久久综合网| 亚洲第一精品夜夜躁人人爽| 亚洲黄页一区| 中文精品一区二区三区| 亚洲欧美精品在线观看| 久久精品亚洲精品| 欧美国产综合| 国产精品国产三级国产aⅴ无密码| 国产精品视频一二| 伊人狠狠色j香婷婷综合| 亚洲日本激情| 亚洲一卡久久| 久久精品欧洲| 欧美人成免费网站| 国产精品每日更新| 影音先锋欧美精品| 99re66热这里只有精品3直播| 亚洲制服丝袜在线| 葵司免费一区二区三区四区五区| 欧美精品自拍偷拍动漫精品| 国产精品五月天| 亚洲国产精品va| 中文无字幕一区二区三区| 久久精品国产亚洲一区二区三区| 欧美激情精品久久久久久变态| 国产精品久久久久91| 在线观看成人av电影| 国产精品99久久久久久久vr|