夜夜爽一区二区三区精品,精品一区二区三区免费毛片爱,日本美女一区二区三区,色窝窝无码一区二区三区色欲

美林數據
ABOUT US
美林數據技術股份有限公司(簡稱:美林數據,NEEQ:831546)是國內知名的數據治理和數據分析服務提供商。

美林新聞/NEWS

首頁 美林數據 行業資訊

【數據建模工具】數據處理算法分享之孤立點分析

2022-10-09 17:56:33
孤立點是指數據集中的那些小模式數據,其可能是度量或執行錯誤所導致的,或固有數據中的特異樣本點。是基于聚類的、分析多維數據集的孤立點檢測方法。先是將數據集中的所有樣本按照某種聚類算法做初步聚類,然后根據聚類信息(包括類內距、類間距、類中心等),計算每一樣本點屬于孤立點的程度,最終根據所屬程度的排序確定指定數量的孤立點。
一、算法思想
孤立點分析,又稱離群點檢測,多維空間中基于聚類的離群點診斷方法從綜合分析的角度,通過聚類和計算樣本點與數據組群之間的距離,以及距離遠近的判斷,實現里全店的診斷以及離群點成因的分析。
離群點分析包括三個階段:第一階段是聚類,即根據“親疏程度”將樣本聚成若干類;第二階段是計算離群度,即在第一階段聚類結果的基礎上,依據距離度量(這里是對數似然距離),計算所有樣本點的異常性測度指標值(這里是離群度);第三階段是診斷,即在第二階段異常性度量值的基礎上,確定最終的離群點,并分析導致這些樣本點異常的原因,也就是分析離群點主要在哪些變量方向上呈現異常。以下就這三個階段分別討論。
?第一階段
計算距離閾值與樣本聚類,主要如下:
首先是計算距離閾值,其值在CF樹生長的過程中會被用到。距離閾值的計算公式為:
數據建模工具
其中,數據建模工具為每個數值型列的取值范圍(即max-min );數據建模工具為各名詞列屬性的取值個數。
然后將所有輸入變量視為聚類變量,進行CF樹聚類,生成一棵完整的聚類樹,其每個葉子結點表示一個聚類。這里的CF樹是個二叉樹,其每個結點存儲了所含樣本的統計信息,具體包括:結點內所有樣本點的數值屬性向量和V,所有樣本點的數值屬性向量平方和SV,所含樣本點數及各樣本ID,以及所含樣本點名詞列的各取值個數統計。
?第二階段
第二階段的任務是在第一階段聚類結果及其統計信息的基礎上,計算各樣本點的離群測度指標值,包括組差異指標GDI、變量差異指標VDI、異常指標值AI及變量貢獻指標VCM。
?第三階段
第二階段計算得到了所有樣本點的GDI、VDI、AI和VCM,本階段將依據這些指標的排序結果,確定離群點并分析離群點異常的原因。
① 將AI按照降序排序,排在前m位的樣本點可能是離群點。同時,m位置的AI值就是離群點的判斷標準。大于該值的為離群點,小于為非離群點。
② 對于離群點,將VDI按照降序排序,排在前L位的變量是導致該點可能異常的主要原因。
二、數據格式

  • 數值型和字符型字段;
三、參數說明
數據挖掘分析

參數 類型 描述
選擇變量 列表框 用戶指定需要進行孤立點分析的屬性列,屬性列的數據類型為數值型
選擇方法 下拉框 提供按照數量和按照比例等方式進行孤立點樣本個數篩選。當按比例指定孤立點個數時,需設置比例大小數值。當按數量指定孤立點個數時,需設置數量的具體數值,默認選擇按照數量
數量 文本框 設置按照數量方式進行孤立點樣本篩選的個數,正整數,默認值為5
比例大小 文本框 設置按照比例方式進行孤立點樣本篩選的比例,正數,取值范圍:(0,1],默認值為0.01
導致孤立點異常的最主要列個數 文本框 對于多維數據集,算法除了識別出孤立點外,還能夠分析每個孤立點異常的列原因。該參數用于指定要分析前多少個導致孤立點異常的主要因素列,正整型,默認值為1。
四、結果說明
數據建模
屬性列“isExceptional”表明樣本是否為異常孤立點樣本;
屬性列“exceptionCol_1”表明導致異常孤立點的第1個主要因素列;
屬性列“exceptionCol1_degree”表明導致異常孤立點的第1個主要因素列的度;
五、演示實例
通過Tempo機器學習平臺構建如下流程:
Tempo機器學習平臺
【文件輸入】節點配置如下:
Tempo機器學習平臺
【孤立點分析】節點配置如下:
Tempo機器學習平臺
流程運行結果如下:
數據挖掘建模


服務熱線
400-608-2558
咨詢熱線
15502965860-
美林數據
微信掃描二維碼,立即在線咨詢
夜夜爽一区二区三区精品,精品一区二区三区免费毛片爱,日本美女一区二区三区,色窝窝无码一区二区三区色欲

  • <center id="vcica"><optgroup id="vcica"></optgroup></center>
  • 主站蜘蛛池模板: 欧美成人高清| 一区二区三区四区国产精品| 黑人一区二区| 国产一区清纯| 精品91久久久久| 在线国产精品播放| 亚洲国产欧美国产综合一区| 亚洲欧洲中文日韩久久av乱码| 亚洲国产一区视频| 亚洲欧洲在线一区| 一区二区三区高清不卡| 亚洲影视在线| 午夜精品免费在线| 久久久最新网址| 欧美激情第8页| 欧美三日本三级少妇三2023 | 香蕉久久夜色精品| 久久er99精品| 欧美aaaaaaaa牛牛影院| 欧美电影在线免费观看网站| 欧美日韩在线大尺度| 国产精品一区在线观看| 国产综合色一区二区三区| 亚洲国内高清视频| 亚洲丝袜av一区| 久久国产乱子精品免费女 | 亚洲综合国产精品| 欧美一区午夜精品| 免费一级欧美片在线播放| 欧美精品尤物在线| 国产精品午夜电影| 精品动漫3d一区二区三区| 日韩亚洲精品在线| 午夜亚洲福利| 欧美成人激情视频| 国产精品v日韩精品v欧美精品网站| 国产欧美一区二区三区沐欲 | 国产欧美日韩精品丝袜高跟鞋| 一区二区亚洲欧洲国产日韩| 亚洲美女av在线播放| 性色av一区二区三区|