服務熱線
400-608-2558
咨詢熱線
15502965860-
算法類型 | 功能節點 | 說明 |
數據預處理 | 提供對數據進行預處理功能,包括對數據的清洗、轉換、歸約、集成等,以便提高分析數據的質量。 | 行:數據過濾、排序、隨機抽樣、數據平衡、數據去重; 列:設置角色、重命名、屬性過濾、隨機數/ID生成、缺失值處理、數值型屬性變換、字符型屬性變換、日期型屬性變換; 高級:表轉置、 分類匯總、數據標準化、數據平滑、孤立點分析、RFM、季節解構、異常值檢測、自動數據處理、堆疊列、過程查詢分析器; 融合:數據連接、數據追加、數據拆分、數據分解、數據差集; 特征工程:屬性生成、主成分分析、因子分析、奇異值分解、分箱、變量選擇、自動特征、WOE編碼、數據分組、特征編碼、高級特征交叉。 |
分類 | 分類屬于預測任務,就是通過已有數據集(訓練集)的學習,得到一個目標函數f(模型),把每個屬性集x映射到目標屬性y(類),且y必須是離散的。 | 邏輯回歸分類、樸素貝葉斯、Xgboost分類、貝葉斯網絡分類、BP神經網絡分類、隨機森林分類、支持向量機分類、 CART、ID3分類、C45+決策樹分類、梯度提升決策樹分類、L1/2稀疏迭代分類、RBF神經網絡分類、KNN、線性判別分類、Adaboost分類、Bagging分類、DNN分類。 |
回歸 | 回歸是最常用的數值預測方法,它是在分析現象自變量和因變量之間相關關系的基礎上,建立變量之間的回歸方程,并將回歸方程作為預測模型,根據自變量在預測期的數量變化來預測因變量的值。 | 線性回歸、決策樹回歸、SVM回歸、梯度提升樹回歸、BP神經網絡回歸、保序回歸、曲線回歸、隨機森林回歸、L1/2稀疏迭代回歸、Bagging回歸、DNN回歸、LSTM回歸。 |
聚類 | 聚類分析僅根據在數據中發現的描述對象及其關系的信息,將數據對象分組。其目標是,組內的對象相互之間是相似的(相關的),而不同組中的對象是不同的(不相關的)。 | KMeans、模糊C均值、EM聚類、Hierarchy、Kohonen聚類、視覺聚類、Canopy、冪迭代。 |
關聯規則 | 關聯規則,指在交易數據、關系數據或其他信息載體中,查找存在于項目集合或對象集合之間的頻繁模式、關聯、相關性或因果結構。 | Apriori、FPGrowth、序列。 |
時間序列 | 時間序列通常是按時間順序排列的一系列被觀測數據(信息),其觀測值按固定的時間間隔采樣。研究人員作預測時,常以過去的歷史資料為依據,預測將來的變化。 | ARIMA、稀疏時間序列、指數平滑、移動平均、向量自回歸、X11、X12、回聲狀態網絡、灰色預測。 |
綜合評價 | 使用比較系統的、規范的方法對于多個指標、多個單位同時進行評價的方法,稱為綜合評價方法 | 熵值法、TOPSIS、層次分析法、模糊綜合評價法。 |
推薦 | 推薦是根據用戶興趣和行為特點,向用戶推薦所需的信息或商品,幫助用戶在海量信息中快速發現真正所需的商品。 | 協同過濾。 |
文本挖掘 | 文本挖掘是指從大量文本數據中抽取事先未知的、可理解的、最終可用的知識的過程,同時運用這些知識更好地組織信息以便將來參考。 | 分詞、信息抽取、文本過濾、向量空間、關鍵詞提取、主旨話題分析、觀點情感分析、垃圾違禁信息檢測、文本相似度、命名實體識別、文本摘要、詞頻統計、主題模型合并。 |
統計分析 | 提供統計分析方法,對通過調查獲取的各種數據及資料進行數理統計和分析,形成定性和定量的結論。 | 方差分析、相關系數、典型相關分析、偏向相關分析、相似度、描述數據特征、概率單位回歸。 |