视频一区二区三区蜜桃麻豆,久久久久人妻一区精品性色av,欧洲精品码一区二区三区免费看

產品簡介

美林新聞/NEWS

首頁美林數據行業資訊

【數據建模工具】數據處理算法講解之主成分分析

2022-09-23 14:54:55 次

主成分分析常用于社會科學、市場調研和使用大型數據集的其他行業數據建模分析中處理數據，用來從大數據集形成較小數量的不相關變量。在一系列數據分析中，通常將主成分分析作為其中的一個步驟。主成分分析的目的是為了使用最少數量的主成分來解釋最大量的方差。可以使用主成分分析減少變量數目并避免多重共線性，也可以在相對于觀測值數目而言有太多預測變量時使用主成分分析。
?算法思想
主成分分析PCA（Principal Component Analysis）是一種常用的機器學習數據預處理的分析方法，給定原始特征空間，通過線性變換找到更低維度空間的線性映射，常用于高維數據的降維，PCA具備保守方差最大和重構誤差最小的優良特性。PCA算法步驟為：
（1）數據0均值化:
將每一列數據減去對應的均值得到0均值矩陣方便下一步的協方差矩陣求解。

（2）計算協方差矩陣:
以矩陣X（0均值化處理）為例：

由于X經過0均值化處理，所以可以求出方差和協方差：

由此可得：

那么，由可得協方差矩陣為：

（3）計算協方差矩陣的特征向量:
對協方差矩陣做奇異值分解，找到矩陣滿足為對角陣，那么對角值為協方差矩陣的特征值，為特征值對應的特征向量。對特征值進行降序排列，選取特征值前n（主成分個數）個對應特征向量構建矩陣為成分矩陣。

（4）數據降維
根據成分矩陣可以將原始數據進行降維操作：

?數據格式

數值型字段；

?參數說明

參數	類型	描述
選擇變量	列表框	用戶指定需要進行主成分分析的屬性列，需要指定大于1個的變量作為主成分分析的對象
提取方法	下拉框	按照因子數、累積貢獻度的方式進行主成分分析。
因子數	文本框	當提取方法為因子數時，用戶直接指定需要分解的因子數。默認為1。
累積貢獻度	文本框	當提取方法為累積貢獻度時，用戶直接指定需要貢獻度的大小。默認為90%。

?結果說明

屬性列“pre_vector”為需要進行主成分分析的原始列集合；
屬性列“Pca_Vector”為經過主成分分析后的變換列；
?演示實例
利用Tempo機器學習平臺構建如下流程：

【文件輸入】節點配置如下：

【主成分分析】節點配置如下：

Tempo機器學習平臺流程運行結果如下所示：

上一篇：企業需要關注的12項數據和分析趨勢下一篇：企業培養數據分析團隊所需的技能和能力

夜夜爽一区二区三区精品,精品一区二区三区免费毛片爱,日本美女一区二区三区,色窝窝无码一区二区三区色欲

Tempo大數據分析平臺

Tempo商業智能平臺

Tempo人工智能平臺

Tempo數據工廠平臺

Tempo數據治理平臺

Tempo主數據管理平臺

Tempo指標平臺

自助式可視化分析

算法模型管理

指標管理解決方案

數字指揮中心

湖倉一體解決方案

智能場景應用構建

主數據應用監管

數據中臺

數據資產入表

發電

電網

制造

油氣

煤炭

高校

政企

金融

科研院所

大數據分析師

DAMA認證

美林數據

合作生態

內容中心

幫助中心

美林新聞

行業資訊

產品簡介

Tempo商業智能平臺

Tempo人工智能平臺

Tempo數據工廠平臺

Tempo指標平臺

Tempo數據治理平臺

Tempo主數據管理平臺

相關推薦

美林新聞/NEWS

【數據建模工具】數據處理算法講解之主成分分析

聯系我們

400-608-2558 029-8669-8003

掃碼關注我們

掃碼立即咨詢