如何讓不懂代碼的小白也能復用Python編碼成果?機器學習平臺來了!
2022-06-16 18:21:15
次
Tempo小課堂—Python擴展編程功能實用技巧第二篇來咯~
在上一期Tempo小課堂| 安利3個被數據分析師夸爆的Python編程小功能!中小T給大家介紹了如何在Tempo平臺擴展編程中通過3個提高Python編程易用性的小功能,來彌補Python原生編程在企業實際數據分析場景中的不足。
但企業的業務數據化轉型,當然不僅僅只和具備編碼能力的專業數據分析人員有關。在實際的企業業務數據分析場景中,比如我們Tempo大數據分析平臺的大量用戶,其實都是一線的普通業務人員。
這些“小白”普遍對于算法語言(如Python、R、Java、Scala等)并不了解,通常只能通過平臺內自帶的算法節點以拖拽的方法實現建模分析。
隨著業務數據分析維度的加深,往往就會出現一個尷尬的情況:
?需要處理的業務數據分析情況較為復雜,平臺內自帶的算法節點不夠用了,需要企業專業數據分析人員專門去開發業務相關的算法才能繼續推進。
?算法以算法語言(比如Python語言)形式呈現,業務人員既看不懂也不會用,新開發的算法需要封裝成算法節點的形式,業務人員才能夠上手使用。
?系統管理員對業務涉及的相關算法也不夠了解,無法快速完成對整個算子相關說明的封裝過程,且系統管理員的權限往往只存在于少部分人員,對于業務用戶和系統管理員雙方的溝通成本和工作量都比較大,過程繁瑣。
這時,我們就會發現,受限于編碼等專業技術門檻,在面對一些更為復雜的業務數據分析需求時,普通業務人員還是沒有辦法深度參與到分析過程中。
因此為了避免此類問題,很多企業希望將封裝算法的任務直接下發到與業務相關的算法設計人員,然后由系統管理員進行審核并管理,系統管理員只需審核通過或不通過,若審核不通過,則只需填寫審核原因,告知項目組的相關人員即可。
這樣一來不僅可以將數據平臺系統管理員從繁瑣、復制的自定義算法上傳、封裝、維護的重復性工作中釋放出來,還可以簡化相關溝通流程,讓業務相關人員可以直接對接相關需求,提高整體工作效率。

便捷點選操作 快速實現算法封裝
為了滿足大家在實際工作場景中的需求,Tempo平臺支持將Python編程節點發布為自定義算法,通過簡單幾步點選操作,即可快速將原創算法轉換為自定義算法節點,方便快捷。
以邏輯回歸算法為例,若用戶已經在Python編程實現了邏輯回歸的主要代碼,需要將其封裝為一個自定義算法,算子的配置界面中支持用戶設置正則化參數、最大迭代次數、懲罰函數類型3個參數,如下圖所示。
根據用戶角色的不同,具體算法封裝流程稍有不同。
普通設計用戶
在Tempo AI—挖掘分析—設計區—建模—Python編程節點,支持直接將Python編程的代碼發布為自定義算法;
參數配置
執行流程
設置好參數后,就可以進行流程執行。節點執行成功后,在節點上右鍵,則支持“發布為自定義算法”功能。
自定義算法配置
需要經過基本信息(填寫算法名稱、算法描述、上傳算法圖標)、元信息配置(設置輸入和輸出端口,輸入端口需要上傳數據集,輸出端口需要設置元信息)、測試(保證封裝的自定義算法可以正常使用)3個步驟,可提交“發布為自定義算法”的審核。
系統管理員
在Tempo AI-系統管理—挖掘平臺配置—算法管理—自定義算法管理—待審核中,可審核通過或不通過;
點擊“審核”,可以選擇讓該算法通過或不通過,若通過,則需要選擇該算法的目錄層級,則可進行發布等操作。若不通過,則需要填寫原因。審核結果都會以消息的方式提醒用戶。
此外,系統管理員還可對待審核、通過、未通過的算法進行查看、刪除操作。查看算子時,支持查看算子的基本信息、代碼、參數配置、輸入和輸出端口信息。
知識成果統一管理 提高工作效率
這個功能也能夠幫助企業完善算法成果的日常管理和知識資產的沉淀積累。
舉個例子,在企業或項目中,代碼偏好人員的算法成果,往往以代碼形式散落在個人電腦重,企業無法統一管理,甚至不清楚內部有多少成果,分別能夠解決哪方面的業務問題。
那么當人員發生變動,算法成果就脫離企業的掌控了,當遇到相似的場景分析需求時,往往無法順利復用已有算法成果,還是要從零開始梳理業務,進行重復性的代碼開發等,無形中造成資源、成本的浪費。
而通過Tempo平臺的代碼快速轉化為自定義算法的小功能,企業在日常項目管理中就可以輕松解決上述問題,還能在企業知識資產的積累過程中實現以下價值:
01、可以解決代碼化分析及管理的難題,并與已有算法功能可交叉使用,無縫融合,更靈活。
02、可以將內部已有歷史算法成果集成到平臺,統一管理及維護,進行算法成果沉淀,形成企業獨家內容資產。
03、在平臺形成封裝好的算法,業務人員可查看并直接拖拽使用,實現成果分享、資源復用,提升分析效率,降低學習門檻。
課后總結
今天的Tempo小課堂中,小T主要給大家介紹了如何通過Tempo平臺中的Python擴展編程功能簡化算法封裝節點流程,提高算法成果復用、知識沉淀相關工作的效率。
下一期,小T將會繼續給大家介紹,如何通過Tempo大數據分析平臺中的Python擴展編程功能,實現Python編程的性能提升,敬請期待!