上海天天选四今天开奖

寄云工業數據分析建模

寄云 DAStudio 是面向工程數據分析人員的全流程數據建模分析平臺,對接豐富的海量工業數據源,快速構建數據模型和數據對象,支持拖拽式、零代碼、敏捷式的算法模型開發。提供海量數據預處理、機器學習和人工智能建模分析以及模型在線部署能力。

「工程數據分析」面對的挑戰
數據來源繁雜

需要從多種數據源中手動的挑選各種結構化、非結構化以及實時數據,并通過SQL代碼實現數據關聯,效率很低。

無法實現海量數據分析

能支持少量離線數據分析,面臨海量實時/非實時數據的挑戰。

數據質量低

對于很多原始數據,需要耗費大量精力執行格式轉換、過濾、填充在內的各種清洗和預處理。

算法開發門檻高

不具備專業的算法工程師,因此無法實現代碼級別的算法開發,無法完成深層次的分析任務。

不支持在線分析和預測分析

目前很多數據分析工具,都只能實現有限的、離線的統計分析,無法實現海量數據的在線分析和實時的預測;無法對離線分析結果進行自動部署。

不支持機器學習和人工智能

部分分析工具只能支持統計分析,無法實現海量數據的機器學習和人工智能模型的開發、訓練、測試、評估。

無法實現協作

不同團隊開發的模型和算法,無法被其他人所使用,知識無法實現傳遞。

寄云工業數據分析建模平臺特點
支持豐富的數據源

支持對接多種不同類型的數據源,屏蔽底層的連接細節/數據量,而將來自不同數據源的數據抽象成可直接被分析的數據對象。

支持海量數據的全流程分析

支持可擴展的并行計算引擎,支持海量數據的數據準備、數據處理、組件開發、訓練模型、部署任務功能

支持在線部署

可以直接對接各種實時數據流,實現在線分析。

低門檻,易操作

整個建模流程設計基于拖拽式布局、連線式流程編排和指導式參數配置,使用者根據業務需要快速完成建模分析,并且每步的操作執行結果支持可視化顯示。

組件可擴展,支持團隊協作

用戶可上傳自己寫好的組件,也可訂閱其他用戶公開的組件進行建模分析。

數據集管理

數據集管理 可以對接文件、Hive, HBase, PG, MySQL 、MongoDB等多種數據源,并支持將多種數據源綁定為一個數據集進行后續的分析工作。

數據模型/數據對象管理

可以將物理世界中的設備,流程抽象成一個數據模型,每個數據模型可以實例化成多個數據對象,定義好的數據對象可以直接作為組件在分析工程中使用。

分析組件

數據預處理(去重,過濾缺失值,自定義過濾,插值,類型轉換,時間戳類型轉換,特征分桶,重命名,自動分箱,標準化,歸一化,PCA等),特征工程(時域頻域變換、小波變化、ButterWorth濾波等),機器學習算法(KMeans,BisectingKMeans,GaussianMixture, 線性回歸,決策樹回歸,GBT回歸,SVM分類,決策樹分類等),建模(訓練模型,交叉驗證,應用模型)。

分析工作流

用戶可以使用拖拽式、可視化對選擇的組件進行連接以構建自己的分析流。分析工作流可以按步驟運行,執行結果會保存到對應的每個組件實例里,并提供可視化的執行結果。建模組件支持網格參數最優模型選擇。

實時在線模型部署和分析

分析完成的模型,可以通過在線部署,對接到實時的數據源上,并構建分析任務,實現實時的分析。

模型目錄

用戶上傳和發布并分享的算法模型組件,可以在模型目錄里被其他用戶訂閱并使用,可直接使用在分析工程中,能夠與其他組件進行連接。

產品價值
簡化了分析工作,提升了分析效率
拖拽式建模相比傳統代碼開發方式簡單、高效,模型的發布及重用使得分析工程實現了資源復用,進而減少了大量重復工作量。
降低數據處理、分析和人工智能建模的門檻
豐富的組件庫提供了豐富的數據預處理、數據分析、機器學習和建模的組件,將復雜的算法封裝成簡單配置的算法組件,極大的降低了開發底層算法的需求。
加速了模型到應用落地的過程
模型可直接在線部署,對接實時數據流。
提高了團隊協作能力
分析工程可方便的分享給團隊中的其他人員,既能夠減少重復開發,也方便實現協同調試。
數據分析模型和組件的無縫迭代
數據分析不再是一次性固化的程序,允許在之前的工程和分析結果的基礎上,快速的疊加新的組件、更新以往的模型,實現模型的迭代和分析的不斷完善深入。
歡迎咨詢或預約演示
立即試用