top of page

大數據專案推進流程

流程圖

專案實施流程.PNG

準備階段:需求調研

設計階段:專案規劃

流程圖
準備階段:需求調研
設計階段:專案規劃

專案實施流程圖

專案實施流程.PNG

準備階段:需求調研

  • 成熟度評估:根據客戶既有軟硬體設施及數據的客觀特性,評估是否足以支持大數據專案及後續應用。

  • 資料收集+需求訪談:取得既有設施所收集的數據並透過訪談找出客戶的痛點。

  • 定義問題和目標:根據數據將客戶的痛點轉化為大數據問題及想要達成的目標。

  • 可行性評估:分析既有數據是否可解決上述問題並達成目標,過程中需要與客戶的領域專家合作,釐清各項客戶數據所代表的意義及合理性。

  • 大數據專案評估報告:將準備階段的分析結果整理為報告。

 

設計階段:專案規劃

  • 定義專案範圍:依據準備階段的評估報告,正式確認大數據專案的問題範圍及目標。若評估報告顯示當初的問題目標與數據的相關度不夠,則可能會更改專案目標,或增設軟硬體設施提高數據的解析度及廣度,以符合專案所需。

  • 展開工作項目:根據專案範圍及目標,將問題及解決方法具體化。

  • 實驗設計與視覺化規格:說明解決問題的手法及驗證方式,以及將專案成果開發為大數據應用的呈現方式。

  • 查核點與產出:列出專案執行期間可具體產出的階段性成果及時間點。

  • 預算評估:列出完成專案目標預計所需之人力成本及硬體成本。

  • 專案計劃書:將規劃階段的內容整理為計劃書。

實現階段:專案開發

  • 資料收集:依據專案計劃書所議定的專案範圍,收集大量資料。

  • 資料前處理:分析上述數據是否有數據遺失或數據異常之類的問題,並進行相關處理,避免大數據模型對專案問題有錯誤的解讀。

  • 變數分析與選擇:數據科學家會透過數據分析找出與專案問題相關的重要變數。過程中需要跟客戶的領域專家討論變數的選擇是否合理,以加快專案的進行,或提高專案成功的可能性。

  • 模型建立與評估:依據數據及重要變數,使用不同的演算法建立模型並調整參數,以找到解決專案問題達到專案目標的最佳解決方法。

  • 視覺化設計:依據計劃書所議定的視覺化規格開發模型的視覺化應用。

  • 模型與視覺介面:產出符合專案目標的大數據模型及視覺化互動介面。

交付階段:專案實施

  • 實驗環境建置:依據專案計劃書建置所需要的軟硬體設施,包括收集數據的物聯網、將數據導入大數據應用的相關系統,大數據模型及大數據應用的運作環境、...等等。

  • 模型測試:將大數據模型及應用安裝於正式運作環境,並基於正式運作環境的數據測試模型效能是否達到專案目標,以及大數據應用是否正常運作。若模型效能不如預期,可能是正式運作環境的新數據包含目前模型未考量的新關鍵變數,則需要根據新數據回到前一階段調整模型。

  • 效益評估:若一切運作正常,則可根據模型效能評估專案帶來的效益。

  • 正式上線:將大數據模型及應用的輸入輸出與客戶既有流程進行整合。

  • 專案結案報告:將專案的開發、驗證、實施、...整理為結案報告。

實現階段:專案開發
交付階段:專案實施
bottom of page