大數據本身并不是目的,,如何通過大數據解決企業(yè)生產、運營中的問題,,為企業(yè)創(chuàng)造價值,,實現提質降本增效才是推進工業(yè)大數據的核心目標。 近年來,,隨著企業(yè)所擁有的數據日益豐富,,以及數據驅動意識的不斷提升,越來越多的制造企業(yè)加強了大數據應用探索,,并已有一些成功的應用實例。然而,,對于很多制造企業(yè)而言,,在推進工業(yè)大數據的應用過程中仍面臨著以下難題:采集了很多數據,如何來分析和利用這些數據,,找到與自身業(yè)務融合的應用場景以解決實際問題,?如何務實推進工業(yè)大數據的實施與落地?本文將圍繞著以上問題進行討論和分析,,希望為企業(yè)開展工業(yè)大數據的實施與應用提供啟示與借鑒,。 在本文撰寫過程中,筆者采訪了坤湛科技智能制造總經理胡立舜,美林數據副總裁于洋,,并得到了兩位專家的指導,,在此表示衷心的感謝! 合適的場景是工業(yè)大數據落地的關鍵 當前,,工業(yè)大數據在制造企業(yè)已形成加速產品創(chuàng)新,、生產工藝優(yōu)化、生產流程優(yōu)化,、質量監(jiān)測,、能耗管理、設備故障預測,、銷量預測,、供應鏈優(yōu)化、智能化服務,、個性化定制等典型應用場景,,不僅幫助企業(yè)優(yōu)化了現有業(yè)務,如指導產品設計,、監(jiān)控與優(yōu)化生產過程,、推動精準營銷、優(yōu)化供應鏈管理,、快速服務響應等,,還促進了企業(yè)的轉型升級,為產品,、服務和商業(yè)模式的創(chuàng)新提供了有力支撐,。 工業(yè)大數據典型應用場景(來源:《工業(yè)大數據白皮書(2019版)》) 以上應用場景與突出價值為制造企業(yè)推動工業(yè)大數據提供了參考,并加快了其大數據探索的決心,。但是,,工業(yè)大數據能否落地,不在于技術的先進性,,關鍵是企業(yè)能否找到與自身業(yè)務融合的應用場景,。 然而,工業(yè)大數據應用具有非常強的個性化特征,,不同企業(yè)基于不同的產品,、制造工藝、數據基礎,、應用需求等,,便會產生不同的應用方式和層次;同時,,工業(yè)大數據的門檻較高,,應用場景的效果產出需要企業(yè)具備一定的行業(yè)知識和數據應用能力與經驗,,且當前缺少統(tǒng)一、規(guī)范化的工具,、標準和流程來支撐,。因此,如何找到合適的場景和融合方式成為了眾多制造企業(yè)推進工業(yè)大數據應用的首要難題,。 在筆者看來,,企業(yè)應用工業(yè)大數據的核心目標是創(chuàng)造價值,合適的應用場景一定是能為企業(yè)持續(xù)帶來價值的,,是擁有比較理想的投入產出比的,。 基于此,企業(yè)在明確自身核心需求與痛點的基礎上,,可以從以下三個方面著手確定應用場景的選擇是否合適,。 1)業(yè)務價值較高。數據驅動價值已成為企業(yè)共識,,但并非所有的數據,,都值得去深入開展分析挖掘,如一些變化維度低的“死”數據,,根本沒有分析價值,;也不應為了一些微不足道的性能指標提升而投入大量資源去應用大數據技術。建議企業(yè)可以從那些采樣頻率高,、變化維度多的數據或者高價值,、關鍵的設備/工序等著手,探究業(yè)務應用場景,,并基于已有的歷史數據資產,,來估算潛在價值高低。比如,,某重汽動力部機加單元有100多臺機加設備,,收集了大量的設備運行使用數據,并計劃通過大數據技術提高設備的運維質效,。通過初步分析,,該機加設備運行故障頻次較少,但機加生產過程所需的刀具卻是易耗品,,需頻繁更換,,且刀具在加工過程中出現一定程度磨損時,會影響產品的整體加工質量,。針對這一突出性問題,該工廠詳細評估了刀具的損耗率和因刀具問題導致的產品不良率影響,,有效估算了智能刀具管理場景應用大數據分析的潛在價值,。最后,通過與產品技術服務商、高校研究團隊的有效協作,,構建了刀具狀態(tài)在線監(jiān)測,、使用壽命評估等分析應用,提高了產品良率和刀具使用效率與價值,。因此,,具備較高的業(yè)務應用價值,是大數據技術應用的首要條件,。 2)復制性強,。如果項目選定的大數據應用場景,只適用于單個或少數的產品,,不具備較強的復制性或推廣空間,,很可能會因為項目邊界成本高難以持續(xù)。建議企業(yè)選擇復制性強的應用場景和應用模式,。如上例中,,無論是100臺還是更多的機加設備,基于統(tǒng)一的技術架構和模型,,采集各設備運行的數據,,就能實現同樣的場景擴展應用,大大降低項目成本,。 3)數據可支撐,。由于大數據分析應用類項目,在早期對業(yè)務場景,、影響因素的認識很難完備,,現有數據資產可否支撐、實際分析結論與假設是否相符等均有待隨著實施深化來驗證,。這些不確定性需要在后面的階段,,通過強化數據資產(如增加數據采集點、加大現有數據采集頻率/維度等),,多次迭代數據模型,,并從多個維度去論證建模思路合理性,才有可能形成相對完備的問題理解與目標達成,。 八步實施法,,助推工業(yè)大數據項目有序推進 企業(yè)在確定了工業(yè)大數據應用主要方向的前提下,具體的實施可參考如下步驟,,該步驟基于CRISP-DM(Cross-Industry Standard Process for Data Mining,,跨行業(yè)數據挖掘應用標準流程)并補充了新的內涵。 1,、業(yè)務理解 從業(yè)務角度理解項目目標,,并將其轉化為一個可解且可達成的數據分析問題,,包括厘清關鍵因素,確定分析問題的范圍和目標等,。工業(yè)數據分析需要將專業(yè)領域的知識和數據模型有機融合,,才能得到有價值的分析結果。而數據分析師通常對工業(yè)過程缺乏深入了解,,業(yè)務人員則對數據分析的技術方法與思路了解不深,。因此,業(yè)務理解的過程需要企業(yè)的業(yè)務專家和數據分析師通力合作,。 2,、數據理解與數據的可采集性分析 在理解業(yè)務的基礎上,準確建立數據和業(yè)務間的關聯關系,,包括需要哪些數據,、這些數據是從哪兒來,是生產設備,、智能產品,、復雜裝備等產生的工業(yè)物聯網數據,還是來自ERP,、MES,、SCM等的信息化數據,還是設備在運行過程中所處的環(huán)境數據等,?是否需要線上,、線下相結合的數據等。同時,,確定制造企業(yè)當前的歷史數據存量和可獲取的數據增量,,即在不增加采集點、采集頻率,、采集維度等的情況下,,可以采集到的數據有哪些。 這一階段需要數據分析師根據經驗對數據顆粒度,、數據質與量和數據間的關聯關系等進行初步判斷論證,,確定當前的數據是否滿足業(yè)務場景的要求。 3,、數據準備 對所需的數據進行數據加工與治理,,包括原始數據抽取、多數據源融合,、數據清洗與質量提升等,。一般需要企業(yè)成立專項數據治理組織,通過數據集成和定期運維等方式保證業(yè)務系統(tǒng)和線下數據準確與完整,,包括剔除掉那些假的,、錯的,、偏差大的、缺失的,、不合理的、暫時性的臟數據等,。數據準備與預處理環(huán)節(jié)不僅由數據分析師組成,,還包括懂行業(yè)know-how的專家,對于一些不合理,、不符合物理規(guī)律的數據,,如燃氣燃煤加熱設備在極短時間內出現溫度數據的急劇變化是不合理的,數據分析師很難發(fā)現,,需要結合行業(yè)專家的經驗認知判斷,。 4、特征提取 特征提取即借助統(tǒng)計學方法對數據進行轉換,、映射,、分析,找到數據中的規(guī)律,,并進行特征提取,,即最大限度地從原始數據中提取特征以供算法和模型使用。這一步非常重要,,只有對數據特征有了清晰的認識,,企業(yè)才能更好地完成拓撲數據結構的搭建,開展數據建模,。部分企業(yè)由于缺乏對數據的深入探索和理解,,一有了原始數據就直接著手構建大數據模型,結果失敗率非常高,。 值得注意的是,,針對一些特定領域問題,特征提取應充分利用行業(yè)已有的專業(yè)知識,,不要將時間過多浪費在該領域早已熟知的行業(yè)規(guī)律發(fā)現上,。 5、小數據驗證 如果說在實施工業(yè)大數據項目前,,是通過歷史數據估算場景價值點,,來初步判斷應用場景是否合適。那么,,到了具體的應用落地實施階段,,則需要依賴現有的預處理數據,對業(yè)務場景的價值進行更具體的計算,,得出一個可量化的值,,從而來驗證數據分析的價值,。 6、數據建模 基于業(yè)務知識和合適的算法及建模工具,,輸出數據分析模型,。當前,機器學習,、數據挖掘等分析理論,、技術發(fā)展較成熟,也有很多明確的指導原則和豐富的算法和建模工具,,可以幫助企業(yè)優(yōu)選出合適的算法模型,。因此,真正的數據建模過程在項目實施過程中花費的時間并不是最多,。但值得一提的是,,算法不是越復雜越先進越好,應用可解釋,、較簡單的算法去解決業(yè)務實際問題更值得被關注,。 7、模型的驗證和評估 模型的驗證是對分析模型從數據和技術的角度進行充分檢驗評估,,確認數據分析的結果或模型是否滿足具體工業(yè)應用場景的使用需求,;任何模型都有一定的適用前提,模型的評估即是從業(yè)務的角度審視模型在什么范圍內有效,,有效程度是什么,,在什么情形下不適用,需要分場景去驗證和評估,。 8,、模型上線與迭代 模型的上線是將模型以便于企業(yè)使用的方式和要求重新固化,形成便于模型服務調用的形式,,如可重復使用的數據挖掘程序,、模型服務程序等。同時,,模型在運行過程中,,還應對模型進行持續(xù)的修正、迭代和完善,。 如前文所述,,與一般的信息化項目不同,工業(yè)大數據項目的實施是一個循環(huán)迭代,、螺旋上升的過程,。因此,以上8個步驟會存在多處循環(huán)和反復迭代,如在建模階段,,假如現有的特征無法滿足模型的開發(fā)或者存在過擬合的問題,,則需要返回到數據準備,甚至會出現業(yè)務理解的修正調整,。另外,,即使企業(yè)基于現有數據完成模型的上線后,還需進一步評估,,是否需要增加現有數據量,,是增加數據的采集頻率,還是增加額外數據采集點,,進一步迭代模型,如此反復,,從而不斷優(yōu)化模型,,得到更可靠的分析結果。 實施案例-水泥生產結緣大數據,,開啟“智控”新時代 某水泥企業(yè)擁有兩條日采5000噸水泥的熟料生產線,,每條產線每年的耗電量達到約8千萬度,耗煤約20萬噸標煤,,能耗消耗巨大,。該企業(yè)希望通過大數據優(yōu)化能耗實現節(jié)能減排,降本增效,。 通過初步分析,,該企業(yè)水泥產線在工業(yè)場景中工藝機理相對標準化,主要包括“兩磨一燒”環(huán)節(jié),,但每一條生產線設備,、物料、操作人員習慣不同,,導致每條窯的工況都不一樣,,控制參數也沒有通用標準。因此,,聚焦“兩磨一燒”的工藝優(yōu)化,,通過自動化的生產控制來實現節(jié)能降耗,成為了該企業(yè)嘗試的解題思路,。 該企業(yè)首先結合工藝專家的專業(yè)經驗獲取了現有的400多組采樣點的數據,,包括來源于生產系統(tǒng)、控制系統(tǒng),、設備管理系統(tǒng),、能源系統(tǒng)等的質檢數據、DCS數據,、熒光分析儀數據,、環(huán)境數據等,,并對歷史數據進行清洗和預處理,剔除噪音數據和無效數據,,補充不完整數據或缺失數據,;然后,對所收集到的多維度數據進行特征提取與數據拓撲結構搭建,,并針對生料磨,、水泥磨、回轉窯3個關鍵設備的“兩磨一燒”工藝,,建立了生料電耗優(yōu)化控制模型,、回轉窯能耗優(yōu)化控制模型、熟料質量預測模型,;待模型建立后,,對生料磨及熟料燒成流程進行工藝參數推薦,并將推薦參數放在生產線上試驗,,確定模型的適用范圍,,對其準確率與效果進行驗證,包括能耗降低了多少,、質量提升了多少等,,再根據反饋優(yōu)化工藝參數,,迭代算法模型,;待算法模型上線后,參數返回控制系統(tǒng),,自動控制生產線,,避免了人為等因素帶來的能源消耗不同,,達到節(jié)能減排穩(wěn)定質量的效果。 據了解,,在完成第一輪的模型上線后,,該企業(yè)在第二輪的迭代中,又增加了10多個采集點,,對算法模型進行循環(huán)迭代,,如此反復。最終,,該企業(yè)實現了約3%~5%的能耗優(yōu)化,。 某水泥企業(yè)實施路線圖 多措并舉,讓大數據創(chuàng)造大價值 工業(yè)大數據實施路徑為企業(yè)提供了方法指引,,但工業(yè)大數據項目的實施落地并不是一蹴而就,,現階段仍存在著部分項目投資大產出低、項目周期長、人才缺乏,、分析結果可靠性差,、應用融合不深入等問題。那么,,制造企業(yè)如何才能更有效地推進工業(yè)大數據應用,、更充分挖掘數據價值呢? 1)自上而下形成完善的管理制度與體系 推進工業(yè)大數據項目,,需要企業(yè)從戰(zhàn)略層面高度關注和重視,,從上往下形成完善的管理制度與體系。首先,,工業(yè)大數據是持久性的項目,,需要企業(yè)做好打持久戰(zhàn)的準備,且在項目前期投資回報率難以量化,,短期效益不明顯的情況下,,獲得高層領導的支持與參與就顯得非常關鍵。其次,,工業(yè)大數據解決的是企業(yè)級的應用需求,涉及多部門跨業(yè)務的數據融合與工作配合,,某個業(yè)務目標的實現需通過整個企業(yè)乃至供應鏈上多上相關方的大范圍協同,,因此需要獲得從管理層到業(yè)務部門自上而下的支持,并應形成完善的管理制度與保障體系,,以保證項目的有序推進,。 2)定義明確的項目目標,切忌貪大求全 企業(yè)在實施工業(yè)大數據之前,,必須根據企業(yè)自身的需求,,確定解決什么問題,能為企業(yè)帶來哪些價值,。同時,,在一個項目周期內應制定可衡量的實現目標。與一般的信息化項目不同,,如硬件項目價值比較直觀,,MES、ERP等信息化項目,,已有較深的積累,,可以明確確定交付邊界和交付周期,工業(yè)大數據項目是一個持續(xù)迭代的過程,,所以項目周期和項目的邊界有時會顯得較為模糊,。但如果在一定的項目周期內,企業(yè)沒有明確的主攻方向并向業(yè)務板塊呈現價值,項目將難逃厄運,。 另外,,建議企業(yè)不要一開始就貪大求全,甚至花費巨資去構建企業(yè)級大數據平臺,??梢詮目傮w架構要合理、小型價值先推行的思路出發(fā),,給予合理規(guī)劃與論證分析,,并從啟動小的項目開始,選擇企業(yè)所亟待解決的問題入手,,再逐步延伸到更多的應用場景,。將技術探索、人才儲備,、應用落地等基礎打好后,,再考慮打造和完善體系化的大數據應用平臺建設。 3)將重心放在業(yè)務知識認知,、數據治理上 從某種角度來說,,工業(yè)大數據不是技術而是業(yè)務,項目的落地從工業(yè)大數據技術起步,,但同時必須與企業(yè)的業(yè)務流程,、工業(yè)機理等有機結合。包括通過充分利用業(yè)務知識,,企業(yè)可以了解數據的來源與采集方式,,判斷其是否可信,把握分析項目的主要矛盾,;在數據量不夠的情況下,,通過“方法降維”,從有限的數據中分析出足夠可靠的結果,;以業(yè)務經驗指導特征提取,,提高算法的求解效率,提高模型的可解釋性,;更全面客觀評估模型的適用范圍等,。 另外,相比大數據量,,工業(yè)領域更注重數據的完整性和高質量,。數據質量的高低直接決定了數據模型的準確性、數據分析的可靠性,。此外,,數據治理不僅在數據準備階段,,為保證模型的持續(xù)優(yōu)化,還需要不斷提高數據質量,,并定期對數據進行維護,。 4)與其花巨額解決數據采集的充分性,數據分析不如從現有數據資產出發(fā) 對于制造企業(yè)來說,,總期望所有的重要因子數據都能被全量采集,,但這是不可能的。一方面,,如果不融入領域認識去“消減”因子數量,,通常是無法提供“足夠”的歷史數據去覆蓋所有組合情形。另外,,數據采集成本不低,,并且還受制于當前的技術水平以及安全/環(huán)境等因素。因此,,數據準備階段企業(yè)先盤點現有數據,,而不是一開始就投入大量的資金開展數據采集,更不是在業(yè)務需求,、應用場景尚不明確的情況下,,就盲目開展各類數據采集與治理,不僅成本高,,而且很多數據可能并不是未來數據分析應用所需要的,。 5)需要行業(yè)專家、戰(zhàn)略合作伙伴的多方協作 當前,,工業(yè)大數據項目還沒有完全可照搬的模板,技術與應用場景的深度融合還處在不斷探索,、試錯的階段,,需要企業(yè)與來源于高校、科研院所等的行業(yè)專家,,以及工業(yè)大數據解決方案提供商通力合作,。 例如,工業(yè)大數據分析廠商的優(yōu)勢在算法,、數據洞察力以及豐富的實踐經驗,,而行業(yè)專家對行業(yè)know-how有較深的理解與積累,高校擅長理論算法與機理的深入研究,,通過企業(yè),、行業(yè)專家和廠商配合組隊的模式,可以幫助企業(yè)更高效地找到合適的融合性落地方案,,提高場景化數據建模與分析效率,,得到高質量的分析結果,。 6)加強復合型人才培養(yǎng) 工業(yè)大數據實施落地難,人才缺乏也是很重要的原因,,特別是既懂IT,,又熟悉業(yè)務,還具有一定數學功底的復合型人才,。另外,,據了解在部分大數據項目結束后,技術實施方撤離,,企業(yè)由于缺乏數據的管理維護,、數據模型的迭代完善能力,導致數據的質量每況愈下,,模型失去生命力,,使得項目無法得到延續(xù)。因此,,企業(yè)需要加強面向新一代信息技術的復合型人才培養(yǎng),,以承接模型上線后對其進行持續(xù)優(yōu)化迭代的能力,并為產業(yè)級的大數據應用推廣儲備人才,。 總之,,大數據本身并不是目的,如何通過大數據解決企業(yè)生產,、運營中的問題,,為企業(yè)創(chuàng)造價值,實現提質降本增效才是推進工業(yè)大數據的核心目標,。工業(yè)大數據的落地離不開方法指引,,也離不開場景選擇、業(yè)務邏輯的深入理解,,更離不開高質量的數據保障,、大數據技術與業(yè)務流程的融合、算法模型的持續(xù)迭代和專業(yè)的戰(zhàn)略合作伙伴與人才支撐,。 |
|
來自: yanyahoo > 《科技智庫的數字化轉型》