工控網首頁
>

應用設計

>

五個數字說清工業大數據

五個數字說清工業大數據

2019/3/26 10:03:04

要理解工業大數據,筆者認為,可以從下面幾個數字入手。

一個目標

一個目標就是提升智能化的水平。很多專業人士談到大數據,往往局限于各種數據的分析及其算法。如果視野僅僅局限于這個層次,那么,就難以看到大的機會。

在筆者看來,大數據時代的機會就在于促進智能化水平的提高、帶領工業界進入智能時代。換句話說:如果不與各種智能化工作聯系起來,就可能會失去大數據時代的機會。

要認識這種機會,就需要正確把握智能化的含義。什么是智能化?智能化就是通過數字化和網絡技術提升信息獲取或決策的能力。而決策的主體可以是機器,也可以是人。我們知道,大數據促進了機器學習技術的發展,推動了新一代人工智能(AI)的發展。但智能化的內涵應該遠大于人工智能(AI)。只有認識到這一點,才能看到更多的機會和可能。

某種意義上講,智能化就是人機工作界面的改變,是借助ICT技術(信息通信技術)實現業務活動方式的創新。在信息獲取、知識獲取、決策、執行等環節,我們都可以采取新的工作方式。比如,在信息獲取方面,當數據太多太散時,可以讓機器去查找信息;數據組織得好時,就可以讓人去查找信息。還比如,在知識獲取方面,可以用人機協同的方式獲取知識,也可以讓機器自行去獲取知識。

可以說,在智能化方面,我們要有想象力,不要局限于從數據中發現知識。比如,實現機器“用”知識推動設備智能化,或直接為人類提供可用的知識。現在,知識的人類用戶可以是工程師,也可以是消費者。因此,工業大數據技術落地的前提常常是具體業務牽引,即所謂“先有需求,再找方法”。

一個基礎

一個基礎就是數據的完整性。無論是工業產品還是車間、工廠,工業對象往往被看成一個復雜的系統。當我們用數據來表征系統時,數據的完整性和相關性都特別重要。畢竟不完整的數據和不相關的數據可能會得出錯誤的分析結論,而工業對象都追求高度的可靠性,對錯誤的容忍度很低。

寶鋼老專家王洪水先生認為:用數據記錄生產過程時,“要向錄像機錄像一樣”把數據收集起來,不要有斷點。這是實踐中行之有效、正確的指導思想。

筆者還見過有人在研究鋼鐵材料成分與力學性能之間的關系時,把包括微合金鋼在內的多種鋼種混在一起,卻只考慮了C、Si、Mn、S、P等所謂的“5大元素”。這時得到的結論自然就是錯的。

過去記錄數據時,由于存儲成本高,往往“挑重要的記錄”,導致記錄的信息碎片化。現在數據存儲成本低,可以記錄的數據多了,但是,若數據之間的關聯性沒有被記錄下來,則數據照樣是沒有價值的。

二次應用

在多數業務系統中,數據在業務活動中產生,業務活動結束后,數據也就基本沒用了。而大數據的重要用途往往發生在業務場景結束之后,故而稱之為二次應用。二次應用的價值在于:用過去產生的數據讓現在的業務活動做得更好。

大數據的一個重要用途是促進企業的轉型升級、業務活動的創新。然而,創新的成功邏輯往往是“先做成、后做好”。強調二次應用,指的是把大數據應用于“做好”的優化階段。

在筆者看來,大數據對如何“做成”業務是沒有責任的。因為沒有“先做成”的業務邏輯,大數據也就沒有辦法落地。強調這一點的原因是:把兩個困難混在一起,可能就做不成事了。“做成”的業務邏輯必須單獨考慮、提前考慮,大數據只是讓業務“做得更好”而已。

而“做好”則包括多個方面,如質量更好、速度更快、成本更優,而不僅僅是決策質量更好。比如,重用知識和信息可以使人們做事的速度更快、成本更低。對于“做好”,不要一味地強調“決策質量更優”,如果僅僅局限于決策質量,則可能會失去很多創新機會。

兩種承載

大數據是數據(Data),也必須是信息(Information)。兩者的差別在于:數據之間有了聯系才能構成信息。強調這個觀點的目的在于:不要碎片化地收集數據,而是去收集有聯系的數據、收集數據之間的聯系,且最好是完整的信息,而不是破碎的信息。

大數據不僅可以用來承載信息,而且可以用來承載知識,也就是把知識提煉出來,用大數據來承載。從工業上看,工業產品的設計數據和工業設備的狀態、標準等知識都可以用數據來表示。在某些個性化需求比較多的場景下,這些數據的量是相當大的。上海有一家企業,每天處理這類數據所花的電費就有10萬元。

總之,不論承載什么,都要以便于應用為目的,不要總想著“從數據提取知識”這一件事、一個環節,而是要以具體的應用為牽引,根據具體需求,以終為始地建立大數據基礎。

三個優勢

大數據的不同之處是什么?筆者將其歸結為三個優勢。正是這三個優勢讓我們便于從大數據中獲得知識。

筆者把第一個優勢稱為“不必糾結于因果”。這種說法區別于“是相關,不是因果”,以及“工業大數據必須具備因果關系”。這種觀點的意思是:從大數據中提煉的工業知識,要以因果關系的存在為基礎,但不必按照機理邏輯去計算。比如,我們可以從數據中得到某個最優參數,但不必從理論上推導出來為什么最優。不糾結于因果,可以讓知識的獲取變得簡單。在這個基礎上,大數據可以獲得靠譜的“感性知識”“經驗知識”,讓知識的種類大大拓展。這是大數據促進圖像識別等技術發展的原因之一。

第二個優勢是“樣本=全體”。從應用的角度看,數據的優勢不在“多”,而在“全”。“多”只會增加計算機處理的復雜性,而“全”則保證了知識的存在性。當數據能夠覆蓋所有場景時,“新問題”就變成了“老問題”,這時我們就可以從歷史中得到所需要的經驗和知識。

第三個優勢是“混雜性”。這個優勢可以讓我們從多個角度印證知識,提高知識的可靠性,但其前提是確保大數據記錄的完整性。

由此可以看出,三個優勢的本質都落腳在“知識的優勢”上。

大數據的優勢與人的作用

工業大數據并不是天生存在的,而是要人去創造的。比如,“樣本=全體”的內涵是借鑒過去的經驗。然而,“世界上沒有兩片完全一樣的葉子”。從這個角度看,其實每個問題都是獨特的,“樣本=全體”的理念在應用時必然涉及個性與共性的關系問題。借鑒過往經驗的前提是對問題抽象、歸納、總結的結果——但這往往是人類才能做的事情,至少是人類告訴計算機該怎么做。而且,大數據記錄的數據畢竟屬于過去,因此,在應用于未來時,必須有辦法來提高其可靠性。

再如,“不糾結于因果”的前提是以因果關系的存在為基礎,只是不必按照因果邏輯去推導、計算。但是,因果關系是具有專業知識的人用專業領域知識“保證”的,而不能指望數據分析算法能“保證”。

工業界經常遇到的問題是:數據常常來自某個“工作點”附近,數據量大而相似度高、干擾相對強而信息含量相對低。這種現象會使得分析結果的可靠度降低。筆者認為,解決這個問題,可以把生產數據和實驗數據結合起來,把“大數據”與“小數據”結合起來,而不是局限于生產數據本身。

來源:互聯網

審核編輯(
王靜
)
投訴建議

提交

查看更多評論
其他資訊

查看更多

派拓網絡被Forrester評為XDR領域領導者

智能工控,存儲強基 | 海康威視帶來精彩主題演講

展會|Lubeworks路博流體供料系統精彩亮相AMTS展會

中國聯通首個量子通信產品“量子密信”亮相!

國家重大裝備企業齊聚高交會 中國科技第一展11月深圳舉行