不重視數據就追趕AI,這種跳躍式發展是空談

Gartner公佈的2018年科技發展趨勢,其中第一個趨勢就是AI人工智慧。IDC發布2018年臺灣ICT市場10大科技關鍵趨勢預測中,AI也位居前列。在各大媒體的版面上,AI也是炙手可熱的話題,從AlphaGo戰勝圍棋冠軍,到亞馬遜新型態超市Amazon Go,再到無人駕駛汽車、智慧客服、人臉識別、理財機器人等等。

在這火熱背後,有多少是理性驅使,又有多少是人云亦云?很多企業開始考慮是不是自己公司是不是也要儘快上馬AI技術,以防在大潮中落後。各國政府也坐不住,美國、中國、加拿大、英國紛紛大量投資AI人工智慧領域相互追趕,以求在世界技術大潮中佔有一席之地。就在昨天,台灣微軟表示,在行政院與經濟部的支持下,微軟在台成立「微軟AI研發中心」,將在2年內投資台幣10億,建立百人研發中心團隊。

是不是給企業更多的研究人才、更多投資就會產出 Alpha Go這樣的AI人工智慧產品?

AI的發展需要很多的基礎和條件:先進的技術和專家,政府的政策資金支持,擁有大的用戶基數以產生大量的數據。顯然很多中小企業並不具備這樣的條件,即使政府投資幫助解決了研究人才和資金問題,要分享AI人工智慧的紅利,還有數據問題需要面對。

創新工場的李開復這樣評論台灣的AI發展機會:
ICT高科技朝代迭代是快速的,有週期,有連續性的。從半導體->PC->軟體->Internet->社交->行動->大數據->AI,每個時代的領跑者在下一個時代都有優勢(若錯過,就很難補課;錯過越多,越難補課)。很不幸,台灣從PC時代之後就基本缺席,錯過五個朝代再來追趕會特別困難,需要在多方面都有突破(技術+政策+人才引入+投資生態+市場認知+甚至運氣)。

AI是大數據養起來的,大數據像是AI的食物,吃的足夠多、足夠好AI才能足夠智慧,跳過中間環節談AI都是空談。譬如我們做一個客服機器人用來代替人工,如果沒有長期客戶問題數據積累來對其進行訓練,不斷優化它的演算法模型,這個機器人就毫無用處。再比如最近大熱的機器人看病,你講出癥狀,機器人就會能夠從資料庫中找到相同相似的病情,給出建議做某項檢查或如何用藥,數據對於機器人的訓練是核心。而今天能在公開途徑獲得的數據集絕大多數都是非商業用途數據,是從網路上積累的數據。真正用於工業商業場景的高價值數據是難以從公開數據集中尋找到的,需要企業經營中積累。而很多企業,連結構化的資料收集都沒做到,或者是存儲了資料但仍然無法整合利用起來,這種狀況下與其大談AI,不如回頭來先做好基本的軟體和數據的積累。

沒有數據就從現在開始收集!

AI人工智慧仰賴大量的數據,網路公司在這方面得天獨厚,通過瀏覽、點擊、停留時間、付款等數據分析用戶的喜好、習慣。把這些數據交給人工智慧學習,就能在內容推薦、版面排布、價格設定、行銷活動和用戶體驗等方面不斷優化,像是facebook可以精準的根據用戶喜好投放廣告一樣。
其他類型的公司也可以從和用戶的眾多接觸點獲取用戶數據並進行數據分析,比如製造業產品銷量、用戶評價,零售門店顧客行動軌跡、貨架停留時間,銀行業的用戶存款、投資記錄,醫院病人就診、購葯、住院記錄等等。


餐飲企業在手機上查看每天分時段銷售狀況和菜品銷售排行榜,長期積累數據可以用來預測人流量和菜品銷售在不同季節月份節日的狀況,在採購、人員安排、菜品規劃等方面提供指導


醫院患者預約狀況分析,月度預約人數、預約方式、預約科室狀況,積累數據對於醫院的工作人員安排、預約方式改良、疾病爆發狀況提供支撐

除了用戶數據,企業採購、生產、流通、銷售、財務、人資各個環節都可以收集到數據。製造業會更多依賴物聯網技術,各種生產設備上加裝感測器,收集溫度、濕度、速度、位置、震動、壓力、流量、氣體等等數據,用來管理設備、識別異常、杜絕生產事故等作用。


裝置負荷資料視覺化總覽


每5秒鐘抓取一次數據的設備實時監控


養豬企業為每頭種豬都建立了QR CODE,飼養員掃描QR CODE將種豬的配種記錄、妊娠記錄以及產仔記錄回填到資料庫和隨時查看相關記錄,長期積累就可以按照設定的演算法標準自動淘汰產仔率低的種豬,以提高整體的經營效率。

有數據要正確管理和整合,以发挥价值

公司積累了數據,但用不起來對企業來說就是垃圾。有的企業數據都在excel裡面,多、亂、不準確,還有些數據分布在不同的系統不同的資料庫中,無法整合或者整合中發生指標不統一,或者底層數據混亂等問題。善用一些數據工具會幫助解決很多問題。


直接將已有的Excel資料批量匯入數據庫之中


某企業的數據整合方案

AI的實現是一個過程,不是一蹴而就的。如果基礎做不好,就先回過頭來打基礎,有了基礎再去考慮AI與實際業務的哪些結合真正能夠對企業有所提升。沒有對數據的重視,AI離企業還有很遠。