AI 2.0時代的新商業思維
中華民國114年6月24日星期二天氣晴朗
作者——張榮貴
編審——曾新穆
?造就AI的三大關鍵要素1、大數據 2、演算法 3、運算力
?第三次A I技術的突破能被世人所見,最主要的因素就是ImageNet 競賽。是由A I專家李飛飛博士帶領團隊花費大量時間與精力,將大量照片進行標籤,公開出來所得到的結果。
?演算法簡單來說,就是一種特定問題的通用解決方法之程序步驟。
?神經網路的學習(Learning)和訓練(Training)是指透過大量資料運用用神經網路演算法,不斷重複學習,,讓神經網路建立一個能達到預先設定準確度的模型(model)此模型就可以為我們所用。建立模型過程可稱為對神經網路模型的訓練,或是神經網路模型的學習。
?在八零年代早期,辛頓便參與的神經網路的研究,這也就是現今「深度學習」的前身研究技術。神經網路就是在多神經層運作的軟體,軟體內部連接的方式,就是模擬人類大腦的運作模式。
? 辛頓提出使用反向傳播算法(Backpropagation) 來訓練感知機:
這是指機器在學習的過程中,將最後輸出的結果(例如預測結果)與真正的答案進行比對,比對後的差異值利用微積分中最小數值的微分概念,於神經網路的最後一程網路開始,向前一層進行反向傳播,要求每一層網路進行參數權重的調整。
這樣的算法大幅減少的神經網路學習過程的計算量。反向傳播法在1986年發表,被視為現今所有深度學習技術的基礎,重新開啟神經網路研究的大門。
?辛頓也特別將三層以上的神經網路重新命名為「深度學習」,揮別長久以來,外界認為神經網路始終無法成功的陰影。因此被稱為深度學習之父。
?在辛頓指導下完成博士後研究的楊立昆(Yann LeCun. )是個法國學者, 1988年他加入美國貝爾實驗室,發展很多機器學習的新方法,如他採用卷積神經網路來處理電腦視覺問題,被稱為卷積神經網路之父,在電腦視覺領域做出貢獻,現在是Mata的首席人工智慧科學家。
?另一位在神經網路發展應用有極大貢獻者,就是加拿大學者約書亞•本吉奧(Yoshua Bengio)他在2000年提出將自然語言的文字轉換為數字表示的向量化方法,一般稱為詞坎路(Word Embedding)技術,可讓神經網路以很有效率地進行自然語言處理(NLP),讓機器翻譯及自然語言處理的技術獲得重大突破。
另外他還與美國機器學習專家伊恩•古德費洛一起發明「生成對抗性網路」(GAN),廣泛被運用用於影像生產領域。
?辛頓、楊立昆、本吉奧這三位在人工智慧發展上,對於神經網路的基礎演算法及應用方法都有極大貢獻,他們三位在2018年一起獲得資訊領域最高榮譽獎項的圖靈獎,以表章他們對世界的貢獻。
?讓AI得以成功的最後一塊拼圖,正是能讓深度學習得以快速發展,並讓多個運算能同步進行的圖形處理器(Graphic Processing Unit,GPU),以及能快速調度運算簡化開發的C U D A(Compute Unified Device Architecture )平台。輝達創辦人黃仁勳,可說是最重要的關鍵推手。
? 黃士傑是DeepMind 的首席工程師,是AIphaGo催生者,2016年3月15日, AIphaGo以4:1韓國職業九段棋手李世乭(音同石),宣告A I第三波熱潮的來臨。2017年5月23日, AIphaGo再度以3:0擊敗中國職業九段起手柯潔,A I技術進入產業。
? 以往只有資訊系統產生數據,現在是每個人都在產生數據,這些數據量快速增長,逐漸形成數位人類學。(Digital Anthropology)
? AI科技的出現,讓非結構化資料的處理變得簡單容易許多。更可以說, AI是處理非結構化資料的高手。像是文章、新聞報導的自然語音資料;圖片、相片、影音等檔案資料。
?我們建議讀者, 從數據的價值(Value)來看待數據,因為我們認為,數據價值的重要性高於其他3V( 資料量Volume,數據輸入輸出的速度,Velocity,多樣性Variety)且是3V價值的綜合展現,將數據價值發揮,才能為企業創造價值。
? 根據不同的資料來源及類型,進行分析的方式也不同。以文章資料為例,可以利用文字探勘(Text Mining)或自然語言處理技術,找出文章內的重要詞彙,或對文章進行分類和關聯分析,以找到資料當中人、事、物之間的關聯。
?文字探勘或自然語言處理,是一種處理人類運用文字來表達情緒、意見、看法,而形成自然語言文章的一種文字處理技術,可以透過機器閱讀,來了解文章描述的重點、正負面情緒、文章含義,是較早出現、運用較多統計方法,來進行文字處理的方法或演算法。自然語言處理技術,涵蓋過往對文字處理的技術總稱。
? 除了運用AI技術進行大量數據處理,對於一般的數據量,使用統計方法即可了解到許多資料特性,這在AI時代同樣具有價值,不需一味追求成本較高的AI技術,完全取決於需要解決問題的特性。
?影像資料分析可以幫助我們了解圖片中的有用資訊。因此一個正確的數據分析方式是需要兩種專業一起合作,一是數據分析專業,可以提供不同解讀資料的方法;另一種則是應用領域的專業,可以提供解讀與選擇最適合表達該資料含義的方法。
? 人類要掌握AI科技,就必須掌握機器學習的本質,就是「學習思維」,簡單來說,我們認為AI就是將人類經驗系統化,將人類經驗融入資訊系統中,根據環境變化來改變作業方式,讓人類找到一種有效讓機器自己學習的方法。
不用告訴機器用什麼方法來解決問題,而是透過大量的資料處理,學會推論、預測、辨識答案,這個過程就是學習。
?電腦是根據人所提供的資料與程式的執行,就會得到預期的結果。這種運用邏輯概念來制定程式規則的處理方法,就是邏輯思維。
運用邏輯程式來處理龐大且異動頻繁的資料,稱為自動化系統。
?提供資料及期待結果給電腦學習,意味著資料與期待結果的對應就是人類的經驗,讓電腦自動學習人類經驗的特徵與規則,來解決人類經驗難以系統化的問題,稱之為智慧化系統。
?自動化系統+智慧化系統= AI智慧應用系統
?一般數據量較小時,適合機器學習,因為特徵是由人來做萃取,可以讓機器學習快速獲得人類對數據的認知與經驗,所以數據量很少時,機器學習就能得到不錯的效果。
而深度學習的資料特徵是由模型自己學習,較不會受到人類的限制,但必須要有大量的資料才能有好的表現,數據量不夠大,會導致深度學習的效果不佳,表現可能低於機器學習。
?深度學習的困境:成本高又不具解釋性。
深度學習有一個非常致命的缺點,就是很難解釋為什麼模型會做出這樣的預測,及解釋性較差的缺點,由於是一種模擬人腦運作模式的學習方法,再加上特徵是電腦自己學習,所以深度學習通常較像是黑箱運作,較不容易被解釋。
留言
張貼留言