在這個AI世代,不少從前只得人類才可完成的工作,現在都已由機器接手。而機器學習更因設計出自學系統而引起了轟動,能在不需精密編程的情況下,利用分析及數據做出明智的決定。若你覺得一部懂得自學的機器已經夠驚人(或是可怕得令人擔憂),請先停一停考慮清楚。因為接下來你將認識一個和你用同樣方式思考的系統——「深度學習」(Deep Learning)!
深度學習是機器學習的分支, 透過模仿人類大腦及受其啟發的演算法改進、演化自己。 這些演算法的官方名稱是人工神經網絡。程式員可以用文字、圖片及聲音等大量不同形式且複雜的無標籤數據來「訓練」這些神經網絡。然後這些模型便會不時「從經驗中學習」,最終達至前所未有的準確度,甚至超越人類所及。
雖然難以置信,但深度學習模式這個概念其實可追溯至1943年。當時就已有兩名科學家利用數學及演算法,創建出模仿人類大腦的多層神經網絡。
深度學習之所以「深」是因為模型的學習程序。 每過一分鐘,神經網絡都會快速地挖掘及發現新一個層次的數據。當層次越多,模型便會鑽得越深,繼而改進整個學習過程。
簡單來說,深度學習模型能夠像人類一樣學習。通過重複的教學及訓練,AI就可以自動萃取出特徵,而不需要人類的監督便可預測及識別結果。
舉個例子:若你想訓練一個深度學習程式學會如何分辨「狗」這種生物,你只需提供大量狗和其它非狗隻的圖片。有了訓練數據,AI程式就會利用這些資料創造出狗的特徵組,並創建出預測模型。由那一刻起,深度學習模型便會開始尋找相似的像素樣式,然後分別出狗及非狗隻。
兩者的分別在於處理的資料和學習的方法。
傳統機器學習的演算法通常都是利用標籤資料及結構化數據來預測推論。
深度學習的演算法會跳過「預處理」的部份,直接吸收非結構化數據。
要注意的是,這並不等於機器學習程式無法處理非結構化數據。不過一般來說,兩者需經過不同的預處理程序來將數據組織成行及列。深度學習演算法能夠同時處理文字、圖像等非結構化數據,並配合自動化特徵萃取,進一步減少人類參與的必要性。
至於學習的部份,機器學習需要人類持續的干預及監督。而深度學習可減少人類的參與,但其系統則需要更複雜的設定。
雖然「深度學習」聽起來可能很複雜,但其實這個科技早已被廣泛應用在日常生活之中:藝術、科學、金融,甚至醫療、科幻電影等通通也是深度學習的常客!
齊來看看以下這些例子吧:
虛擬助理的客製化回應正正運用了深度學習科技。多得AI、深度學習及自然語言處理等的配合,人類的好朋友Cortana、Siri、Alexa還有Google助理才可以從元數據、對話紀錄、地理位置等收集分析,然後再為我們提供可靠的建議。這也展示了深度學習的語言及翻譯功能有多厲害!
就如剛才所說,深度學習其中一個最厲害的功能就是自動將人類的說話翻譯成不同語言,不論是口語還是書寫。試想想你多常用到Google翻譯?這個軟件對語言學習者、旅遊業界及政客來說就特別適合,從前令人困擾的多語言溝通都不再是障礙!
有了深度學習,車輛就可以收集四周環境的數據,並理解路面狀況。不論是路牌、交通標誌、道路攝影機甚或是其他感應器,車輛都能夠偵測,讓它能夠自己駕駛自己!而每次訓練所得的大量數據都會幫助深度學習的演算法改進、加快作出決定的速度。有遠見的Tesla就是其中一個在自動駕駛科技領域取得成功的例子。
深度學習令AI聊天機械人能夠在商業機構提供更出色的客戶服務。對各品牌來說,聊天機械人的出現為他們節省了大量時間及人力,令員工不用再回答刁鑽的問題或應付難搞的顧客。2022年轟動一時的「有意識」聊天機械人LamDA亦是深度學習的體現。
基於深度學習處理大量資料的高準確性,這項科技也被重度利用在人面辨析系統之中。不同行業,如保安、健身、科技、藝術、娛樂界等都非常依賴這項功能。像是社交媒體的巨頭Facebook和Instagram就利用了人面辨識而制定了圖片標籤功能。
但深度學習模型在初次接觸人面辨識時也有缺點:當你減了肥、增胖、留了鬍鬚或是剪了新髮型,它們就無法辨認你是同一個人。
網店、串流平台等等的娛樂程式都完美地駕馭了深度學習。你在Amazon、Neflix或是Spotify上看到的「為您推薦」、「猜您喜歡」的建議都來自深度學習,它能夠個人化你的動態消息,透過分析你的數據、瀏覽紀錄及線上行為來鼓勵購物及消費。
在藥物開發和設計的初始階段,深度學習就擔任了重要的角色。除了用以篩選藥品,透過生物因素及數據來預測藥品的成功率,深度學習和機器學習還可按個人基因組和疾病實現個體化治療,因此這項科技也是許多大藥廠的重點關注之一。
據預測,深度學習的市場將在2030年升值至1799.6億美元。我們慢慢可以看到深度、機器學習和AI如何影響所有行業,亦可以一起期待更多像焗Pizza機械人般令人驚喜的發明出現!