近年,大數據的掘起和電腦運算能力的進步促成人工智能的急劇發展。自從 OpenAI 的 ChatGPT 在2022年11月面世後取得重大成果,人工智能產品市場的競爭推進得如火如荼,谷歌和微軟兩大科技巨頭無不例外地爭奪人工智能市場的主導權。 2023年步入第二個月份,兩大科技巨頭相繼地發布了其公司旗下最新的人工智能服務,預視著明顯的競爭白熱化,引起社會熱話。可惜,兩家公司的產品發佈均出現錯漏百出的慘況,激起非議。
2 月 7 日(星期一),谷歌推出了其人工智能聊天機器人 Bard。 儘管谷歌並未有公布 Bard 的確實發佈日,但它已被視為“ChatGPT 殺手”。
然而,在谷歌的宣傳影片中,當Bard 被問及「從詹姆斯·韋伯太空望遠鏡中的新發現,有什麼可以告訴我9歲的孩子?」Bard 給出的回應中有一個錯誤的歷史事實。這誤差引發了大規模的抨擊,公眾均認為谷歌的表現強差人意。此錯舉狠狠地打擊了 Alphabet 的股票價值,令 Alphabet 公司的市值減少了1000億美元。反觀地,微軟的股價上漲了3%。
2 月 8 日(星期二),微軟宣布改進其搜索引擎 Bing 和網絡瀏覽器 Edge,引入人工智能的功能。基於微軟和人工智能開發商龍頭 OpenAI 的合作關係,兩款產品的升級將由 OpenAI GPT3.5 模型的改進版本提供支持。 此舉標誌著谷歌長期在搜索引擎領域的主導地位即將被撼動。
可惜好景不長,在微軟推出支援人工智能搜索引擎的測試版後,多方用戶表示 Bing 內置的人工智能聊天機器人輸出不當回應。有用戶向 Bing AI 提出它的回應有錯誤,結果 Bing AI 堅稱自己是正確的。甚至有用戶收到 Bing AI 表達愛意,各種測試結果令人毛骨悚然。
「OpenAI 的 ChatGPT 已經很厲害了, 我們應該期待 Google Bard AI 嗎?」 答案是肯定的。 由於 Bard 能夠利用實時事件生成回應,Google Bard AI 的面世備受期待。 谷歌 CEO Sundar Pichai 在一篇產品發佈的博文中介紹了谷歌 Bard AI 聊天機器人,強調了聊天機器人 Bard 配有從互聯網獲得實時資訊的功能,加強 Bard 正確回答用戶問題的能力。另一方面,OpenAI 的人工智能聊天機器人 ChatGPT 是使用 2021Q4 之前的數據演練生成的凍結模型,這意味著它的回應僅限於該演算截止日期之前的信息,它亦無法從互聯網獲取實時資訊。
目前,ChatGPT 是我們這個時代最先進的人工智能聊天機器人。盡管新聞發佈上的表現強差人意, 一旦 Google Bard AI 公開面世,它還是有很大潛力快速席捲人工智能市場。 在這款產品正式推出前,讓我們先了解一下 Google Bard AI。
Google Bard AI 由建基於一款名為 LaMDA(Language Model for Dialoge Applications)的新型自然語言處理技術。LaMDA 的目的是創建一種更具人性化的對話體驗,使機器能夠更自然地與人類進行對話。顧名思義,LaMDA 專為對話式 AI 而設計。 大多數語言模型都是以大型文字語言庫作數據演算的,但 LaMDA 是以對話為數據庫作演算的,這種演算模式增強了 LaMDA 理解自然語言對話的能力。建成 LaMDA 的深度神經網絡架構 (Deep Neutral Network) 名為 Transformer,Transformer 由 Google Research 發明並於 2017 年公開源代碼。有趣的是,OpenAI 的 GPT3,以及許多最近的語言模型,也是建基於神經網絡架構 Transformer。
圖片:Google Bard 與 OpenAI ChatGPT 的比較
迅速普及化的人工智能應用再次引發了公眾對人類未來生活的擔憂。 先進人工智能的廣泛應用如何影響人類的發展? 人工智能正在掌控世界嗎? 別慌張,事情沒那麼悲觀。信不信由你,如果你會寫 prompt,你就能掌控 AI。
圖片:OpenAI Playground 上的 Text Prompt 和 Text Completion
你有注意到嗎?像 ChatGPT 這樣的語言模型是在 “ text in,text out” 的基礎上運行的。 輸入稱為 text prompt,輸出是 text completion。 語言模型的輸出質量在很大程度上取決於人工文字輸入的質量,因此,圍繞 prompt engineering 的討論越來越多。
在我們深入探討 prompt engineering 之前,讓我們先了解語言模型的運作模式。
事實上,人工智能廣泛意旨創造能夠模仿人類智慧的機器,而機器學習 (Machine Learning) 是計算機科學中的一門學科。 機器學習使用算法來構建預測模型,旨在解決特定的公式問題。 簡單來說,機器學習涉及三個步驟:收集數據、模型演算、以及預測結果。
人工智能最常見的領域之一是自然語言處理 (Natural Language Processing)。自然語言處理的目的是讓計算機理解和解釋人類語言。 語言模型是自然語言處理的關鍵組成部分。 語言模型分析大量文字數據,並通過估計文字序列的概率來預測下一個文字。 大數據的普及促進了大型語言模型的構建,大大提高了計算機處理自然語言的效率。
圖片:語言模型的近代發展史
自從 Google Research 在2017年發布 Transformer 的開源代碼,該深度神經網絡架構已成為許多預訓練模型 (Pre-trained Model) 和微調模型 (Fine-tuned Model) 的支柱,例如 BERT、GPT 和 LaMDA。 這些模型先在海量文字數據上進行演算,建成預訓練模型,及後再額外使用小型數據針對特定指令進行微調。 這種演算模式大大提高計算效率——先花大量計算能力和時間,建成全面的語言模型,再按需要引入小型數據調整模型輸出,調整得以迅速完成。這些後加的小型數據就是 prompt,因此,整個微調的過程也被稱為 “prompt-based learning”。
圖片:預訓練模型和微調模型的演算流程示範
圖片:Prompt 的輸入和文字輸出的流程示範
雖然人工智能融的應用也許會淘汰很多工種,卻也會創造新的機會。我們可以利用人工智能將重複性的工作自動化,減省的時間可分配到更具意義的工作,從而促進生產力。如果你將人工智能工具當作你的下屬,你必需學會和這些「下屬」溝通及發出指示。當你越擅長設置明確及精準的指令,「人工智能下屬」在執行指令時就會更加高效,產生更合符要求、更具質素的輸出。在這個設想上,prompt engineering 可能即將成為一項必備的技能,就像使用 Microsoft Office 的技能一樣普遍。你能想像在沒有 Excel 的情況下勝任工作嗎?
簡單來說,prompt engineering 的目標是提出清晰的指令,達致人類和機器之間有效的溝通。計算機的「思維模式」建基於數學公式和運算模型,每一項元素都具有極強的邏輯性。
想像一場完全順暢的對話,每一個詞彙和句子都經過有意的選擇和安排。使用清晰、精確和具邏輯性的語言,prompt engineering 可以縮小個人思想和實際表達之間的誤差,確保指令被完全接收,不會發生任何錯解。
Prompt engineering 可能會徹底改變我們的溝通方式。
總而言之,隨著人工智能在我們的生活中扮演著越來越重要的角色,了解如何掌握其力量比以往任何時候都更加重要。這就是為什麼學習 prompt engineering 是掌控人工智能並將其用於提高生產力的關鍵技能。只有我們不斷學習,才能在這場人工智能革命中取得主權!