放眼世界,醫務人員工作壓力大以及工時長的問題一直備受關注。在新冠病毒肆虐之前,已經有超過40%的醫生感到過勞。在香港情況更甚:根據報導,香港本地的年輕醫生中,不僅僅有70%過勞,而且有20%抑鬱。情況在新冠病毒肆虐後惡化,醫務人員的工作量進一步增加。其中,因為護士的人手緊縮,30%的護士的工作量增加了一倍以上。冰凍三尺非一日之寒,醫務人員的緊缺問題已經由來已久,人們開始發掘人工智能在醫護界的應用,填補人員的空缺。
人工智能應用五花八門,醫護界的AI便是一個最近越來越普及;人們往往覺得智能醫生只會根據硬性指標下決定,但是現在的AI醫生不僅僅可以根據實際情況診症,而且還可以在其他方面幫助醫生:
醫生的工作,在看診之前便已經開始了:在病人出現之前,醫生要收集並整理患者信息。有研究顯示,基於文本的AI聊天機器人可以被運用在這個領域。Decoded Health是一家開發Siri背後技術的研究組織,它提供「虛擬醫務人員」(Virtual medical resident),使用自然語言處理技術總結患者的資訊,並提供醫療建議。同樣的技術亦可指導非醫護人員完成病人評估,指導患者完成症狀檢查、提供護理建議和安排預約。
人工智能分診工具還可以有效的減輕急診室的壓力:它可以幫助標記需要重症監護的患者,篩選出最嚴重的病例,優先考慮他們的護理。人工智能分診工具在臨床有這些應用:
分析CT 結果,檢測中風、腦出血和肺栓塞跡象
分析X-光以檢測骨折和其他關節常見的傷勢
分析入院時收集的 EHR 數據和患者生命體徵,以幫助急診護士發現敗血症的警告信號
分析生命體徵以及患者人口統計數據和病史,以提出快速護理建議
研究發現,醫生平均會在患者就診時花費16分鐘在電子健康紀錄上。基於自然語言處理技術,人工智能可以作為數字助理,在醫生與患者進行對話時轉錄及提取重要訊息,自動將其放入病歷的合適位置。除此之外,AI數字助理還可以被放射科使用,根據口述筆記提供建議並發現潛在錯誤。
病人的化驗結果至關重要,病人的檢測結果會影響大約2/3的醫生的決定。化驗人員無時無刻都需要馬不停蹄地檢測。將醫學化驗自動化不僅僅可以提升效率,而且還可以提高準確率。在為期 13 個月的試點中,德克薩斯大學醫學分院醫院使用BioConiv的AI來幫助處理超過 325,000 個 COVID-19 測試,收穫了喜人的結果:在更少的人手的情況下,檢測的效率反而上升了,而且重症率及死亡率也顯著的下降。除了檢測COVID-19之外,人們相信未來AI還可以被應用在敗血症、呼吸衰竭等其他病症裡。
毋庸置疑,隨著科技的進步,AI醫生的潛力十分龐大。但與此同時,許多的質疑和疑問也環繞著AI醫生。儘管AI診症的準確度越來越高,但是診斷過程的瑕疵依舊讓許多人望而卻步。
AI模型取決於演算法,而演算法的能力則受限於人們所提供的訓練數據;如果數據不夠多元,那麼AI醫生在診斷時,或會帶有偏見,無法時時刻刻都做出最精準的判斷。例如,2017年一項研究就發現一個關於兒童智能障礙的AI醫生對比利時白人兒童的診斷準確率為80%,但對剛果的黑人只有不到40%。現時絕大多數的AI醫生的訓練數據都以白人為主,導致AI醫生的偏見。只有在未來曠闊數據來源,使數據多元化後AI醫生才能穩定的發揮。
現時在實驗室以樣本照片訓練演算法的表現或許十分理想,但是許多實地使用的結果卻和實驗室有巨大的落差。在2018年,Google在印度的試驗就是活生生的例子:當地遙距醫療中心的醫生與AI醫生一同診斷6張照片;雖然大部分照片都因為設備落後而不夠清晰,但是醫生仍然可以正確診斷,但是AI醫生則在六張照片中給出了三個不同的結果。若人類見到了不清晰的圖片,他還是會通過當中清晰的部分盡力診斷,但是AI卻對此無能為力。通過不同的訓練方法,演算法或許可以辨認模糊的照片,但是為此便會捨去了AI醫生的靈敏度,無法發現微小的細節。
AI醫生的學習和運作方法是一個黑箱子:AI醫生可以準確診斷病症,但是人們永遠都不會知道這個診斷的理據。近幾年,已經有一些AI醫生能夠提前辨認出人類醫生看不到的病變,但是即便連AI醫生的開發者也不知道原因。這種程序上的不透明不僅僅讓人難以信賴,而且還會衍生出許多問題:
如何定奪AI醫生的錯誤是無法避免的,還是演算法的缺失?
即使AI診斷正確,但是醫生和醫院在完全不知道其診斷原因的情況下聽從AI醫生的診斷,這決定又是否正確?
AI醫生展現了強大的診症能力和潛力,但是診症僅僅只是醫生職責的一部分。除了診症之外,醫生還需要錄入病人紀錄,體察、關懷病人並與病人討論病情。醫生的知識至關重要,AI醫生也有許多限制,但是,無論如何,AI可以將重複性的工作自動化,從而令醫生全神貫注於其餘的部分裡,這已經十分足夠了。
資料:Fast Company, HK01, Google, HKCSS