食管癌是一種侵襲性惡性腫瘤,發病率高,預后差。食管癌早期癥狀隱匿難以發現,中晚期食管梗阻、病灶浸潤和轉移嚴重影響患者生活質量,早期發現和治療有助于增加患者的生存機會。近年來,人工智能(artificial intelligence,AI)在輔助診斷食管癌方面取得了卓越成果,突顯了新型AI輔診模式的巨大應用潛能。本文將綜述AI在食管癌診斷中的應用進展,并對其臨床應用前景進行展望。
食管癌是全球最常見的10種新發癌癥之一,2020年全球新發病例為60.4萬例,死亡病例為54.4萬例。其中我國新發病例為32.4萬例,死亡病例為30.1萬例,分別占全球的53.70%和55.35%[1-2]。食管癌主要分為食管鱗狀細胞癌(esophageal squamous cell carcinoma,ESCC)和食管腺癌(esophageal adenocarcinoma,EAC)兩種組織學類型,其中ESCC的占比高達90%[3]。近年來,由于篩查及診療技術的不斷提高,我國食管癌患者術后3年及5年總生存率已分別提升至61.6%及52.9%[4],但總體仍然偏低。食管癌患者的生存時間與其臨床分期密切相關,早期食管癌患者在接受治療后5年生存率可達90%以上[5]。因此,早診早治對改善食管癌患者的預后尤為重要。
食管癌的診斷方法主要包括消化內鏡、影像學檢查和病理學檢查等。消化內鏡廣泛應用于食管癌的診斷、治療及預后評估中,為食管癌的早發現、早診斷和早治療提供了有力保障,是提高食管癌患者生存率的重要方法[6]。消化內鏡檢查方法包括白光內鏡(white-light imaging,WLI)、窄帶光譜成像技術(narrow-band imaging,NBI)、碘染色和放大內鏡(magnification endoscopy,ME)等。影像學檢查高效、便捷且可清晰展示組織結構的改變情況,在食管癌的診斷、分期及療效評估中具有重要價值,是發現癌癥的重要技術[7]。病理學檢查被認為是癌癥診斷的“金標準”,常見的組織學方法有蘇木精-伊紅染色和免疫組織化學染色。早期食管癌患者的癥狀不典型,據文獻[8]報道,我國早期食管癌的檢出率不足10%,遠低于日本等發達國家水平。因此,開發一種輔助醫生發現食管癌的診斷系統對提高我國早期食管癌的檢出率具有重要意義。
隨著深度學習和計算機視覺技術的快速發展,越來越多的學者開始探索利用人工智能(artificial intelligence,AI)輔助診斷食管癌的方法。AI旨在模擬人類的思維過程、學習能力和知識存儲,并設計出一些類似人智能的自動機[9]。機器學習是實現AI的重要途徑,它可分為傳統學習方法與深度學習方法(deep learning,DL)。DL通過數據轉換層來識別給定數據集的特征,以便對數據進行分類。卷積神經網絡(convolutional neural network,CNN)是DL在圖像識別領域中常用的方法之一,它模擬了基于大腦視覺皮層神經元對某些視覺刺激的特定反應[10-11],對大量的醫學圖像進行學習和訓練,分析圖像與病變之間的關聯,幫助醫生快速、精準地完成診斷[12]。目前,已經有多種多模態和多功能AI輔助診斷食管癌的研究被報道。本文將綜述這些研究進展,并對未來的發展趨勢進行探討,旨在為相關研究提供參考和借鑒,以期為食管癌的早期診斷提供更加高效和精準的解決方案。
1 人工智能輔助內鏡診斷食管鱗狀細胞癌
病變檢出是內鏡診斷ESCC的基礎,在WLI下,即使使用高清內鏡,淺表ESCC也容易被漏診。Feng等[13]構建了一個AI系統,1283例患者的5892張WLI圖像用于訓練AI系統,1224例患者的4529張圖像用于驗證該AI系統。該AI系統開發了一個CNN模型,用于WLI下淺表ESCC病變的識別和定位,其在內部驗證集中檢測ESCC的敏感性、特異性和準確性分別為96.64%、95.35%和91.75%,在外部驗證集中分別為90.17%、94.34%和88.38%。在識別癌性病變影像特征方面,AI系統的診斷性能與內鏡專家相當,顯著優于中級和初級內鏡醫師。在AI系統輔助下,內鏡醫師整體人工診斷的準確性(75.12% vs. 84.95%,P=0.008)、特異性(63.29% vs. 76.59%,P=0.017)顯著提高。Ayaka等[14]用25048張淺表ESCC內鏡圖像和4746張正常內鏡圖像構建了一個AI系統,用147個模擬臨床應用的視頻作為驗證數據集。該AI系統采用BigTransfer(BiT)的方法來訓練數據集和圖像標注,此方法是計算機視覺領域最先進的遷移學習模型。結果顯示,AI系統對ESCC分類的準確性、敏感性和特異性分別為80.9%、85.5%和75.0%,內鏡醫生分別為69.2%、67.5%和71.5%。在病變大小和病變浸潤深度亞組分析中,該AI系統正確分類了所有侵犯黏膜肌層或黏膜下層的ESCC。以上研究結果提示,AI系統在內鏡圖像及視頻中診斷ESCC具有出色性能,具有與專家級內鏡醫生相當的診斷能力,可以作為內鏡醫師在日常內鏡檢查中檢測淺表ESCC的輔助方法。
ESCC浸潤深度與腫瘤分期密切相關,準確判斷病變浸潤深度可以指導選擇手術方式。2002年內鏡專家將食管鱗狀上皮乳頭內毛細血管袢(intraepithelial papillary capillary loop,IPCL)的狀態作為診斷組織異型性的唯一可靠征象[15]。日本食管學會[16]提出簡單易行的IPCL分型,將食管黏膜淺表血管分為A型和B型,B型又分B1型、B2型和B3型,根據IPCL分型間接診斷ESCC的浸潤深度。Yuan等[17]構建了首個相對較全面地涵蓋ESCC中IPCL分類(A型、B1型、B2型和B3型血管)的AI系統,使用一種稱為HRNet+OCR的DCNN算法來訓練AI系統。該AI系統回顧性收集了3家醫院的ME-NBI食管內鏡圖像,使用內部和外部驗證數據集評估該AI系統的性能,結果內部測試集和外部測試集中診斷IPCL的總體準確性分別為91.3%和89.8%,優于資深內鏡醫生(87.1%)和初級內鏡醫生(78.2%),表明其具有極強的泛化能力。在與訓練集數據同源的在IPCL亞型的個體準確性、敏感性和特異性方面,除B3型外,AI系統對其他3種IPCL亞型的診斷性能顯著優于資深和初級內鏡醫生,顯示出AI系統輔助內鏡醫生診斷的潛在能力。Shimamoto等[18]使用常規及放大內鏡視頻訓練AI系統,雖然有些圖像清晰度欠佳,AI系統判斷ESCC浸潤深度的準確性仍然優于內鏡專家(87%~89% vs. 84%~85%)。AI系統在診斷IPCL亞型和預測浸潤深度方面表現出了比內鏡醫生更好的性能。
病變的側邊范圍與內鏡治療后食管狹窄的發生率密切相關,準確判斷病灶范圍對選擇活檢部位和指導手術過程意義重大。Guo等[19]構建的AI系統可以診斷食管黏膜病變性質并判斷病變范圍。當AI系統檢測到任何癌前病變或淺表ESCC時,病變區域將被不同顏色覆蓋,黃色代表癌性病變的可能性高,藍色代表非癌性病變。該研究顯示出AI判斷ESCC病變范圍的可行性。Liu等[20]報道了可在WLI下檢測ESCC并勾畫病變邊界的AI系統。選用了1239例患者的13083張內鏡圖片,其中4885張淺表ESCC圖片和5582張WLI圖像用于訓練該AI系統,另外2616張圖片用作內部驗證,該AI系統用綠色的多邊形顯示病灶,它在內部和外部驗證中檢測病變的準確性分別為85.7%和84.5%;在勾畫病變邊界方面,它在內部和外部驗證中的準確性分別為93.4%和95.7%。該AI系統勾畫病變邊界的準確性與專家相似(98.1% vs. 95.3%),顯著優于年輕內鏡醫生(98.1% vs. 78.6%)。Yuan等[21]研發的AI系統用于在NBI下檢測淺表ESCC和癌前病變,并描繪病變范圍。在靜態圖像測試中,AI系統在內部和外部測試集中檢測病灶的準確性分別為92.4%和89.9%,勾畫病變范圍的準確性分別為88.9%和87.0%。該AI系統勾畫病變邊界的性能優于初級內鏡醫生,與高級內鏡醫生相當。在前瞻性臨床評價中,該AI系統表現出令人滿意的性能,檢出病灶的準確性為91.4%,勾畫病變范圍的準確性為85.9%。AI系統在檢測和描繪淺表ESCC邊緣方面具有良好的準確性,有助于淺表ESCC病變的圈定,輔助制定合理的治療方案。
不久前日本學者Tani等[22]進行了一項評估AI系統在臨床環境中實時診斷ESCC的研究,采用單中心前瞻性設計,共納入380例ESCC高危患者,將AI系統實時診斷疑似ESCC病變的結果與內鏡醫師進行比較。結果AI系統的準確性為80.6%,敏感性為68.2%,特異性為83.4%。內鏡醫師的準確性、敏感性和特異性分別為85.7%、61.4%和91.2%,兩者差異無統計學意義。主要原因可能是訓練AI系統用的是壓縮圖像,而臨床環境中獲得的是原始圖像,兩者差異不能避免。未來可以通過使用未壓縮格式保存的內鏡圖像進行訓練來提高AI系統的診斷性能。
AI系統在淺表ESCC的臨床應用尚處于起步階段,絕大多數研究都是回顧性研究,研究方法主要在AI算法、訓練和驗證等方面,并與不同年資內鏡醫生的敏感性、準確性和特異性進行比較。目前還沒有大規模的AI臨床應用用于監測和檢測,將AI系統真正應用于臨床還有很長一段路要走。
2 人工智能輔助內鏡診斷食管腺癌
EAC是北美和歐洲主要的食管癌[23],Barrett食管(barrett’s esophagus,BE)是EAC的一種癌前病變[24],在BE中檢測病灶區域的不典型增生或早期EAC具有挑戰性,當發現局灶性病變時,進一步區分非發育不良或炎癥、低級別發育不良、高級別發育不良和腺癌更為困難。Madabhushi等[25]研制了一個光譜內窺鏡,用來識別BE不同類別新生血管的變化(包括非異型增生BE、異型增生BE和黏膜內EAC),該AI系統的診斷準確性可達84.4%。Maarten等[26]采用前瞻性多中心來源的數據構建AI系統,由前22例患者的172個靶點組成訓練集,由隨后的25例患者的146個靶點組成單獨的測試集,總共得到16218張WLI圖像。該AI系統檢測BE的準確性、敏感性和特異性分別為92%、95%和92%,而10位內鏡醫生分別為77%、70%和81%,該AI系統的性能優于內鏡醫生。Tan等[27]的系統綜述基于1361例患者的50多萬張圖像,發現AI系統可以準確地檢測早期BE病變,受試者工作特征曲線下面積為0.94,合并敏感性為90.3%,合并特異性為84.4%。AI系統有助于發現早期EAC病變,食管腫瘤早期可采用微創內鏡治療,其并發癥、患者體驗及醫療費用明顯優于外科手術。
上述AI系統檢測BE及EAC是在內鏡圖像上完成的,這可能不能充分反映現實臨床的情況,為了將AI系統無縫應用到臨床工作中,一系列實時檢測BE及EAC的研究接踵而至。Jeroen等[28]開發了一種用于實時檢測BE瘤變的AI系統,該AI系統前瞻性收集了40例腫瘤性BE食管和20例非發育不良BE食管患者的WLI全景圖像,訓練和驗證其在WLI圖像上檢測和定位早期BE腫瘤的性能,結果顯示該AI系統的準確性、敏感性和特異性分別為92%、95%和85%。Hashimoto等[29]使用T1期癌患者的916張圖像和BE患者的919張圖像研發了一個AI系統,采用Inception-ResNet-v2算法,通過在實時視頻中測試,發現AI檢測病變的敏感性為96.4%,特異性為94.2%,準確性為95.4%。該AI系統還能在圖像中快速、準確地定位出病變區域。Ebigbo等[30]探究了AI在實時多模態成像內鏡檢查中輔助檢測和分割BE相關腫瘤的可行性,發現AI可以準確地檢測并描繪出小病變的邊界。Ebigbo等[31]將AI系統用于診斷早期EAC,這是DL-AI系統首次在真實臨床環境中的實時應用,該AI系統診斷的敏感性為83.7%,特異性為100.0%,準確性為89.9%,其性能與經驗豐富的內鏡醫生相當。
在臨床實踐中準確判斷BE的化生程度具有一定難度。Ali等[32]使用AI系統模擬BE的布拉格C&M分類,在內鏡檢查期間自動提取這些測量值,結果發現該AI系統的準確性超過97%。Pan等[33]開發了的AI系統可自動識別內鏡靜態圖像中的BE化生,該AI系統在內鏡圖像中分割BE范圍的精度與人工評估的范圍一致,這種自動識別方法有助于輔助臨床醫生在內鏡檢查中定位和識別BE的范圍。
EAC浸潤深度的識別具有挑戰性,需要內鏡醫師高水平的專業知識來保證準確性[34]。病變浸潤深度的識別對手術方式的選擇意義重大,特別是在區分黏膜和黏膜下浸潤時,內鏡切除方法的區別是內鏡下黏膜切除術(endoscopic mucosal resection,EMR)和內鏡黏膜下剝離術(endoscopic submucosal dissection,ESD)。Ebigbo等[35]回顧性收集了116例多中心來源的EAC患者的數據構建AI系統,用230張(108張T1a期和122張T1b期)WLI圖像訓練并測試系統,結果發現該AI系統區分T1a/T1b期癌癥的敏感性、特異性、F1評分和準確性分別為0.77%、0.64%、0.74%和0.71%,得分與內鏡專家相當。
對BE及EAC病變范圍的確認可以指導活檢及手術,Ebigbo等[36]從2個數據庫(Augsburg和MICCAI)中挑選圖像研發AI系統,在Augsburg數據中AI系統診斷EAC的敏感性和特異性分別為97%和88%;在MICCAI數據中AI系統在WLI下的敏感性和特異性分別為92%和100%,NBI下分別為94%和80%。除診斷病變外,AI系統還可對BE和EAC病變區域進行粗略分割。計算AI系統分割區域與專家分割區域的重疊程度Dice系數(D),結果發現在Augsburg數據中D=0.72,MICCAI數據中D=0.56,該AI系統具有良好的自動分割病變區域的能力。Hussein等[37]構建了兩種AI系統:一種用于檢測BE,另一種用于描繪BE區域。該AI系統通過熱圖來呈現檢測和分割結果,即不同病變區域顯示不同顏色,其中紅色區域表示異常病變區域,是進行靶向活檢的最佳位置。經過測試發現AI系統檢測BE的敏感性和特異性分別為91%和79%,AI系統與內鏡專家描繪BE區域的重疊率可高達98%。
然而,大多數關于EAC的研究是在西方國家進行的。西方和亞洲地區EAC的特征不同[38],使用基于西方病例的訓練集開發的AI系統是否適用于亞洲的臨床實踐是值得考慮的,在亞洲開發一個經過EAC案例培訓的AI系統勢在必行。日本Iwagami等[39]用食管胃交界處腺癌患者的內鏡圖像來構建AI系統,發現該AI系統的診斷敏感性、特異性和準確性分別為94%、42%和66%,內鏡醫生則分別為88%、43%和63%。
3 人工智能輔助影像學診斷食管癌
醫學影像學在臨床診斷和治療中發揮著重大的作用,是發現癌癥的重要技術,在過去10年中,計算機化工具的發展越來越多,這些工具可以將圖像轉換為定量的可挖掘數據(放射組學),并隨后使用AI進行分析。這些工具正在提高早期病變診斷的準確性,以確定風險并將惡性疾病與良性疾病區分開來。許多研究和證據[40-43]綜合表明,放射組學具有識別各種癌癥原發腫瘤和淋巴結異質性的潛力,可用于臨床診斷和預后。AI系統在CT圖像上對術前臨床、影像及病理特征進行篩選,可預測食管癌淋巴結轉移風險[44-48]、預測食管癌根治性放化療療效[49-50]。
Ypsilantis等[51]基于107例食管癌患者的試驗結果構建AI系統,采用MSGD(stochastic gradient-descent algorithm with mini batches)算法,從治療前的正電子發射計算機斷層顯像(positron emission tomography-computed tomography,PET-CT)中自動提取關鍵特征,用于預測食管癌新輔助化療療效,該AI系統的敏感性和特異性分別為80.7%和81.6%,優于基于手工提取影像特征的傳統機器學習算法。與僅使用臨床特征相比,Van等[52]的研究添加全面的PET特征可提高模型的預測能力。Foley等[53]建立的結合PET-CT結構分析食管癌患者的預后模型,可對食管癌患者進行風險分層。
磁共振成像(magnetic resonance imaging,MRI)對軟組織的分辨率更高,適用于食管腫瘤及縱隔淋巴結的評估。Qu等[54]用181例食管癌患者治療前的MRI構建AI系統,使用Matlab自制程序計算放射學特征,發現基于MRI的影像組學診斷淋巴結轉移的受試者工作特征曲線下面積值可達0.82,MRI放射特征可以預測食管癌患者術前淋巴結轉移。Hou等[55]對68例根治性放化療的ESCC患者進行療效預測,采用兩種方法——支持向量機和人工神經網絡構建AI模型,發現兩者均有較高的預測準確性,MRI放射組學可以預測ESCC放化療的治療反應。
4 人工智能輔助病理學診斷食管癌
食管癌的病理學形態[56]及免疫組化特征[57]被證實與患者預后密切相關。Tomita等[58]在123張組織學圖像上進行評估,該AI系統準確識別顯微鏡圖像上的癌性和癌前食管病變的平均準確率為0.83%,該AI系統是第1個使用DL方法自動檢測組織病理學載玻片上的BE和EAC的模型。Kouzu等[59]從222例手術切除的ESCC病例中隨機選擇31例患者的切片用于訓練和開發AI系統,切片采用蘇木精-伊紅數字化整片切片。結果顯示該AI系統Dice系數得分為0.81。使用AI系統可以客觀定量地評估ESCC中的纖維組織增生反應(desmoplastic reaction,DR),AI輔助的DR分類比手動DR分類對疾病特異性生存有更高的預后意義,且AI輔助的DR分類優于金標準因素腫瘤深度和淋巴結轉移的預后準確性。
5 總結與展望
盡管近年來AI在診斷食管癌領域中的研究成果頗多,展現出AI在輔助醫生診斷食管癌方面的巨大潛力,但其真正臨床應用和推廣仍面臨著許多挑戰。(1)樣本量少,沒有獨立的訓練集和測試集,應建立大的圖像數據庫,訓練AI軟件程序。(2)樣本多為清晰的高質量圖像,不能完全模擬真實的臨床情況,應研發實時AI診斷系統,多模態數據融合,將不同類型的醫學圖像數據(如內鏡圖像、CT、MRI等)綜合分析和診斷,提高AI系統的準確性。(3)納入的研究多為單中心回顧性研究,需要進一步的多中心前瞻性臨床試驗驗證,穩健性及普適性仍需要在多中心、真實世界大數據中進行驗證。(4)采集設備、采集參數和重建算法的差異,導致數據信號和質量的差異,數據應規范化和標準化。(5)AI系統輔助診斷過程中的醫療責任尚不明確,應制定有關倫理安全、數據所有權和AI系統診斷性能外部驗證的共識指南。期望在不久的將來AI可以真正落地應用于臨床實踐,提升醫療效率,服務廣大醫生和患者。
利益沖突:無。
作者貢獻:唐川君參與選題和設計,數據整理與分析,論文初稿撰寫及修改;袁湘蕾參與選題和設計,起草、修改論文;張瓊英參與選題和設計,修改論文;胡兵參與選題和設計,修改論文。
食管癌是全球最常見的10種新發癌癥之一,2020年全球新發病例為60.4萬例,死亡病例為54.4萬例。其中我國新發病例為32.4萬例,死亡病例為30.1萬例,分別占全球的53.70%和55.35%[1-2]。食管癌主要分為食管鱗狀細胞癌(esophageal squamous cell carcinoma,ESCC)和食管腺癌(esophageal adenocarcinoma,EAC)兩種組織學類型,其中ESCC的占比高達90%[3]。近年來,由于篩查及診療技術的不斷提高,我國食管癌患者術后3年及5年總生存率已分別提升至61.6%及52.9%[4],但總體仍然偏低。食管癌患者的生存時間與其臨床分期密切相關,早期食管癌患者在接受治療后5年生存率可達90%以上[5]。因此,早診早治對改善食管癌患者的預后尤為重要。
食管癌的診斷方法主要包括消化內鏡、影像學檢查和病理學檢查等。消化內鏡廣泛應用于食管癌的診斷、治療及預后評估中,為食管癌的早發現、早診斷和早治療提供了有力保障,是提高食管癌患者生存率的重要方法[6]。消化內鏡檢查方法包括白光內鏡(white-light imaging,WLI)、窄帶光譜成像技術(narrow-band imaging,NBI)、碘染色和放大內鏡(magnification endoscopy,ME)等。影像學檢查高效、便捷且可清晰展示組織結構的改變情況,在食管癌的診斷、分期及療效評估中具有重要價值,是發現癌癥的重要技術[7]。病理學檢查被認為是癌癥診斷的“金標準”,常見的組織學方法有蘇木精-伊紅染色和免疫組織化學染色。早期食管癌患者的癥狀不典型,據文獻[8]報道,我國早期食管癌的檢出率不足10%,遠低于日本等發達國家水平。因此,開發一種輔助醫生發現食管癌的診斷系統對提高我國早期食管癌的檢出率具有重要意義。
隨著深度學習和計算機視覺技術的快速發展,越來越多的學者開始探索利用人工智能(artificial intelligence,AI)輔助診斷食管癌的方法。AI旨在模擬人類的思維過程、學習能力和知識存儲,并設計出一些類似人智能的自動機[9]。機器學習是實現AI的重要途徑,它可分為傳統學習方法與深度學習方法(deep learning,DL)。DL通過數據轉換層來識別給定數據集的特征,以便對數據進行分類。卷積神經網絡(convolutional neural network,CNN)是DL在圖像識別領域中常用的方法之一,它模擬了基于大腦視覺皮層神經元對某些視覺刺激的特定反應[10-11],對大量的醫學圖像進行學習和訓練,分析圖像與病變之間的關聯,幫助醫生快速、精準地完成診斷[12]。目前,已經有多種多模態和多功能AI輔助診斷食管癌的研究被報道。本文將綜述這些研究進展,并對未來的發展趨勢進行探討,旨在為相關研究提供參考和借鑒,以期為食管癌的早期診斷提供更加高效和精準的解決方案。
1 人工智能輔助內鏡診斷食管鱗狀細胞癌
病變檢出是內鏡診斷ESCC的基礎,在WLI下,即使使用高清內鏡,淺表ESCC也容易被漏診。Feng等[13]構建了一個AI系統,1283例患者的5892張WLI圖像用于訓練AI系統,1224例患者的4529張圖像用于驗證該AI系統。該AI系統開發了一個CNN模型,用于WLI下淺表ESCC病變的識別和定位,其在內部驗證集中檢測ESCC的敏感性、特異性和準確性分別為96.64%、95.35%和91.75%,在外部驗證集中分別為90.17%、94.34%和88.38%。在識別癌性病變影像特征方面,AI系統的診斷性能與內鏡專家相當,顯著優于中級和初級內鏡醫師。在AI系統輔助下,內鏡醫師整體人工診斷的準確性(75.12% vs. 84.95%,P=0.008)、特異性(63.29% vs. 76.59%,P=0.017)顯著提高。Ayaka等[14]用25048張淺表ESCC內鏡圖像和4746張正常內鏡圖像構建了一個AI系統,用147個模擬臨床應用的視頻作為驗證數據集。該AI系統采用BigTransfer(BiT)的方法來訓練數據集和圖像標注,此方法是計算機視覺領域最先進的遷移學習模型。結果顯示,AI系統對ESCC分類的準確性、敏感性和特異性分別為80.9%、85.5%和75.0%,內鏡醫生分別為69.2%、67.5%和71.5%。在病變大小和病變浸潤深度亞組分析中,該AI系統正確分類了所有侵犯黏膜肌層或黏膜下層的ESCC。以上研究結果提示,AI系統在內鏡圖像及視頻中診斷ESCC具有出色性能,具有與專家級內鏡醫生相當的診斷能力,可以作為內鏡醫師在日常內鏡檢查中檢測淺表ESCC的輔助方法。
ESCC浸潤深度與腫瘤分期密切相關,準確判斷病變浸潤深度可以指導選擇手術方式。2002年內鏡專家將食管鱗狀上皮乳頭內毛細血管袢(intraepithelial papillary capillary loop,IPCL)的狀態作為診斷組織異型性的唯一可靠征象[15]。日本食管學會[16]提出簡單易行的IPCL分型,將食管黏膜淺表血管分為A型和B型,B型又分B1型、B2型和B3型,根據IPCL分型間接診斷ESCC的浸潤深度。Yuan等[17]構建了首個相對較全面地涵蓋ESCC中IPCL分類(A型、B1型、B2型和B3型血管)的AI系統,使用一種稱為HRNet+OCR的DCNN算法來訓練AI系統。該AI系統回顧性收集了3家醫院的ME-NBI食管內鏡圖像,使用內部和外部驗證數據集評估該AI系統的性能,結果內部測試集和外部測試集中診斷IPCL的總體準確性分別為91.3%和89.8%,優于資深內鏡醫生(87.1%)和初級內鏡醫生(78.2%),表明其具有極強的泛化能力。在與訓練集數據同源的在IPCL亞型的個體準確性、敏感性和特異性方面,除B3型外,AI系統對其他3種IPCL亞型的診斷性能顯著優于資深和初級內鏡醫生,顯示出AI系統輔助內鏡醫生診斷的潛在能力。Shimamoto等[18]使用常規及放大內鏡視頻訓練AI系統,雖然有些圖像清晰度欠佳,AI系統判斷ESCC浸潤深度的準確性仍然優于內鏡專家(87%~89% vs. 84%~85%)。AI系統在診斷IPCL亞型和預測浸潤深度方面表現出了比內鏡醫生更好的性能。
病變的側邊范圍與內鏡治療后食管狹窄的發生率密切相關,準確判斷病灶范圍對選擇活檢部位和指導手術過程意義重大。Guo等[19]構建的AI系統可以診斷食管黏膜病變性質并判斷病變范圍。當AI系統檢測到任何癌前病變或淺表ESCC時,病變區域將被不同顏色覆蓋,黃色代表癌性病變的可能性高,藍色代表非癌性病變。該研究顯示出AI判斷ESCC病變范圍的可行性。Liu等[20]報道了可在WLI下檢測ESCC并勾畫病變邊界的AI系統。選用了1239例患者的13083張內鏡圖片,其中4885張淺表ESCC圖片和5582張WLI圖像用于訓練該AI系統,另外2616張圖片用作內部驗證,該AI系統用綠色的多邊形顯示病灶,它在內部和外部驗證中檢測病變的準確性分別為85.7%和84.5%;在勾畫病變邊界方面,它在內部和外部驗證中的準確性分別為93.4%和95.7%。該AI系統勾畫病變邊界的準確性與專家相似(98.1% vs. 95.3%),顯著優于年輕內鏡醫生(98.1% vs. 78.6%)。Yuan等[21]研發的AI系統用于在NBI下檢測淺表ESCC和癌前病變,并描繪病變范圍。在靜態圖像測試中,AI系統在內部和外部測試集中檢測病灶的準確性分別為92.4%和89.9%,勾畫病變范圍的準確性分別為88.9%和87.0%。該AI系統勾畫病變邊界的性能優于初級內鏡醫生,與高級內鏡醫生相當。在前瞻性臨床評價中,該AI系統表現出令人滿意的性能,檢出病灶的準確性為91.4%,勾畫病變范圍的準確性為85.9%。AI系統在檢測和描繪淺表ESCC邊緣方面具有良好的準確性,有助于淺表ESCC病變的圈定,輔助制定合理的治療方案。
不久前日本學者Tani等[22]進行了一項評估AI系統在臨床環境中實時診斷ESCC的研究,采用單中心前瞻性設計,共納入380例ESCC高危患者,將AI系統實時診斷疑似ESCC病變的結果與內鏡醫師進行比較。結果AI系統的準確性為80.6%,敏感性為68.2%,特異性為83.4%。內鏡醫師的準確性、敏感性和特異性分別為85.7%、61.4%和91.2%,兩者差異無統計學意義。主要原因可能是訓練AI系統用的是壓縮圖像,而臨床環境中獲得的是原始圖像,兩者差異不能避免。未來可以通過使用未壓縮格式保存的內鏡圖像進行訓練來提高AI系統的診斷性能。
AI系統在淺表ESCC的臨床應用尚處于起步階段,絕大多數研究都是回顧性研究,研究方法主要在AI算法、訓練和驗證等方面,并與不同年資內鏡醫生的敏感性、準確性和特異性進行比較。目前還沒有大規模的AI臨床應用用于監測和檢測,將AI系統真正應用于臨床還有很長一段路要走。
2 人工智能輔助內鏡診斷食管腺癌
EAC是北美和歐洲主要的食管癌[23],Barrett食管(barrett’s esophagus,BE)是EAC的一種癌前病變[24],在BE中檢測病灶區域的不典型增生或早期EAC具有挑戰性,當發現局灶性病變時,進一步區分非發育不良或炎癥、低級別發育不良、高級別發育不良和腺癌更為困難。Madabhushi等[25]研制了一個光譜內窺鏡,用來識別BE不同類別新生血管的變化(包括非異型增生BE、異型增生BE和黏膜內EAC),該AI系統的診斷準確性可達84.4%。Maarten等[26]采用前瞻性多中心來源的數據構建AI系統,由前22例患者的172個靶點組成訓練集,由隨后的25例患者的146個靶點組成單獨的測試集,總共得到16218張WLI圖像。該AI系統檢測BE的準確性、敏感性和特異性分別為92%、95%和92%,而10位內鏡醫生分別為77%、70%和81%,該AI系統的性能優于內鏡醫生。Tan等[27]的系統綜述基于1361例患者的50多萬張圖像,發現AI系統可以準確地檢測早期BE病變,受試者工作特征曲線下面積為0.94,合并敏感性為90.3%,合并特異性為84.4%。AI系統有助于發現早期EAC病變,食管腫瘤早期可采用微創內鏡治療,其并發癥、患者體驗及醫療費用明顯優于外科手術。
上述AI系統檢測BE及EAC是在內鏡圖像上完成的,這可能不能充分反映現實臨床的情況,為了將AI系統無縫應用到臨床工作中,一系列實時檢測BE及EAC的研究接踵而至。Jeroen等[28]開發了一種用于實時檢測BE瘤變的AI系統,該AI系統前瞻性收集了40例腫瘤性BE食管和20例非發育不良BE食管患者的WLI全景圖像,訓練和驗證其在WLI圖像上檢測和定位早期BE腫瘤的性能,結果顯示該AI系統的準確性、敏感性和特異性分別為92%、95%和85%。Hashimoto等[29]使用T1期癌患者的916張圖像和BE患者的919張圖像研發了一個AI系統,采用Inception-ResNet-v2算法,通過在實時視頻中測試,發現AI檢測病變的敏感性為96.4%,特異性為94.2%,準確性為95.4%。該AI系統還能在圖像中快速、準確地定位出病變區域。Ebigbo等[30]探究了AI在實時多模態成像內鏡檢查中輔助檢測和分割BE相關腫瘤的可行性,發現AI可以準確地檢測并描繪出小病變的邊界。Ebigbo等[31]將AI系統用于診斷早期EAC,這是DL-AI系統首次在真實臨床環境中的實時應用,該AI系統診斷的敏感性為83.7%,特異性為100.0%,準確性為89.9%,其性能與經驗豐富的內鏡醫生相當。
在臨床實踐中準確判斷BE的化生程度具有一定難度。Ali等[32]使用AI系統模擬BE的布拉格C&M分類,在內鏡檢查期間自動提取這些測量值,結果發現該AI系統的準確性超過97%。Pan等[33]開發了的AI系統可自動識別內鏡靜態圖像中的BE化生,該AI系統在內鏡圖像中分割BE范圍的精度與人工評估的范圍一致,這種自動識別方法有助于輔助臨床醫生在內鏡檢查中定位和識別BE的范圍。
EAC浸潤深度的識別具有挑戰性,需要內鏡醫師高水平的專業知識來保證準確性[34]。病變浸潤深度的識別對手術方式的選擇意義重大,特別是在區分黏膜和黏膜下浸潤時,內鏡切除方法的區別是內鏡下黏膜切除術(endoscopic mucosal resection,EMR)和內鏡黏膜下剝離術(endoscopic submucosal dissection,ESD)。Ebigbo等[35]回顧性收集了116例多中心來源的EAC患者的數據構建AI系統,用230張(108張T1a期和122張T1b期)WLI圖像訓練并測試系統,結果發現該AI系統區分T1a/T1b期癌癥的敏感性、特異性、F1評分和準確性分別為0.77%、0.64%、0.74%和0.71%,得分與內鏡專家相當。
對BE及EAC病變范圍的確認可以指導活檢及手術,Ebigbo等[36]從2個數據庫(Augsburg和MICCAI)中挑選圖像研發AI系統,在Augsburg數據中AI系統診斷EAC的敏感性和特異性分別為97%和88%;在MICCAI數據中AI系統在WLI下的敏感性和特異性分別為92%和100%,NBI下分別為94%和80%。除診斷病變外,AI系統還可對BE和EAC病變區域進行粗略分割。計算AI系統分割區域與專家分割區域的重疊程度Dice系數(D),結果發現在Augsburg數據中D=0.72,MICCAI數據中D=0.56,該AI系統具有良好的自動分割病變區域的能力。Hussein等[37]構建了兩種AI系統:一種用于檢測BE,另一種用于描繪BE區域。該AI系統通過熱圖來呈現檢測和分割結果,即不同病變區域顯示不同顏色,其中紅色區域表示異常病變區域,是進行靶向活檢的最佳位置。經過測試發現AI系統檢測BE的敏感性和特異性分別為91%和79%,AI系統與內鏡專家描繪BE區域的重疊率可高達98%。
然而,大多數關于EAC的研究是在西方國家進行的。西方和亞洲地區EAC的特征不同[38],使用基于西方病例的訓練集開發的AI系統是否適用于亞洲的臨床實踐是值得考慮的,在亞洲開發一個經過EAC案例培訓的AI系統勢在必行。日本Iwagami等[39]用食管胃交界處腺癌患者的內鏡圖像來構建AI系統,發現該AI系統的診斷敏感性、特異性和準確性分別為94%、42%和66%,內鏡醫生則分別為88%、43%和63%。
3 人工智能輔助影像學診斷食管癌
醫學影像學在臨床診斷和治療中發揮著重大的作用,是發現癌癥的重要技術,在過去10年中,計算機化工具的發展越來越多,這些工具可以將圖像轉換為定量的可挖掘數據(放射組學),并隨后使用AI進行分析。這些工具正在提高早期病變診斷的準確性,以確定風險并將惡性疾病與良性疾病區分開來。許多研究和證據[40-43]綜合表明,放射組學具有識別各種癌癥原發腫瘤和淋巴結異質性的潛力,可用于臨床診斷和預后。AI系統在CT圖像上對術前臨床、影像及病理特征進行篩選,可預測食管癌淋巴結轉移風險[44-48]、預測食管癌根治性放化療療效[49-50]。
Ypsilantis等[51]基于107例食管癌患者的試驗結果構建AI系統,采用MSGD(stochastic gradient-descent algorithm with mini batches)算法,從治療前的正電子發射計算機斷層顯像(positron emission tomography-computed tomography,PET-CT)中自動提取關鍵特征,用于預測食管癌新輔助化療療效,該AI系統的敏感性和特異性分別為80.7%和81.6%,優于基于手工提取影像特征的傳統機器學習算法。與僅使用臨床特征相比,Van等[52]的研究添加全面的PET特征可提高模型的預測能力。Foley等[53]建立的結合PET-CT結構分析食管癌患者的預后模型,可對食管癌患者進行風險分層。
磁共振成像(magnetic resonance imaging,MRI)對軟組織的分辨率更高,適用于食管腫瘤及縱隔淋巴結的評估。Qu等[54]用181例食管癌患者治療前的MRI構建AI系統,使用Matlab自制程序計算放射學特征,發現基于MRI的影像組學診斷淋巴結轉移的受試者工作特征曲線下面積值可達0.82,MRI放射特征可以預測食管癌患者術前淋巴結轉移。Hou等[55]對68例根治性放化療的ESCC患者進行療效預測,采用兩種方法——支持向量機和人工神經網絡構建AI模型,發現兩者均有較高的預測準確性,MRI放射組學可以預測ESCC放化療的治療反應。
4 人工智能輔助病理學診斷食管癌
食管癌的病理學形態[56]及免疫組化特征[57]被證實與患者預后密切相關。Tomita等[58]在123張組織學圖像上進行評估,該AI系統準確識別顯微鏡圖像上的癌性和癌前食管病變的平均準確率為0.83%,該AI系統是第1個使用DL方法自動檢測組織病理學載玻片上的BE和EAC的模型。Kouzu等[59]從222例手術切除的ESCC病例中隨機選擇31例患者的切片用于訓練和開發AI系統,切片采用蘇木精-伊紅數字化整片切片。結果顯示該AI系統Dice系數得分為0.81。使用AI系統可以客觀定量地評估ESCC中的纖維組織增生反應(desmoplastic reaction,DR),AI輔助的DR分類比手動DR分類對疾病特異性生存有更高的預后意義,且AI輔助的DR分類優于金標準因素腫瘤深度和淋巴結轉移的預后準確性。
5 總結與展望
盡管近年來AI在診斷食管癌領域中的研究成果頗多,展現出AI在輔助醫生診斷食管癌方面的巨大潛力,但其真正臨床應用和推廣仍面臨著許多挑戰。(1)樣本量少,沒有獨立的訓練集和測試集,應建立大的圖像數據庫,訓練AI軟件程序。(2)樣本多為清晰的高質量圖像,不能完全模擬真實的臨床情況,應研發實時AI診斷系統,多模態數據融合,將不同類型的醫學圖像數據(如內鏡圖像、CT、MRI等)綜合分析和診斷,提高AI系統的準確性。(3)納入的研究多為單中心回顧性研究,需要進一步的多中心前瞻性臨床試驗驗證,穩健性及普適性仍需要在多中心、真實世界大數據中進行驗證。(4)采集設備、采集參數和重建算法的差異,導致數據信號和質量的差異,數據應規范化和標準化。(5)AI系統輔助診斷過程中的醫療責任尚不明確,應制定有關倫理安全、數據所有權和AI系統診斷性能外部驗證的共識指南。期望在不久的將來AI可以真正落地應用于臨床實踐,提升醫療效率,服務廣大醫生和患者。
利益沖突:無。
作者貢獻:唐川君參與選題和設計,數據整理與分析,論文初稿撰寫及修改;袁湘蕾參與選題和設計,起草、修改論文;張瓊英參與選題和設計,修改論文;胡兵參與選題和設計,修改論文。