[快訊] 王志豪醫師團隊,關於運用 ChatGPT-5 於兒童胸部 X 光影像中偵測氣胸診斷表現評估之研究,獲 Diagnostics 刊登!

 

 

01_diagnostics_WangCH_03

 

 

文章介紹

 

在小兒急診的情境中,胸部 X 光是診斷「氣胸」(肺部塌陷)首選的第一線影像工具。然而,當急診室病患過多、臨床壓力龐大時,醫師在判讀上可能會出現延遲或漏診,特別是針對那些症狀不明顯的案例。因此,這項研究旨在評估多模態大語言模型 ChatGPT-5,在運用多種不同的提問策略下,對於判讀小兒胸部 X 光片中氣胸位置與偵測病灶的表現。

 

這項回溯性研究從醫學中心收集了 380 張小兒胸部 X 光片,其中包含 190 例氣胸個案以及 190 例作為對照組的正常影像。研究中讓 ChatGPT-5 分別使用「指令型」、「角色設定型」與「臨床情境型」三種不同的提問策略進行判讀。最後,將判讀結果與專家裁定的標準答案進行比對,藉此評估其準確度、敏感度、特異度以及側邊判讀的正確率。

 

研究結果顯示,ChatGPT-5 的整體準確度落在 0.77 至 0.79 之間,且在各種提問方式下,特異度皆穩定維持在 0.96 至 0.98 的高水準,顯示其重複測試的穩定性良好。然而,該模型的敏感度表現較為有限,僅介於 0.57 至 0.61;特別是在偵測微小氣胸時,敏感度明顯偏低(依照 ACCP 標準僅為 0.18 至 0.22;依照 BTS 標準則為 0.41 至 0.46),遠遜於對大範圍氣胸的判讀能力(ACCP 為 0.75 至 0.79;BTS 為 0.85 至 0.88)。

 

不過,只要模型能成功偵測出氣胸,其判定左、右側位置的準確率高達 0.96 以上。此外,研究也發現不同的提問策略並不會對判讀結果產生顯著影響。

 

總結來說,ChatGPT-5 在診斷小兒氣胸的表現雖具有一致性,但仍有其局限。雖然它具備高特異度,且能穩定偵測出較大範圍的氣胸,表現出優良的特性,但對於微小氣胸的敏感度過低,低到令人無法接受的程度。因此,目前該模型尚無法獨立進行臨床影像判讀,仍必須由急診醫師進行監督與覆核。

 

 

恭喜王醫師!

 

用比較高階的統計方法處理數據,能投到高分期刊嗎?MedCalc 可靠嗎?來看看講師的建議

 

 

臨床研究

 

 

期刊介紹

 

Diagnostics 創刊於 2011 年,是 MDPI(Multidisciplinary Digital Publishing Institute)旗下的 open access 期刊。2024 年的 impact factor 為 3.3,在 Medicine, General & Internal 領域為 Q1(57/332) 期刊。

 

 

王志豪醫師與新思惟

 

 

 

臨床研究

 

 

本篇發表於 共享榮耀 並標籤為 , , , , 。將永久鏈結加入書籤。