文章介紹

在小兒急診的情境中，胸部 X 光是診斷「氣胸」（肺部塌陷）首選的第一線影像工具。然而，當急診室病患過多、臨床壓力龐大時，醫師在判讀上可能會出現延遲或漏診，特別是針對那些症狀不明顯的案例。因此，這項研究旨在評估多模態大語言模型 ChatGPT-5，在運用多種不同的提問策略下，對於判讀小兒胸部 X 光片中氣胸位置與偵測病灶的表現。

這項回溯性研究從醫學中心收集了 380 張小兒胸部 X 光片，其中包含 190 例氣胸個案以及 190 例作為對照組的正常影像。研究中讓 ChatGPT-5 分別使用「指令型」、「角色設定型」與「臨床情境型」三種不同的提問策略進行判讀。最後，將判讀結果與專家裁定的標準答案進行比對，藉此評估其準確度、敏感度、特異度以及側邊判讀的正確率。

研究結果顯示，ChatGPT-5 的整體準確度落在 0.77 至 0.79 之間，且在各種提問方式下，特異度皆穩定維持在 0.96 至 0.98 的高水準，顯示其重複測試的穩定性良好。然而，該模型的敏感度表現較為有限，僅介於 0.57 至 0.61；特別是在偵測微小氣胸時，敏感度明顯偏低（依照 ACCP 標準僅為 0.18 至 0.22；依照 BTS 標準則為 0.41 至 0.46），遠遜於對大範圍氣胸的判讀能力（ACCP 為 0.75 至 0.79；BTS 為 0.85 至 0.88）。

不過，只要模型能成功偵測出氣胸，其判定左、右側位置的準確率高達 0.96 以上。此外，研究也發現不同的提問策略並不會對判讀結果產生顯著影響。

總結來說，ChatGPT-5 在診斷小兒氣胸的表現雖具有一致性，但仍有其局限。雖然它具備高特異度，且能穩定偵測出較大範圍的氣胸，表現出優良的特性，但對於微小氣胸的敏感度過低，低到令人無法接受的程度。因此，目前該模型尚無法獨立進行臨床影像判讀，仍必須由急診醫師進行監督與覆核。

恭喜王醫師！

用比較高階的統計方法處理數據，能投到高分期刊嗎？MedCalc 可靠嗎？來看看講師的建議。

臨床研究

期刊介紹

Diagnostics 創刊於 2011 年，是 MDPI（Multidisciplinary Digital Publishing Institute）旗下的 open access 期刊。2024 年的 impact factor 為 3.3，在 Medicine, General & Internal 領域為 Q1(57/332) 期刊。

王志豪醫師與新思惟

熱血加值，課後迫不及待想要開始寫論文。（2020/9/20 @ Meta-analysis）
大醫院要論文，與其逃避不如選擇直球對決！（2022/4/17 @ CLIP）
不只是升等需要，寫論文也能帶來成就感。（2025/11/8 @ Case-report）
[快訊] 王志豪醫師團隊，分享十二指腸壁內血腫之超音波影像，獲 Pediatrics and Neonatology 刊登！
[快訊] 王志豪醫師團隊，分享辨識兒童絞窄性閉鎖型腸阻塞之影像，獲 Pediatrics and Neonatology 刊登！

[快訊] 王志豪醫師團隊，關於運用 ChatGPT-5 於兒童胸部 X 光影像中偵測氣胸診斷表現評估之研究，獲 Diagnostics 刊登！

文章介紹

臨床研究

期刊介紹

王志豪醫師與新思惟

臨床研究

追蹤訂閱

心得總覽

學員評價