ChatGPT健康回答、事実誤認が71%減少――GPT-5.5 Instantでフロンティアモデル相当の精度に
2026年6月18日、OpenAIはChatGPTのモデルをGPT-5.5 Instantに更新し、健康・医療回答の精度がフロンティアモデル相当に向上したとOpenAIが発表しました。直近2か月間の実運用データでは事実誤認フラグの発生率が71%減少しています。
発表の概要
GPT-5.5 Instantは、OpenAIの最新フラッグシップモデルに匹敵する健康評価スコアをHealthBench Professionalで記録し、前バージョン(GPT-5.3 Instant)から大幅に改善しました。毎週2億3,000万人以上がChatGPTに健康相談を行っており、その回答品質が向上した形です。
主な改善点は以下の3点です。
- 緊急受診が必要な状況を適切に認識する
- 「不確かな点は不確かと伝える」不確実性の明示
- 専門用語をわかりやすく言い換える説明力
評価には60か国260名以上の医師が参加し、70万件超の回答をレビューしました。
“GPT-5.5 Instant reaches health performance similar to OpenAI’s latest frontier models on an aggregate of health evaluations, including HealthBench Professional, substantially improving from GPT-5.3 Instant.”
(筆者意訳:GPT-5.5 InstantはHealthBench Professionalを含む包括的な健康評価で最新フロンティアモデル相当の水準に達し、GPT-5.3 Instantから大幅に向上しました)
── OpenAI 公式ブログ(2026年6月18日)
出典: OpenAI「Improving health intelligence in ChatGPT」(2026-06-18)
