AIニュース

ChatGPT健康回答、事実誤認が71%減少――GPT-5.5 Instantでフロンティアモデル相当の精度に

公開：2026年6月22日

この記事の監修者株式会社デジタルゴリラ

2026年6月18日、OpenAIはChatGPTのモデルをGPT-5.5 Instantに更新し、健康・医療回答の精度がフロンティアモデル相当に向上したとOpenAIが発表しました。直近2か月間の実運用データでは事実誤認フラグの発生率が71%減少しています。

発表の概要

GPT-5.5 Instantは、OpenAIの最新フラッグシップモデルに匹敵する健康評価スコアをHealthBench Professionalで記録し、前バージョン（GPT-5.3 Instant）から大幅に改善しました。毎週2億3,000万人以上がChatGPTに健康相談を行っており、その回答品質が向上した形です。

主な改善点は以下の3点です。

緊急受診が必要な状況を適切に認識する
「不確かな点は不確かと伝える」不確実性の明示
専門用語をわかりやすく言い換える説明力

評価には60か国260名以上の医師が参加し、70万件超の回答をレビューしました。

“GPT-5.5 Instant reaches health performance similar to OpenAI’s latest frontier models on an aggregate of health evaluations, including HealthBench Professional, substantially improving from GPT-5.3 Instant.”

（筆者意訳：GPT-5.5 InstantはHealthBench Professionalを含む包括的な健康評価で最新フロンティアモデル相当の水準に達し、GPT-5.3 Instantから大幅に向上しました）

── OpenAI 公式ブログ（2026年6月18日）

出典: OpenAI「Improving health intelligence in ChatGPT」（2026-06-18）

株式会社デジタルゴリラ

ChatGPT健康回答、事実誤認が71%減少――GPT-5.5 Instantでフロンティアモデル相当の精度に

発表の概要

関連記事

月額課金なし・データ外部送信なし——Googleの「Gemma 4 12B」が16GBのPCで動くオープンAI

Microsoftが「常時稼働の自律型エージェント」を発表——社内の調整業務を自動化するScoutとは

GrokがDatabricksに統合——企業データとAIエージェントが一つのプラットフォームに