Original title: From breadth to depth in clinical artificial intelligence evaluation: Machine learning
- 臨床AI評価における課題と進捗について議論されており、AIモデルの汎用性と堅牢性を評価するための<BRIDGE 1>が紹介されています。
- <BRIDGE 1>は、9つの言語にわたる実世界の臨床データから抽出された87の臨床タスクを含む、大規模な多言語ベンチマークです。
- 多様な患者集団とデータタイプにわたるAIモデルの評価の必要性が強調されています。