公開可能なAI向けデータセットの作成
主な研究者:山岸陽助、中村優太
AIの研究や学習には学習や性能検証に使用するためのデータセットが必須です。本研究室では個人情報保護に配慮しながら、複数のAI研究向けデーセットの構築に取り組んでいます。
読影レポートデータセットの作成
放射線科読影レポートは通常、医療機関内に蓄積されており一般公開されることはありません。したがって医療機関外からのアクセスは難しく、これが読影レポートにかかわる種々の研究開発の妨げになっています。
そこで、個人情報がすでに除去されているウェブ上の画像を読影することで、個人情報を含まない読影レポートデータセットを作成し、一般公開しました。
さらにこのデータセットを用いて、肺癌のステージングを自動化するための教師データを作成し、高精度な解法を広く募るワークショップを開催しました。

文献
- Nakamura Y, Hanaoka S, Nomura Y, et al. Clinical Comparable Corpus Describing the Same Subjects with Different Expressions. Stud Health Technol Inform. 2022;290:253-257. doi:10.3233/SHTI220073