転移学習による医用画像解析モデルの作成
深層学習と転移学習
深層学習と転移学習の違いにおいて、実務上重要な点は明確である。
個人レベルでゼロから深層学習モデルを構築することは現実的ではなく、転移学習を用いることで目的を達成する、という点に尽きる。
深層学習は、大量のデータと計算資源、人的・経済的リソースを前提とした手法であり、
大規模組織が多大なコストをかけて実施するものである。
一方、転移学習は、公開されている学習済みモデルに対し、
特定の目的に合わせた追加学習を行う手法である。
「何をするためのモデルか」を定義する
医用画像解析において最も重要なのは、「何を実現したいモデルなのか」を明確に定義することである。
単純な二値分類で十分なのか、複数の病理分類を区別したいのかによって、
ラベル設計や学習戦略は大きく異なる。
ラベル付けは単なる作業ではなく、解析全体の成否を左右する設計工程である。
適切なモデルの選択
本項では医用画像解析に用いられる代表的な画像分類モデルを概説する。
ConvNeXt
CNNを現代的に再設計したモデルであり、ResNetの正統進化系と位置づけられる。
実用性と性能のバランスが良い。
ResNet
2015年に提案されたモデルであり、Residual Connection により深層化と安定学習を両立する。
多くの比較研究で基準モデルとして用いられる。
EfficientNet
2019年に提案されたバランス型モデルであり、少ない計算資源で高い性能を示す。
高解像度入力を用いる医用画像解析との親和性が高い。
Vision Transformer
Transformer を画像解析に応用したモデルであり、画像全体の関係性を学習する。
病理画像など空間配置が重要なデータに適するが、大量の学習データを必要とする。
転移学習の設定
転移学習は、モデルを「胴体」と「頭」に分けて考えると理解しやすい。
ファインチューニング
必要に応じて低学習率で全層を微調整するが、少量データでは過学習に注意が必要である。
出力層(ヘッド)の付け替え
ImageNet の1000クラス分類を、目的に応じたクラス数に変更する。
重みの固定(フリーズ)
胴体部分は固定し、ヘッドのみを学習させることで、既存特徴を保持する。
評価と再設計
評価は必ずテストデータで行い、訓練データの再利用は避ける。
正解率だけでなく、感度・特異度・適合率などを総合的に確認する必要がある。
大量のデータを用いても期待した性能が得られない場合、
モデル選択、ラベル設計、学習条件のいずれかに問題があることが多い。
闇雲なモデル変更や解像度拡大、データ収集に走る前に、前提条件を再点検すべきである。