関心領域(ROI: Region of Interest)

1. 関心領域 ( ROI: Region of Interest) とは

関心領域(ROI: Region of Interest)とは,画像処理やコンピュータビジョンにおいて,フィルタ処理や認識処理を適用したい「画像中の部分的な関心領域」のことをさす.関心領域は,『物体の領域』であったり,『図形や建物の輪郭を囲って閉じた領域』であることが多い.

例えば画像のセグメンテーション問題では,対象物体(例:レントゲン画像上での肝臓の領域)の輪郭を関心領域に指定したい場合に,医師やオペレータがソフトウェアツール上で,関心領域の輪郭を手動で綺麗になぞっていく,その後,関心領域の範囲内にフィルタリングや他の処理を行う.

以下の動画は,細胞画像中のROI領域(緑色)を,画像処理ソフトウェア上で指定している例である:

2. バウンディングボックスによる ROI 周辺矩形の指定

近年のスマートフォンカメラのカメラアプリでは,ROIのバウンディングボックスの位置を指定することで,焦点をあてたい関心領域の「周辺」を,バウンディングボックスにより指定するインターフェースが用意されていることが多い.また,超高解像度カメラの場合だと,ズームしてその周辺のみを表示した関心領域の周辺矩形を,バウンディングボックスとして設定することも多い.

OpenCVのROIクラスも,物体のバウンディングボックスで指定するので勘違いしやすいが,ROIは物体の境界(border)で囲った関心「領域(region)」を指すことに注意である.バウンディングボックスで指定した場合は,あくまで物体の境界をバウンディングボックスで囲ったものであり,関心領域そのものではない.物体検出の場合だと,インスタンスセグメンテーションで得られる前景マスクが,関心領域に相当する.

3. パターン認識による,ROIの自動抽出

近年は,機械学習化や深層学習の発展により,関心領域(ROI)の自動抽出も行われる.物体検出を通じて,関心領域を囲うバウンディングボックス(矩形)を推定したり,インスタンスセグメンテーション技術により複数の物体の関心領域マスク領域)を推定することができる.

例えばCNNを用いた,2ステージ型の物体検出インスタンスセグメンテーションでは,ROI Pooling (Fast R-CNN [Girshick, 2015], Faster R-CNN [Ren et al., 2015] )や ROI Align (Mask R-CNN) [He et al., 2017] などの方法で,ROI領域内の特徴のみを後半ステージで使用できるようにすることを行う.前半処理で検出された領域候補のROI バウンディングボックス内に対して,特徴マップをプーリング処理し,後半の検出・マスク推定ネットワークの入力として用いる.この場合,ステージ2の処理における関心領域を,ステージ1で先に領域候補として自動抽出していると言える.

References

  • [Girshick, 2015] Girshick, R. Fast r-cnn. In ICCV, 2015.
  • [Ren et al., 2015] Ren, S., He, K., Girshick, R., & Sun, J. (2015). Faster r-cnn: towards real-time object detection with region proposal networks. In NIPS, 2015.
  • [He et al., 2017] K. He, G. Gkioxari, P. Doll ́ar, R. B. Girshick, Mask r-cnn, In ICCV, 2017.

参照外部リンク

関連記事

↓ ためになった方は,記事をSNSでシェアをしてくださると,管理人の記事執筆モチベーションが上がります