1. 一般化 (Generalized) とは
一般化(Generalized) ○○というタイトル中のキーワードと,その場合の研究パターンについて紹介を行う🔍CVML論文の検索キーワードの第3回目の記事である.「一般化○○」と名付けられている各論文では,アルゴリズム・計算方法・ネットワーク構造などに対して,これまでの具体的な各例から共通点を抽出して抽象化する.
この記事では,一般化の例で具体例な「一般化」のイメージを高めてもらったのち(2節),なぜ一般化が重要かについて,まとめたい(3節).
「一般化」を行うと,これまでの例では適用できなかった対象に対しても,一般化されたものだけを,毎回適用できるようになり,活用の幅を広げることが可能になる(例:2.1節 一般化ハフ変換).また,従来の各具体例の「弱点」を,一般化によって補う展開にも持っていける(例: 2.2 節 一般化IoUロス).
もうすこし言い換えると,ここで言う「一般化」とは「提案済みのアルゴリズム・関数などから,抽象度を1階層上にした,アルゴリズム・関数を編み出すこと」である.一般化により,その一般化の枠組みに入ることになった従来のアルゴリズム・関数は,あくまでその一般化の各具体例・実例に過ぎなかったとなり,一般化された枠組みの階層化に取り込まれることとなる.
親記事:CVML論文の検索キーワード
2. 一般化の例
昔からビジョンや機械学習などで,既存のアルゴリズムに対して「一般化」を行ったアルゴリズム(や概念)がよく提案される.概要で述べた2つの例(一般化ハフ変換と一般化IoU(ロス))を通して,一般化の具体例および,一般化により得られる長所について,例をみていきたい.
2.1 例1: 一般化ハフ変換
たとえば,古典的な画像のハフ変換は,直線検出や円検出むけに提案されていた.それが,の「一般化ハフ変換 [Ballad, 1981] 」として,用意した任意のテンプレート図形で,テンプレートパターンをハフ変換の仕組みにより検出できるようになった.
この一般化ハフ変換 [Ballad, 1981] の例のように,「一般化」を行うと,抽象度を高めて適用先を広げることができる.よって,各具体例を「一般化後の,単一の共通の枠組み」で捉えられ,(いちいち個別にアレンジせずに)アルゴリズムを適用できる長所が得られるようになる.また,これまで適用は不可能と思われていた,円や直線以外のパターンでも適用できるようになったように,一般化は適用範囲の拡大をもたらす.
2.2 例2: 一般化 IoU(ロス)
最近のディープニューラルネットの物体検出の「バウンディンボックス回帰」ヘッド側では ,IoUロス [Yu et al., 2016] を一般化することで弱点を改善した Generalized IoU (GIoU) [Rezatofighi et al., 2019]が,バウンディングボックス間の重なりMetricとしてよく用いられている.GIoUでは,IoUの定義を一般化し,重なり領域がゼロ場合にも適用できるものにしている.これにより,IoUの弱点であった「予測ROIと正解ROI間で重なりが0のときに,勾配消失問題が起きる」という弱点を,和らげることに成功した.
GIoU 以前の,物体検出ネットワークでのバウンディンボックス回帰ヘッドの損失関数は,「(1) Smooth L1ロス(Faster R-CNN) → (2) 評価指標IoUとロス関数が統一された,UnifiedなIoUロス [Yu et al., 2016]」の,2段階で発展していた.そこから更に「(3) GIoU (一般化IoU)」が登場する.GIoU では,(2)の弱点を克服し,なおかつ抽象度があがったことで,アレンジされたGIoU系ロス関数が提案されやすくもなった.たとえば,Yolo v4 で使用されたIoUロス (Distance-IoU [Zheng et al., 2020] ロス)など,抽象化されて見通しがよくなったことで,IoUロスの提案の幅が拡がっている(と管理人はとらえている).
3. 一般化はなぜ重要か?
2節であげた長所を列挙すると,一般化により例えば以下の利益を得ることができるとわかる:
- これまで適用できないと思われていたケースでも使用可能になる (2.1 円や直線以外のテンプレート)
- 共通の1つのアルゴリズムや枠組みだけで,全ての例に対処できる(2.1 任意のテンプレートマスク)
- 一般化することで,弱点を補った「一般化○○」を使用できるようになる (2.2 重なり無し時のロス計算への対処).
- 抽象度が高まったものができるので,アレンジ・発展系を思いつきやすい.(2.2 GIoUなど)
こうした長所をまとめると:
- 一般化により抽象度が高まるので,個別対応 (=個別問題ごとへのアレンジ) の手間が減って,活用の幅が広まる.
と1文で長所を表わすことができよう.
4. まとめ
以上,この記事では,「一般化○○」「Generalized ○○」という論文キーワードについて,コンピュータビジョンでの例をもとに話した(ハフ変換,IoUロスの一般化).
論文検索のキーワードとして使用するのみならず,「一般化」自体は技法でもあるので,普段の研究開発でも活用できるようになると良いと思う.
←前回の記事:第2回 Rethinking 論文 (再考研究)
→次回の記事:第4回 in the wild (実環境の画像で)
References
- [Ballad, 1981] Ballard, Dana H. “Generalizing the Hough transform to detect arbitrary shapes.” Pattern recognition 13.2 (1981): 111-122.
- [Rezatofighi et al., 2019] H. Rezatofighi, N. Tsoi, J. Gwak, A. Sadeghian, I. Reid, and S. Savarese, “Generalized intersection over union: A metric and a loss for bounding box regression,” In CVPR, 2019.
- [Yu et al., 2016] J. Yu, Y. Jiang, Z. Wang, Z. Cao, and T. Huang, “Unitbox: An advanced object detection network,” in The ACM International Conference on Multimedia, 2016.
- [Zheng et al., 2020] Zhaohui Zheng, Ping Wang, Wei Liu, Jinze Li, Rongguang Ye, and Dongwei Ren. Distance-IoU Loss: Faster and better learning for bounding box regression. In AAAI, 2020.