Revisit 論文 【CVML論文の検索法 1】

1. はじめに

このコラム記事では,【CVML論文の探索法】というシリーズの初回として, RevisitとタイトルについているRevisit論文パターンについて紹介したい.

(コンピュータサイエンス界隈に限らず)少し年月の経った(目安として,5年前より昔の)その分野の有名な研究を堀りかえして新しく見直すことで,研究成果が出る場合がある.その際,研究者はその論文タイトルに (再訪した研究)Revisited」と,過去の「標準的な有名手法を再訪した論文であること」をタイトルや本文で明示することが通例的である.

2. Revisit 論文

Revisit (再訪)論文は,おおよそ,5年前〜20年前あたりの「著名な定番研究」を,現在の視点で再訪し,アレンジを提案した場合に, 「(再訪した論文名・手法名) revisited」や「Revisit (再訪した論文名・手法名)」と論文タイトルにRevisitを明示的に加える.

論文を検索エンジンで検索する際にも,このrevisited / revisit をキーワードとして有効に使用できる.詳しくなる前は,revisit や rethinkでヒットする手法名が,有名研究のランドマークに相当する場合が多いからである.また,普段呼んでいる論文PDFの中身でテキスト検索する場合でも,revisit は有効な検索クエリーとなる.

2節では,コンピュータサイエンス研究のなかでも特にわたしが専門とする機械学習パターン認識業界での少し様子を振返ることを通じて,Revisitという言葉が示す「時間単位(2.1節)」と,Revisitされやすい「対象研究(2.2説)」について考えたい.

2.1 近年のML界隈の研究更新速度

かつて,機械学習・パターン認識や,コンピュータサイエンス全般の論文発表数のペースは,(この記事を書いた)2021年の現在とは違って,もう少しゆっくりしたペースであった.しかし,ご存知の通り,第3次人工知能ブームの影響などもあり,ディープラーニングを応用する各分野では,過剰なくらいの多数の研究者やエンジニアが参戦した.研究においても,最新動向をチェックしてついていくのがつらい程のハイペースで,論文が大量に生まれている.また,それらの研究成果の産業応用の展開ペースも速いので,実用化できるものは,非常に高速・高頻度に実社会に展開されるようになった.

そこで,3次AIブーム前に著者が後期博士課程に入学した「2011年」の当時での,最新研究の更新速度感を考えてみたい.まだディープラーニングブームに突入する手前とはいえ,iPhoneが登場して4年経っていた頃で,これまでは産業応用のB2Bで使われるイメージでしかなかった画像認識や画像処理が,少しずつB2C化したり,大衆化する兆しが見えていた.ただ,その2011年でも,コンピュータビジョン系の研究者といえば,まだ大学や製造業の研究職が中心であり,絶対的な総数がいまよりずっと少なかった.なにより当時は,今のようにPytorchや Tensorflowや Huggingface Transformersのようにはコモディティ化されておらず,機械学習の敷居はまだ高く,知識の面でもソフトウェアの面でも,情報が少なすぎて,機械学習予測システムを組む敷居は高かった.研究的な知識や知見が(初心者レベルさえ)Webでも気軽に転がっている時代ではなく,最低でもその分野の修士課程は修了していないと,自力ではパターン認識ソフトウェアを構築する自力がつけられなかった時代である.

関連ページ:主要なDeep Learning Libraryの一覧

2.2 ビジョンでの論文例から考える Revisit 論文

2.2.1 人物姿勢推定での Revisit 論文の例

まずは私が後期博士課程で研究していた人物姿勢推定における,具体的な論文例で「Revisit(再訪)」と名付ける場合の感覚を探ってみたい.

たとえば,CVPR 2009でMPI Informatik から発表された「Pictorial structures revisited: People detection and articulated pose estimation」[Andriluka et al., 2009] は,画像認識における伝統的なPictorial Structuresを再訪し,当時はまだ実用的でなかった人物姿勢推定に応用することを提案した論文である.画像物体認識向けの Pictorial Structures [Felzenszwalb et al., 2005] をもとに,2009年当時の機械学習の最先端技術をもちいることにより「歩行者の検出からの人物姿勢推定」へとPictorial Structuresを発展させた研究である.

ちなみに,この再訪元の研究の Pedro Felzenszwalb 氏は,当時のビジョン業界における代表的スター研究者の一人である.画像物体認識 [Felzenszwalb et al., 2005] と シーン画像分割 [Felzenszwalb and Huttenlocher 2004] を通じて,当時の画像認識における2つの主要な問題で,パーツ分割の発想を取り入れパラダイムシフトを起こし始めた第一人者である(Deformable Part Models [Felzenszwalb et al., 2010] も,彼が主著者).

2.2.2 Structure from Motionでの Revisit 論文 の例

また,コンピュータビジョンにおけるもう少し最近の 参照数が多い Revisit論文として,CVPR2016「Structure-from-Motion Revisited」(通称 COLMAP)[Schonberger et al., 2016] が挙げられる.それまでのインクリメンタルなSFMの処理パイプラインを再訪し,処理ライン中で数点の見直しを行い,大きく改良をおこなうことで,SFM(+ Multiview Stereo)を前進させた研究である.

以前のCV勉強会で,COLMAPについて解説発表された方がいらっしゃるので,内容を詳しく知りたい方はこの方の発表資料が参照になる.

この COLMAPも現時点 (2021年11月中旬)で,引用数が1800回(Google scholar参照)を超えている,インパクトの大きい研究である.前節の [Andriluka et al., 2009] と同様,Revisited 研究は ビジョン界隈だと,インパクトの強い研究になっていることが多い傾向はある.この連載で紹介するようなタイトルパターンを用いると,会議でも目に留りやすいことは長所である.

一方で,昔の研究をうまく掘り返すことに成功し,再訪論文であることをタイトルに銘打つと良くも悪くも「目立ちやすい」こともあり,自分の発表にRevisited とつけたい場合も,本当にRevisitedとタイトルにつけるのが妥当かは,熟慮してから決めるのが良いとは感じる.次回第2回で紹介する『Rethink』と,似ていて非なる今回の『Revisit』であるので,両者のどちらを使うべきかも慎重に決めたい側面がある.

3 【第1回】のまとめ

この記事【CVML論文の検索法 1】では,少し昔の有名研究を再訪した研究の論文タイトルによく用いられるキーワードの「Revisit(再訪)」について,簡単にまとめた.また,コンピュータビジョンでの,Revisit論文の具体例も示すことで,理解を深めてもらった.

論文を探す際のタイトル中のキーワードとして使えるが,Revisit論文を読む場合は,revisitの原義もよく意識しながら,論文を読むようにすると,その研究分野全体の理解も深まると思う.

次の2回目の記事では,Revisitと似ている使われ方もするが,少し意味合いが異なる「Rethink(再考)」というキーワードについて書きたい.

References

  • [Andriluka et al., 2009] M. Andriluka, S. Roth, and B. Schiele. Pictorial structures revisited: People detection and articulated pose estimation. In CVPR, 2009.
  • [Felzenszwalb and Huttenlocher 2004] P. F. Felzenszwalb and D. P. Huttenlocher. Efficient graph-based image segmentation. IJCV 2004.
  • [Felzenszwalb et al., 2005] P. F. Felzenszwalb and D. P. Huttenlocher. Pictorial structures for object recognition. IJCV, 61(1):55–79, 2005.
  • [Felzenszwalb et al., 2010] P. F. Felzenszwalb, R. B. Girshick, and D. McAllester. Cascade object detection with deformable part models. In CVPR, 2010.
  • [Schonberger et al., 2016] J. L. Schonberger and J.-M. Frahm. Structure-from-motion revisited. In CVPR, 2016.