1. in the wild とは [概要]
in the wild は「実環境の画像で」を意味する,コンピュータビジョン分野の論文タイトル等で,よく見かける慣用句である.この記事は【CVML論文の検索キーワード】の第4回目として,この「in the wild」という,論文タイトル検索に使える,タイトルに頻出のキーワードを取り上げる.
本来の英語での意味は「野生の」,「野放しの」である.しかし,そこから転じて「拘束を与えて解きやすく撮影した実験室画像」ではなく「実環境下で環境に手を加えず,自然な画像」から画像認識をおこなう画像認識技術である」と強調する際に,「(室内ではなく) in the wild (外で)」と,呼ぶようになった.
従って,以下のように,「recognition 」「detector/detection」などと「in the wild」が共起することが多く,2つセットでGoogle Scholarなど検索すると,該当する研究がヒットしやすい:
- 「recognition」「in the wild」
- 「detector」「in the wild」
- 「text recognition」「in the wild」
もちろん,CVPR や ICCVのOpen Access論文一覧ページで「in the wild」だけを検索キーワードに絞るのもアリである.
※ 管理人は,画像認識研究で「in the wild」が使用された最初の論文を知らない.どの論文が,このパターンのきっかけとなったのかをご存知の方は,ご教示頂けるとありがたい.
1.1 使用例
例として,管理人がすぐ思い浮かぶ論文タイトルは「Face detection, pose estimation, and landmark localization in the wild.」[Zhu et al., 2012] である.この研究は,Deformable Part Models の Ramanan先生のラボから提案された研究である.顔向きや目鼻口のランドマークが激しく変化しても,DPMベースでモデル化したおかげで,初めて正面向きの顔画像以外の,様々な顔向き変化+表情変化に全て対応できるようになったことを強調する意味で「in the wild」とタイトルにつけられた.
ちょうどこの頃以降の2012~2015,DPMの適用に続いてCNNが普及・研究されたことにより,実環境下の画像で「初めて」通用する画像認識や物体検出が通用しはじめたことから,「in the wild」とタイトルについた画像認識論文が増えた.この時代以降,スマートフォンの普及に従って,実環境の画像で解く必要性もあがっていった中で,「in the wild」を論文につけることで,実用性の高さをアピールする研究が増えていった.
逆に,すっかりスマホなどで使われるようになって実環境下でも通用するようになったタスクだと,「in the wild」と強調することは減っていったわけである.実際,およそ2018~2019年くらい以降は,あまり in the wild は使われなくなってきているが,もちろん現在でも画像認識や映像認識を行うのに厳しい条件は多い.それらの「まだ画像認識が難しい状況下」で解けた場合は「in the wild」と強調される論文もまだまだある.
この記事を書いたのは2022年10月1日であるが,ECCV2022 でも, Workshop on Computer Vision in the Wild というワークショップが開催されるように,”in the wild”というフレーズは,いまだに使用されている.
1.2 余談
2010年のCVPRの [Dollar et al., 2010] では,物体検出の若手スター研究者であったPitor Dollar氏らが,「The Fastest Pedestrian Detector in the West (略称はFPDW)」という,in the wild をもじって,違う意味とかける言葉あそびをした論文(名)を発表した.
[Dollar et al., 2010] は,マルチスケール特徴の近似計算を用いた.歩行者検出の高速化の研究であった.論文中の実験画像は,西部劇風の格好をした男性が,(外の)荒野をバックに構えた画像となっており,in the west と in the wildの2つの言葉がかけてあった.
← 前回の記事: 第3回 一般化(Generalized) ○○
References
- [Dollar et al., 2010] P. Dollár, S. Belongie and P. Perona “The Fastest Pedestrian Detector in the West“, In BMVC, 2010.
- [Zhu et al., 2012] Xiangxin Zhu, and Deva Ramanan. “Face detection, pose estimation, and landmark localization in the wild.”