【用語】データ・ドリブン (Data-driven)

0

機械学習を用いて学習データの分布(入力と出力のペア)に基づいて予測問題を解く手法を,「データ・ドリブン(Data-driven)な〇〇手法」と形容することが多い.古典的な「モデルや最適化アルゴリズムなどを用いる手法」と対比する意味で,(大量の)データをもとにした機械学習ベースの手法のことを「データ・ドリブンな手法」と形容する際に使われた言葉である(特に2000年ごろ).

科学全般において古典的には,入力データに対してなんらかの出力を予測する際に,モデルベースやルールベースの手法で取り組むことが普通であった.その後,時代が進み,2000年前後にWeb2.0などで大量のユーザーデータが入手できる時代が始まり「データからデータマイニングを通じて知識を抽出する」ことを行ったり(※人力のデータ分析も含む),「教師あり学習でデータセットの分布から予測器を学習する」ことが一般的になったので,それらを以前の手法と区別する意味で「データ・ドリブンな手法」と呼ぶようになった.

その2000年ごろ以降,音声認識や画像認識など,データ・ドリブンな研究論文がたくさん提案されることとなり,それらの論文のタイトルやIntroductionにも「データドリブン」と書いてあるものが多い.2010年代に入っても,コンピュータビジョンではまだ機械学習・データドリブン手法で取り組まれていないものも多かったので,パターン認識で解いた研究には「データドリブンな」と区別するために入っていることもあったが,現在はそういった問題も深層学習ベースの手法の提案がないことの方が少なく,わざわざ「データドリブン」と形容する論文はすっかり見なくなった.

0