0. このページの概要
このページでは📚用語Wiki中の「コンピュータビジョン(non-deep learning中心)の用語記事」カテゴリーの用語記事の一覧を,階層的構造に沿った章立てにより示します.ディープラーニング以前から行われていた伝統的なコンピュータビジョンの問題・用語の記事群でありであり,「Non-Deep Learning な,以前の時代からある手法・古典的な問題設定」の一覧であります.
「ディープラーニング登場以後のコンピュータビジョン」に関する用語(手法や問題設定)は, 「ディープラーニングの用語記事の一覧 をご覧下さい.
管理人は,大学4年で研究室に所属しはじめた2005年頃から,コンピュータビジョン・画像認識に触れているのもあり,過去の non-deep learning の古典的手法にも詳しいです.博士論文も,non-deep learningな手法で解きました(古典的な人物姿勢推定[non-deep leanringな手法]の記事を参照).
このページにある用語の多くは,古くから学ばれている古典的内容です.よって,以下の デジタル画像処理 [改訂第2版](2020)でも学べます.
[2025年6月14日追記] このサイト内には,「デジタル画像処理 [改訂第2版] にあるような古典的な詳しい解説(=用語wiki記事)」はこれ以上積極的には増やさないものの,今後サイト外では,「初心者・分野外だけど仕組みに興味ある方々」「カメラ撮影・ビデオ撮影・写真編集・動画編集など,写して(映して)編集することに興味のある他分野が専門の方々」向けをターゲットに,解説シリーズを提供してしていく事を,現在検討中です (※ただし,あまりやらない可能性もあるので,過度に期待しないでください).
[2025年7月追記] 今後,「コンピュータビジョン(non-deep 中心)」カテゴリの各記事は,以下に一覧ページもある「OpenCVのモジュール/クラス・関数の解説記事 (以下に記事一覧ページ)」とも,連携していきます:
1. 基本用語
1.1 データ構造
(※ 「リンクはまだ無いが,タイトル案だけ列挙してある用語」は,今後書きたい用語記事の候補です)
- デジタル画像表現 (image representation)
- グレー画像
- カラー画像 (RGB画像)
- 2値画像 (binary image)
- 画素ごとの意味分割:
- 2クラスむけ:
- マスク画像 [インスタンスセグメンテーション向け]
- 複数クラス:
- セマンティック画像 (semantic map) [セマンティックセグメンテーションむけ]
- 2クラスむけ:
- HDR(High-Dyanamic Range)画像
- 距離画像
- ヒートマップ画像
- 3Dデータ表現 (3D data representation)
- メッシュ(Mesh)
- 近似最近傍探索むけのデータ構造
- KD-tree
- OCtree (八分木)
1.2 画像座標系と同次座標系
- 画像座標系(Image Coordinate)
- 同次座標系(Homogeneous Coordinates)
1.3 カメラとレンズ
- カメラ・センサーの構成と種類
- カメラ幾何
- ピンホールカメラ
- カメラモデル(Camera Model)と透視投影(Perspective Projection)
- レンズ
- カメラキャリブレーション
1.5 画像の性質
- カラー画像
- カラーモデルと色空間
- 色ヒストグラム
- グレー画像
2. 画像処理
- 画像処理 (Image Processing)
2.1 フィルタリング
- 画像フィルタリング (Image Filtering)
2.2 画像変換 (Image Transformation)
- 画像のフリップ(Image Flipping)
- 画像の線形補間
- バイ・リニア補間 (双線形補間)
- バイ・キュービック補間
- 画像の再標本化
- 画像の合成 (image mixing) (2枚の写真を1枚に合成)
2.3 パターン探索(テンプレートマッチング)
2.3.1 単一スケールでの探索
- テンプレートマッチング (Template Matching)
- SSD(Sum of Squared Difference)
- SAD(Sum of Absolute Difference)
- サブピクセル推定
2.3.2 マルチスケールでの高速探索
- 画像ピラミッド(Image Pyramid)
- 粗密(Coase-to-Fine)探索法
2.4 画像特徴
- 画像の特徴検出(Feature extraction)と境界抽出
- 関心点(Interest Point)の検出
- SIFTとSURF による関心点検出
- FAST:高速な関心点検出
- 関心点(Interest Point)の検出
- 画像の特徴記述子
- HOG (Histograms of Oriented Gradients) 特徴による人物検出.
- 局所二値パターン(Local Binary Pattern)
- 手造り特徴(Hand-crafted feature)
2.5 画像間での位置合わせ
- 特徴点によるマッチング (Feature Matching)
- 画像のレジストレーション(Image Registration)
- オプティカルフロー (Optical Flow)
3. 画像認識 (non-deep leraningな手法)
- 単一クラス物体検出 (One-class Object Detection)[古典的な顔検出・歩行者検出]
- HOG+SVM (要点だけ)
- haar-like + adaboost (要点だけ)
- Deformable Part Models (DPM, 変形可能パーツモデル群)
- 古典的な人物姿勢推定 [ディープラーニング以前のnon-deep learning手法]
4. 3D点群処理(古典的なもの)
4.1 法線(normal)と表面(surface)
- 点群データからの法線ベクトル推定
4.2 位置合わせ(Registration)
- ICP (Iterative Closest Point)
3. 三次元ビジョン
3.1 ステレオビジョン (ステレオ幾何)
- ステレオマッチング(Stereo Vision) [平行ステレオ設定のステレオビジョン]
- Semi-Global マッチング
- エピポーラ幾何 (Epipolar Geometry)
- アクティブステレオ
- フォトメトリックステレオ
3.2 マルチビュー ステレオビジョン
- 複数視点ステレオ(Multi-view Stereo;MVS) による3D表面の再構成
- SfM (Structure from Motion)
- SLAM(Simultaneous Localization and Mapping)