
画像のインスタンスセグメンテーション [Mask R-CNNなど]
1.概要 インスタンスセグメンテーション(Instance Segmentation)とは,画像上やRGB-D画像に写っている物体インスタンスの前景領域マスクを,各物体インスタンスを区別しながら推定する問題である.この記 続きを読む…
【用語】データ・ドリブン (Data-driven)
機械学習を用いて学習データの分布(入力と出力のペア)に基づいて予測問題を解く手法を,「データ・ドリブン(Data-driven)な〇〇手法」と形容することが多い.古典的な「モデルや最適化アルゴリズムなどを用いる手法」と対 続きを読む…
単眼画像からの人物姿勢推定(2D)[深層学習以前の手法からOpenPoseまで]
1. 概要 単眼画像からの人物姿勢推定(Monocular Image Human Pose Estimation)とは,一枚の画像を入力として,画像中の人物に対して,画像上の2次元の骨格(関節間のスケルトン)を推定する 続きを読む…
セマンティックセグメンテーション [初期の手法(FCN/SegNet/U-Net)から,PSPNet, DeepLab v3 まで]
1. 概要 セマンティックセグメンテーション(semantic segmentation)とは,シーン画像に対して,画素ごとに独立して意味(Semantic)のクラス識別を行い,画像全体の意味的な領域分割を行う問題である 続きを読む…
GloVe (Gloval Vectors) 【Glovalな共起性も加味した単語埋め込み】
1.概要 Glove (Gloval Vectors)[1] は,スタンフォード大のManning先生の研究室から提案された,単語分散表現手法である(そして,第2著者も,ImageNetやScene Graph論文にも共 続きを読む…