画像認識Convolutional Neural Networks 向けのFeature Aggregation (特徴集約) [Feature Pyramid Networks, Deep Layer Aggregation など] [複数スケール物体検出]

+4 1. はじめに Feature Aggregation (特徴集約)とは,画像のlocal 特徴やmid-level特徴を集約し,新たな特徴(ベクトル)を生成することである.この記事では,Deep Learning 続きを読む…

画像のインスタンスセグメンテーション [Mask R-CNNなど]

+3 1.概要 インスタンスセグメンテーション(Instance Segmentation)とは,画像上やRGB-D画像に写っている物体インスタンスの前景領域マスクを,各物体インスタンスを区別しながら推定する問題である. 続きを読む…

単眼画像からの人物姿勢推定(2D)[深層学習以前の手法からOpenPoseまで]

+4 1. 概要 単眼画像からの人物姿勢推定(Monocular Image Human Pose Estimation)とは,一枚の画像を入力として,画像中の人物に対して,画像上の2次元の骨格(関節間のスケルトン)を推 続きを読む…

セマンティックセグメンテーション [初期の手法(FCN/SegNet/U-Net)から,PSPNet, DeepLab v3 まで]

+3 1. 概要 セマンティックセグメンテーション(semantic segmentation)とは,シーン画像に対して,画素ごとに独立して意味(Semantic)のクラス識別を行い,画像全体の意味的な領域分割を行う問題 続きを読む…