takminの書きっぱなし備忘録 @はてなブログ

主にコンピュータビジョンなど技術について、たまに自分自身のことや思いついたことなど

2020/10/10 第4回全日本コンピュータビジョン勉強会「人に関する認識・理解論文読み会」発表資料まとめ

今回も前回に引き続き、関東、関西、名古屋のコンピュータビジョン勉強会合同でオンラインにて「全日本コンピュータビジョン勉強会」を開催いたしました。

今回は昨年に引き続きPRMU研究会との共催という形での実施となりました。 お陰様で配信の準備などはすべてお任せでした。

例年PRMUと共催の際はICCVまたはECCV読み会を行っているのですが、今回はPRMU研究会のテーマに合わせ「人に関する認識・理解論文読み会」を行いました。

というわけで資料へのリンクをまとめたいと思います。

申し込みサイト kantocv.connpass.com

PRMU研究会10月開催プログラム

研究会 開催プログラム - 2020-10-PRMU

Tweetまとめ togetter.com

Youtubeは以下より配信致しました。今回は午前中に開催されたPRMUの内容も含まれております。

https://www.youtube.com/watch?v=l_QHRjZ8sew

以下、資料へのリンクです。

発表者 論文タイトル 資料
takmin Person Re-Identificationの論文を読んでみた https://www.slideshare.net/takmin/20201010-personreid
akihiro_fuji Evolving Losses for Unsupervised Video Representation Learning https://www.slideshare.net/AkihiroFujii2/201010-evolving-lossesforunsupervisedvideorepresentationlearning
alfred_plpl MOTS: Multi-Object Tracking and Segmentation https://www.slideshare.net/yasunoriozaki12/cvmots-multiobject-tracking-and-segmentation
Katsutoshi_Shiraki Spatial Temporal Attention Graphによる関節の重要度と関係性を考慮した動作認識
nk116 Inference Stage Optimization for Cross-scenario 3D Human Pose Estimation (NeurIPS 2020) https://speakerdeck.com/nk35jk/inference-stage-optimization-for-cross-scenario-3d-human-pose-estimation
godel マンナビについて(TLIO: Tight Learned Inertial Odometry (IROS2020)) https://speakerdeck.com/godel/man-navi

今回私が発表した内容を別途こちらにもリンクしておきます。

www.slideshare.net

主成分分析で直線フィッティングの導出

先日こんなツイートをしました。

絵にするとこんな感じです。

f:id:takmin:20200917000054p:plain
直線フィッティング

それに対してありがたいことに、いくつか反応をいただきました。

主成分分析でできるという回答を複数からもらいました。

自分でも色々と試してみたところ、導出に成功しました。

というわけで、せっかくなので僕が試した方法をメモしておきます。

尚、今回このようなリプライもいただきましたが、まだこちらの内容は追えてません。

n個の点 (x_i,y_i)が与えられた時、これに最もフィットする2次元平面上の直線 ax+by+c=0を求めるものとします。 まずはn個の点 (x_i,y_i)の重心を求め、それが原点となるように各点を (x^\prime_i , y^\prime_i)へ移動します。


\begin{pmatrix}
x'_{i}\\
y'_i
\end{pmatrix}
=
\begin{pmatrix}
x_i\\
y_i
\end{pmatrix}
-
\begin{pmatrix}
\bar{x}\\
\bar{y}
\end{pmatrix}

ここで (\bar{x},\bar{y})は点群の重心です。


\begin{pmatrix}
\bar{x}\\
\bar{y}
\end{pmatrix}
=\frac{1}{n}\sum_{i}^{n}
\begin{pmatrix}
x_i\\
y_i
\end{pmatrix}

最初にこの重心移動した (x^\prime_i , y^\prime_i)の点群に対して最もフィットする直線 a'x+b'y+c' =0を求めることを考えます。

 \sqrt{a'^{2}+b'^{2}} =1とすると、点 (x^\prime_i , y^\prime_i)とこの直線までの距離は、

 \left| a^\prime x^\prime_i + b^\prime y^\prime_i + c^\prime \right|

で表せます。(どうしてかわからない人は自分で導出してみましょう。)

したがって、

 
\bf{A}=\begin{pmatrix}
a'\\
b'
\end{pmatrix}
,~~~
\bf{X}=\begin{pmatrix}
x'_1&y'_1\\
x'_2&y'_2\\
{\vdots}&{\vdots}\\
x'_n&y'_n
\end{pmatrix}

とした時、最もフィットする直線を求めるには、 
f(\bf{A}, c') = \left(
\bf{X} \bf{A} + c' \bf{1}
\right) ^T
\left(
\bf{X} \bf{A} + c' \bf{1}
\right)
を最小化する \bf{A}
\bf{A}^T \bf{A} = 1
の条件の下で求めることになります。

尚、 \bf{1}は要素がすべて1の n\times 1ベクトルです。

さて、このようにある拘束条件のもとで最小化を行うような問題はラグランジュの未定乗数法を使って解くことができます。 つまり


F(\bf{A}, c', \lambda) =  \left(
\bf{X} \bf{A} + c' \bf{1}
\right) ^T
\left(
\bf{X} \bf{A} + c' \bf{1}
\right) - \lambda
\left(
\bf{A}^T \bf{A} - 1
\right)

と置き、 
\frac{\partial F}{\partial \bf{A}} = \frac{\partial F}{\partial c'} = \frac{\partial F}{\partial \lambda} = 0
となる \bf{A}および c'を求めます。

まず \frac{\partial F}{\partial c'}=0


c' = -\frac{1}{n}\bf{1}^T\bf{X}{A}

と求まります。 ここで \bf{X}は重心が原点のため、 \bf{1}^T\bf{X} = 0となるので、


c' = 0

となります。 次に \frac{\partial F}{\partial \bf{A}} = 0 は、計算すると、


\bf{X}^T\bf{X}\bf{A} = \lambda \bf{A}

となります。すなわち、 \bf{X}^T\bf{X}固有ベクトルを求めれば \bf{A}が求まることになります。 ここで \bf{X}^T\bf{X}は共分散行列なので、共分散行列の固有値問題=主成分分析を行っていることと同じであることがわかりました。

さて、ここで固有値が最も大きい固有ベクトル(第1主成分)が求める直線方向のベクトルとなるわけですが、 (a', b')はその直線の法線ベクトルなので、第1主成分と直行する第2主成分を \bf{A}とします。

最後にここで求まった (a', b', c')から (a, b, c)は以下のように求まります。

 a = \frac{a'}{\sqrt{a'^{2} + b'^{2}}}

b = \frac{b'}{\sqrt{a'^{2} + b'^{2}}}

c = -a \bar{x} -b \bar{y}

コンピュータビジョン今昔物語 - 深層学習がCVの世界をどう変えたか - (JPTA Tech Talk講演資料)

今回、CV勉強会に何度か参加&発表していただいたJin Yamanakaさんにお誘いいただき、JTPA (Japan Technology Professional Association)というところで、「コンピュータビジョン今昔物語 -深層学習がCVの世界をどう変えたか-」という大上段なタイトルで講演させていただきました。

www.meetup.com

このJTPAのTech Talkでは、機械学習/深層学習の勉強会を開催してきたそうなのですが、私自身「これ」という深層学習の専門があるわけではないので、コンピュータビジョン全体の基礎的な技術の変遷を、深層学習と絡めて広く浅く網羅した話をさせていただきました。

ちなみにここで紹介した深層学習の技術は、「既存の技術を置き換えるために、深層学習は何をクリアしなくてはならないか?」という視点で、紹介するのが適当と思ったものを選んだつもりです。

当日は時間の関係でSemantic Segmentationの話がきちんと出来なかったので、参加者の方には後でこちらにアップした資料を見返していただけるとありがたいです。

www.slideshare.net

2020/07/18 全日本コンピュータビジョン勉強会「CVPR2020読み会」(後編)発表資料まとめ

先々週の前編に引き続き、関東、名古屋、関西のCV勉強会が合同で「全日本コンピュータビジョン勉強会 - CVPR2020読み会(後編)-」をオンラインにて行いました。

今回、私は発表はありませんでしたが、例のごとく資料やリンク等を(自分のために)まとめておきます。

kantocv.connpass.com

2020/07/18 第三回全日本コンピュータビジョン勉強会「CVPR2020読み会」後編 ツイートまとめ - Togetter

前回同様Youtube Liveでも配信しました。 www.youtube.com

発表資料のリンク(発表順。敬称略。)

発表者 論文タイトル 発表資料
yumash TPNet: Trajectory Proposal Network for Motion Prediction https://www.slideshare.net/yumashino/tpnet-trajectory-proposal-network-for-motion-prediction
alfredplpl Detecting Attended Visual Targets in Video https://www.slideshare.net/yasunoriozaki12/detecting-attended-visual-targets-in-video-237017752
sandglass Proxy Anchor Loss for Deep Metric Learning https://speakerdeck.com/satokeiju/cvpr2020du-mihui-proxy-anchor-loss-for-deep-metric-learning
yasutomo57jp Disentangling and Unifying Graph Convolutions for Skeleton-Based Action Recognition https://www.slideshare.net/yasutomo57jp/disentangling-and-unifying-graph-convolutions-for-skeletonbased-action-recognition-237017395
t2kasa PolarMask: Single Shot Instance Segmentation With Polar Representation https://speakerdeck.com/t2kasa/20200718-cvpr-2020-polar-mask
smygw72 There and Back Again: Revisiting Backpropagation Saliency Methods https://www.slideshare.net/ssuserda79d5/cvpr2020-there-and-back-again-revisiting-backpropagation-saliency-methods-237017288
Tkarasawa_ Self-Supervised Monocular Scene Flow Estimation https://speakerdeck.com/takarasawa_/self-mono-sf
Tres Retina-Like Visual Image Reconstruction via Spiking Neural Model https://speakerdeck.com/sietedm/retina-like-visual-image-reconstruction-via-spiking-neural-model
s_aiueo32 Meta-Transfer Learning for Zero-Shot Super-Resolution https://speakerdeck.com/sansandsoc/meta-transfer-learning-for-zero-shot-super-resolution
Kenji RandLA-Net: Efficient Semantic Segmentation of Large-Scale Point Clouds https://speakerdeck.com/tsukamotokenji/di-san-hui-quan-ri-ben-konpiyutabiziyonmian-qiang-hui-hou-bian

全日本CV勉強会@オンラインは、コロナが落ち着くまで引き続き開催していきたいなあと思ってますので、宜しくお願い致します。