takminの書きっぱなし備忘録 @はてなブログ

主にコンピュータビジョンなど技術について、たまに自分自身のことや思いついたことなど

2022/08/07第11回全日本コンピュータビジョン勉強会「CVPR2022読み会」(前編)資料まとめ

関東、名古屋、関西のコンピュータビジョン勉強会合同で開催している全日本コンピュータビジョン勉強会の11回目です。

今回は恒例となりました、コンピュータビジョンのトップカンファレンス「CVPR2022」の論文読み会をオンラインで行いました。 CVPR2022読み会は毎回多くの発表希望者がいるため、今回も前後編の2回に分けて行われます。

今回は前編ということで、リンク等をまとめます。

登録サイト

kantocv.connpass.com

Togetter

togetter.com

Youtube

youtu.be

発表資料

全ての発表資料は、勉強会で使用した質疑応答用のSlack上にはアップされているのですが、ここにリンクした資料は発表者本人がtwitterで公開したもののみ記載しています。

発表者 論文タイトル 発表資料
takmin Learning to Solve Hard Minimal Problems https://speakerdeck.com/takmin/learning-to-solve-hard-minimal-problems
shade-tree It Is Okay To Not Be Okay: Overcoming Emotional Bias in Affective Image Captioning by Contrastive Data Collection https://speakerdeck.com/forest1988/it-is-okay-to-not-be-okay-overcoming-emotional-bias-in-affective-image-captioning-by-contrastive-data-collection
carnavi TableFormer: Table Structure Understanding with Transformers https://www.slideshare.net/RyoKawanami/tableformercarnavipdf
inoichan Time3D: End-to-End Joint Monocular 3D Object Detection and Tracking for Autonomous Driving https://speakerdeck.com/inoichan/cvpr2022du-mihui-time3d-end-to-end-joint-monocular-3d-object-detection-and-tracking-for-autonomous-driving
kzykmyzw EPro-PnP: Generalized End-to-End Probabilistic Perspective-n-Points for Monocular Object Pose Estimation https://www.slideshare.net/KazuyukiMiyazawa/20220807japancvkzykmyzwepropnppdf
kano_sawa DoubleField: Bridging the Neural Surface and Radiance Fields for High-Fidelity Human Reconstruction and Rendering https://speakerdeck.com/kanosawa/doublefield-cvmian-qiang-hui-cvpr2022
alfredplpl Photorealistic Text-to-Image Diffusion Models with Deep Language Understanding - 論文デモ:「エターナルフォースブリザード」を作るためにImagenをご家庭で育てる方法 - https://www.docswell.com/s/alfredplpl/59YQLK-2022-08-07-145902
n-watanabe Learning Neural Light Fields with Ray-Space Embedding https://temporal-nw-slide-japancv-cvpr2022-reading-20220807.netlify.app/
toni Balanced Multimodal Learning via On-the-fly Gradient Modulation https://www.slideshare.net/AntonioTejerodePablo/cvpr2022-paper-reading-balanced-multimodal-learning-all-japan-computer-vision-study-group-20220807
losnuevetoros パーツ探し ~ PubTables-1M: Towards comprehensive table extraction from unstructured documentsXYLayoutLM: Towards Layout-Aware Multimodal Networks For Visually-Rich Document UnderstandingV-Doc: Visual questions answers with DocumentsCross-modal Clinical Graph Transformer for Ophthalmic Report Generation は読んだし、TableFormer: Table Structure Understanding with TransformersNeural Collaborative Graph Machines for Table Structure RecognitionRevisiting Document Image Dewarping by Grid RegularizationFourier Document Restoration for Robust Document Dewarping and Recognition は気になったが読まなかった。 https://speakerdeck.com/yushiku/patutan-si

私の発表資料はこちらです。

speakerdeck.com

後編は8/21に開催予定です。

第11回 全日本コンピュータビジョン勉強会(後編) - connpass

2022/05/15 第10回全日本コンピュータビジョン勉強会「生成モデル論文読み会」資料まとめ

関東、名古屋、関西のコンピュータビジョン勉強会合同で開催している全日本コンピュータビジョン勉強会の10回目です。

今回はGANやVAEなどの生成モデルについて、論文読み会をオンラインで行いました。

以下、リンク等をまとめます。

登録サイト

kantocv.connpass.com

Togetter

togetter.com

Youtube

www.youtube.com

発表資料

全ての発表資料は、勉強会で使用した質疑応答用のSlack上にはアップされているのですが、ここにリンクした資料は発表者本人がtwitterで公開したもののみ記載しています。

発表者 論文タイトル 発表資料
tony_tiler VAEs for multimodal disentanglement https://www.slideshare.net/AntonioTejerodePablo/vaes-for-multimodal-disentanglement
maguro27 StyleNeRF: A Style-based 3D Aware Generator for High-resolution Image Synthesis https://speakerdeck.com/maguro27/di-9hui-quan-ri-ben-konpiyutabiziyonmian-qiang-hui-stylenerf-a-style-based-3d-aware-generator-for-high-resolution-image-synthesis-fa-biao-zi-liao
shade-tree GEODIFF: A GEOMETRIC DIFFUSION MODEL FOR MOLECULAR CONFORMATION GENERATION https://speakerdeck.com/forest1988/geodiff-a-geometric-diffusion-model-for-molecular-conformation-generation
takmin A Conditional Point Diffusion-Refinement Paradigm for 3D Point Cloud Completion https://speakerdeck.com/takmin/a-conditional-point-diffusion-refinement-paradigm-for-3d-point-cloud-completion

今回は発表者が少なかったものの、その代わり一人一人の発表に十分な時間が取れたうえ、質疑応答も活発に出来ました。

今回は私も発表したので、ここに資料を埋め込んでおきます。

speakerdeck.com

2021/12/12 第9回全日本コンピュータビジョン勉強会「ICCV2021論文読み会」資料まとめ

関東、名古屋、関西のコンピュータビジョン勉強会合同で開催している全日本コンピュータビジョン勉強会の9回目です。

今回は恒例となりました、コンピュータビジョンのトップカンファレンス「ICCV2021」の論文読み会をオンラインで行いました。

以下、リンク等をまとめます。

登録サイト

kantocv.connpass.com

Togetter

togetter.com

Youtube

youtu.be

発表資料

全ての発表資料は、勉強会で使用した質疑応答用のSlack上にはアップされているのですが、ここにリンクした資料は発表者本人がtwitterで公開したもののみ記載しています。

発表者 論文タイトル 発表資料
shade-tree Panoptic Narrative Grounding https://speakerdeck.com/forest1988/panoptic-narrative-grounding
Godel An Asynchronous Kalman Filter for Hybrid Event Camera https://speakerdeck.com/godel/lun-wen-du-mihui-an-asynchronous-kalman-filter-for-hybrid-event-cameras
gash717 WarpedGANSpace: Finding Non-Linear RBF Paths in GAN Latent Space
yu4u Swin Transformer: Hierarchical Vision Transformer using Shifted Windows https://www.slideshare.net/ren4yu/swin-transformer-iccv21-best-paper
dhirooka Mip-NeRF: A Multiscale Representation for Anti-Aliasing Neural Radiance Fields https://speakerdeck.com/daigo0927/mip-nerf-iccv2021lun-du-hui-suraido
maguro27 ICCV2021で発表されたEmbodied AI(EAI)の論文の全まとめ、ICCV2021で参加したEAIのコンペ参加報告
peisuke GNeRF: GAN-based Neural Radiance Field without Posed Camera https://speakerdeck.com/peisuke/gnerf-gan-based-neural-radiance-field-without-posed-camera
Yamato.OKAMOTO DocFormer: End-to-End Transformer for Document Understanding https://speakerdeck.com/roadroller/di-9hui-quan-ri-ben-konpiyutabiziyonmian-qiang-hui-fa-biao-zi-liao
s_aiueo32 Mutual Affine Network for Spatially Variant Kernel Estimation in Blind Image Super-Resolution
losnuevetoros ただただVision&Languateの論文を読んでみた https://speakerdeck.com/yushiku/iccv-2021-tadatadavision-and-languagefalselun-wen-wodu-ndemita

今回は出だしで配信に手戻ってしまい、方々にご迷惑をおかけしました。

そろそろオフラインでも開催したいですねえ。

2021/10/09 第8回全日本コンピュータビジョン勉強会「コンピュータビジョンのお仕事」資料まとめ

本日、関東、名古屋、関西のコンピュータビジョン勉強会合同で開催している全日本コンピュータビジョン勉強会の8回目が行われました。

今回は昨年に引き続きPRMUとの共催です。

PRMUのテーマが「研究を効率的に進めるためのプロセスや周辺技術」ということでしたので、今回はそれに連動する形で「コンピュータビジョンのお仕事」というテーマとし、実際に仕事でコンピュータビジョンに携わっている方々に、そのお仕事内容やキャリアについて話していただきました。

今回テーマがテーマなので、発表資料がすべて公開されているわけではありませんが、リンク等をまとめておきます。

登録サイト

kantocv.connpass.com

Togetter

togetter.com

Youtube

www.youtube.com

今までの開催履歴

sites.google.com

発表資料

全ての発表資料は、勉強会で使用した質疑応答用のSlack上にはアップされているのですが、ここにリンクした資料は発表者本人がtwitterで公開したもののみ記載しています。

発表者 発表タイトル 発表資料
tomoaki teshima あなたの人生の物語
SHINue AIスタートアップが検査装置を納品した件
poyy 姿勢とか手洗いとか都市モデル
losnuevetoros とある会社ととある会社とそれ以外の話 https://speakerdeck.com/yushiku/toaruhui-she-totoaruhui-she-tosoreyi-wai-falsehua
kzykmyzw ドラレコ + CV = 地図@Mobility Technologies
Mitsuru Ambai CVの研究と実用化@デンソーアイティーラボラトリ
takmin 楽しいCVの受託仕事 https://www.slideshare.net/takmin/ss-250407155
中村 薫 AR/MRでの画像処理・点群処理活用 https://speakerdeck.com/hololab/japan-cv
奥田 浩人 企業CVチームのCVとは限らない仕事
alfredplpl インタラクションのためのコンピュータビジョンのお仕事 https://www.slideshare.net/yasunoriozaki12/ss-250405327
おさかなさん 深くは話せないPFNでのお仕事 https://www.slideshare.net/belltailjp/2021109-pfn

私の発表スライドは別途こちらにも貼り付けておきます。

www.slideshare.net

こちらのブログエントリを元にしています。

takmin.hatenablog.com