takminの書きっぱなし備忘録 @はてなブログ

主にコンピュータビジョンなど技術について、たまに自分自身のことや思いついたことなど

第60回コンピュータビジョン勉強会@関東「ICCV2023読み会」

本日コンピュータビジョン勉強会@関東「ICCV2023読み会」をSansan株式会社様の会場をお借りして開催いたしました。

以下、例によって資料やリンク等のまとめておきます。

登録サイト

kantocv.connpass.com

Togetter

togetter.com

Youtube

youtube.com

コンピュータビジョン勉強会@関東

sites.google.com

資料まとめ

発表者 発表内容 資料
tomoaki_teshima LightGlue: Local Feature Matching at Light Speed https://t.co/Gp0lvoChZ1
colum2131 Unsupervised 3D Perception with 2D Vision-Language Distillation for Autonomous Driving https://t.co/luZzxlJu36
Quintessence SoDaCam: Software-defined Cameras via Single-Photon Imaging
s_aiueo32 Revisiting Scene Text Recognition: A Data Perspective https://t.co/dcI2vBtgO8
abemii_ VAD: Vectorized Scene Representation for Efficient Autonomous Driving https://t.co/hWEVpEtNly
shade-tree ITI-GEN: Inclusive Text-to-Image Generation
Kaito Imai Iterative prompt learning for unsupervised backlit image enhancement
yu-ya4 DocTr: Document Transformer for Structured Information Extraction in Documents https://t.co/Jx83CqXeZV
tana MotionLM: Multi-Agent Motion Forecasting as Language Modeling https://t.co/NnOsb9enwP

今回はハイブリッド開催でしたが、皆さんのご協力でスムーズに運営出来ました。 どうもありがとうございました。

AR探索アドベンチャー「妖怪ハンター候補生」

11月23-26日の4日間、横浜市綱島公園というところで、弊社の新サービス「妖怪ハンター候補生」のテストプレイを行います。

綱島公園イベントチラシ

これは、ARを使ったストーリー性のある探索ゲームになっています。

スマートフォンがあればアプリインストールせずにすぐ始められます。参加無料ですので、お近くにお住まいの方はぜひ遊んでみてください。

まだサイトは作ってないのですが、取り急ぎ上記チラシのPDFはこちらからダウンロードできます。 https://visitlab.jp/hunter

元々は、デジタルツイン管理ミドルウェア「シナリオエンジン」というのを開発して特許を取り、これをどうビジネスにするかというところからサービス開発が始まりました。

はじめはスマートファクトリやスマートビルディングなどの用途を考えていたのですが、自分の子供が謎解きにはまり、一緒に色々なイベントへ行くうちに、このミドルウェアをゲームに応用して子供に喜んでもらいたいと思うようになりました。

というわけで、大人だけでなく親子でも楽しめる内容にしたいと思っています。今後、このゲームプラットフォームを育てて行きたいと思ってますので、ぜひ一人でも多くの方に遊んでいただき、ゲームの最後に用意するアンケートに感想を記入していただければと思います。

第59回コンピュータビジョン勉強会@関東「CVPR2023読み会(後編)」

先月の前編に引き続き、本日コンピュータビジョン勉強会@関東「CVPR2023読み会(後編)」をニューラルグループ株式会社様提供の会場をお借りして開催いたしました。

以下、資料やリンク等のまとめです。

登録サイト

kantocv.connpass.com

Togetter

togetter.com

Youtube

www.youtube.com

コンピュータビジョン勉強会@関東

sites.google.com

資料まとめ

発表者 発表内容 資料
yuukicammy InternImage: Exploring Large-Scale Vision Foundation Models with Deformable Convolutions https://speakerdeck.com/yuukicammy/internimage-exploring-large-scale-vision-foundation-models-with-deformable-convolutions
Kenji DynIBaR: Neural Dynamic Image Based Rendering https://speakerdeck.com/tsukamotokenji/dynibar-di-60hui-cvmian-qiang-hui-at-guan-dong
Beluuuuuuga Bidirectional Copy-Paste for Semi-Supervised Medical Image Segmentation https://speakerdeck.com/elith/cvpr-2023-lun-wen-shao-jie-bidirectional-copy-paste-for-semi-supervised-medical-image-segmentation
OZ_Z_C Efficient Hierarchical Entropy Model for Learned Point Cloud Compression https://speakerdeck.com/oz_z_c/20230825-cv-cvpr2023-ehem
cheerfularge Paint by Example: Exemplar-Based Image Editing With Diffusion Models https://speakerdeck.com/cheerfularge/cvmian-qiang-hui-at-guan-dong-cvpr2023-paint-by-example-exemplar-based-image-editing-with-diffusion-models
carnavi NeRF-RPN: A general framework for object detection in NeRFs https://speakerdeck.com/ryokawanami/nerf-rpn-carnavi
ymats Train/Test-Time Adaptation with Retrieval https://speakerdeck.com/ymats/20230826-cvmian-qiang-hui-zi-liao-traintest-time-adaptation-with-retrieval
shimacos Unifying Vision, Text, and Layout for Universal Document Processing https://speakerdeck.com/shimacos/kanto-cv-59-udop
losnuevetoros ドキュメント/レイアウト祭り https://speakerdeck.com/yushiku/reiautoji-ri

第59回コンピュータビジョン勉強会@関東「CVPR2023読み会(前編)」

本日、コンピュータビジョン勉強会@関東を「CVPR2023読み会(前編)」というテーマで株式会社サイバーエージェント様に会場をお借りして開催いたしました。

CVPRはコンピュータビジョンのトップカンファレンスの一つで、読み会は当勉強会では恒例の開催となりました。

というわけで、資料やリンク等をまとめておきます。

登録サイト

kantocv.connpass.com

Togetter

togetter.com

Youtube

www.youtube.com

コンピュータビジョン勉強会@関東

sites.google.com

資料まとめ

発表者 発表内容 資料
takmin MobileNeRF: Exploiting the Polygon Rasterization Pipeline for Efficient Neural Field Rendering on Mobile Architectures https://speakerdeck.com/takmin/mobilenerf-di-59hui-cvmian-qiang-hui-at-guan-dong-fa-biao-zi-liao
alfplpl Diffusion Art or Digital Forgery? Investigating Data Replication in Diffusion Models https://www.docswell.com/s/alfredplpl/ZRXEQG-2023-07-23-125218
tereka114 Prompting Large Language Models with Answer Heuristics for Knowledge-based Visual Question Answering https://speakerdeck.com/tereka114/prompting-large-language-models-with-answer-heuristics-for-knowledge-based-visual-question-answering
inoichan Planning-oriented Autonomous Driving https://speakerdeck.com/inoichan/cvmian-qiang-hui-at-guan-dong-cvpr2023-uniad-planning-oriented-autonomous-driving
s_aiueo Real-Time 6K Image Rescaling With Rate-Distortion Optimization https://speakerdeck.com/sansan_randd/real-time-6k-image-rescaling-with-rate-distortion-optimization
abemii_ UniSim: A Neural Closed-Loop Sensor Simulator https://speakerdeck.com/abemii/unisim-chao-riarunazi-dong-yun-zhuan-sensasimiyuresiyon
shade-tree Connecting Vision and Language with Video Localized Narratives https://speakerdeck.com/forest1988/connecting-vision-and-language-with-video-localized-narratives
InoueNaoto Visual Programming: Compositional visual reasoning without training https://speakerdeck.com/naoto0804/jie-shuo-visprog-cvpr2023-best-paper
tana BEVFormer v2: Adapting Modern Image Backbones to Bird’s-Eye-View Recognition via Perspective Supervision https://speakerdeck.com/kotaro_tanahashi/zi-dong-yun-zhuan-niokerubevbesuwu-ti-ren-shi-ji-shu-nojin-hua
yumash3 Semi-Supervised Parametric Real-World Image Harmonization https://speakerdeck.com/yumash3/semi-supervised-parametric-real-world-image-harmonization-hua-xiang-he-cheng-niokeruse-diao-diao-zheng

私が発表した内容はこちらです。

speakerdeck.com