出版社を探す

コンピュータビジョン最前線 Summer 2023

他編:井尻 善久
他編:牛久 祥孝
他編:片岡 裕雄

紙版

内容紹介

【最新動向サーベイ】
・イマドキノ拡散モデル:拡散モデルに関する最近の研究動向を紹介。基本技術、条件付き生成への拡張、生成の高速化について述べ、拡散モデルを学ぶうえで役立つリソースを紹介。

【論文フカヨミ】
・フカヨミCLIP:2020年にOpenAIの研究グループによって提案されて以降、さまざまなタスクで利用される基盤モデルとなっているCLIPについてフカヨミ。

・フカヨミマテリアル画像キャプション生成:近年の代表的な画像キャプション生成手法の概要と課題、そしてその課題を解決するために筆者らがECCV2022で提案した高速かつ高精度な画像キャプション生成手法“GRIT”について解説。

・フカヨミジェスチャー動画生成:これまでのジェスチャー動作生成手法に関する研究を分類しながら、主要技術と残された課題に触れ、その課題に取り組んだDisCoについての論文およびBEATについての論文の2本をフカヨミ。

【チュートリアル】
・ニュウモン深層照度差ステレオ法:照度差ステレオ法の基本的な原理と、照度差ステレオ法の研究で現在主流となっているデータ駆動型の手法をわかりやすく解説。


その他、4コマ漫画「ふたり大学生」、CV分野の学会・研究会・国際会議の開催日程や投稿日が一挙にわかる「CVイベントカレンダー」を掲載。

目次

巻頭言(日浦慎作)

イマドキノ拡散モデル―画像生成の世界を変えた魔法の舞台裏―(石井雅人)
フカヨミCLIP―おおざっぱなCLIPを目利きに育てる!―(品川政太朗)
フカヨミ画像キャプション生成―CNNは不要? Transformerですべて解決!―(菅沼雅徳)
フカヨミジェスチャー動作生成―複雑かつ曖昧で不確実な対話の世界!―(岩本尚也)
ニュウモン深層照度差ステレオ法―照明を操り形状を復元!その最新研究に迫る!―(山藤浩明)

ふたり大学生(鉄分@Tetuboooon)

CVイベントカレンダー

ISBN:9784320125483
出版社:共立出版
判型:B5
ページ数:146ページ
定価:3000円(本体)
発行年月日:2023年06月
発売日:2023年06月14日
国際分類コード【Thema(シーマ)】 1:UYQV