コンピュータビジョン最前線 Summer 2023
他編:井尻 善久
他編:牛久 祥孝
他編:片岡 裕雄
内容紹介
【最新動向サーベイ】
・イマドキノ拡散モデル:拡散モデルに関する最近の研究動向を紹介。基本技術、条件付き生成への拡張、生成の高速化について述べ、拡散モデルを学ぶうえで役立つリソースを紹介。
【論文フカヨミ】
・フカヨミCLIP:2020年にOpenAIの研究グループによって提案されて以降、さまざまなタスクで利用される基盤モデルとなっているCLIPについてフカヨミ。
・フカヨミマテリアル画像キャプション生成:近年の代表的な画像キャプション生成手法の概要と課題、そしてその課題を解決するために筆者らがECCV2022で提案した高速かつ高精度な画像キャプション生成手法“GRIT”について解説。
・フカヨミジェスチャー動画生成:これまでのジェスチャー動作生成手法に関する研究を分類しながら、主要技術と残された課題に触れ、その課題に取り組んだDisCoについての論文およびBEATについての論文の2本をフカヨミ。
【チュートリアル】
・ニュウモン深層照度差ステレオ法:照度差ステレオ法の基本的な原理と、照度差ステレオ法の研究で現在主流となっているデータ駆動型の手法をわかりやすく解説。
その他、4コマ漫画「ふたり大学生」、CV分野の学会・研究会・国際会議の開催日程や投稿日が一挙にわかる「CVイベントカレンダー」を掲載。
目次
巻頭言(日浦慎作)
イマドキノ拡散モデル―画像生成の世界を変えた魔法の舞台裏―(石井雅人)
フカヨミCLIP―おおざっぱなCLIPを目利きに育てる!―(品川政太朗)
フカヨミ画像キャプション生成―CNNは不要? Transformerですべて解決!―(菅沼雅徳)
フカヨミジェスチャー動作生成―複雑かつ曖昧で不確実な対話の世界!―(岩本尚也)
ニュウモン深層照度差ステレオ法―照明を操り形状を復元!その最新研究に迫る!―(山藤浩明)
ふたり大学生(鉄分@Tetuboooon)
CVイベントカレンダー
ISBN:9784320125483
。出版社:共立出版
。判型:B5
。ページ数:146ページ
。定価:3000円(本体)
。発行年月日:2023年06月
。発売日:2023年06月14日
。国際分類コード【Thema(シーマ)】 1:UYQV。