映像情報メディア学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
技報オンライン
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2023-02-22 13:15
Semantic-Consistent Style Transfer with Visual Transformers
Jianbo WangUTokyo)・Huan YangJianlong FuMSR)・Toshihiko YamasakiUTokyo)・Baining GuoMSR
抄録 (和) (まだ登録されていません) 
(英) Image style transfer has drawn increasing attention recently. This task takes a content image and a style image as inputs and generates an output image with the desired style while preserving the structure from the content image. However, most existing approaches adopt a global feature transformation to transfer style patterns into content images (e.g., AdaIN and WCT). Such a design usually destroys the spatial information of the input images and fails to keep semantic consistency between the content image and the stylized results. To solve this problem, we propose a novel STyle TRansformer (STTR) network which breaks both content and style images into visual tokens to achieve a fine-grained style transformation. Specifically, two attention mechanisms are adopted in our STTR. We first propose to use self-attention to encode content and style tokens such that similar tokens can be grouped and learned together. We then adopt cross-attention between content and style tokens that encourages fine-grained style transformations. As similar patches lean to match with the same style code, semantic-consistent style transfer can be obtained. To compare STTR with existing approaches, we conduct user studies on Amazon Mechanical Turk (AMT), which are carried out with 50 human subjects with 1,000 votes in total. Extensive evaluations demonstrate the effectiveness and efficiency of the proposed STTR in generating visually pleasing style transfer results
キーワード (和) / / / / / / /  
(英) image style transfer / visual transformer / / / / / /  
文献情報 映情学技報
資料番号  
発行日  
ISSN Print edition: ISSN 1342-6893    Online edition: ISSN 2424-1970
PDFダウンロード

研究会情報
研究会 MMS ME AIT IEICE-IE IEICE-ITS  
開催期間 2023-02-21 - 2023-02-22 
開催地(和) 北海道大学 
開催地(英) Hokkaido Univ. 
テーマ(和) 画像処理,一般 
テーマ(英) Image Processing, etc. 
講演論文情報の詳細
申込み研究会 IEICE-IE 
会議コード 2023-02-IE-ITS-MMS-ME-AIT 
本文の言語 英語 
タイトル(和)  
サブタイトル(和)  
タイトル(英) Semantic-Consistent Style Transfer with Visual Transformers 
サブタイトル(英)  
キーワード(1)(和/英) / image style transfer  
キーワード(2)(和/英) / visual transformer  
キーワード(3)(和/英) /  
キーワード(4)(和/英) /  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 王 剣波 / Jianbo Wang / ワン ジエンブォ
第1著者 所属(和/英) 東京大学 (略称: 東大)
The University of Tokyo (略称: UTokyo)
第2著者 氏名(和/英/ヨミ) 楊 歓 / Huan Yang / ヤーン ホワン
第2著者 所属(和/英) マイクロソフトリサーチ (略称: MSR)
Mircrosoft Research (略称: MSR)
第3著者 氏名(和/英/ヨミ) 傅 建竜 / Jianlong Fu / フゥ ジエン ローン
第3著者 所属(和/英) フゥ ジエン ローン (略称: MSR)
Mircrosoft Research (略称: MSR)
第4著者 氏名(和/英/ヨミ) 山崎 俊彦 / Toshihiko Yamasaki / トシヒコ ヤマサキ
第4著者 所属(和/英) 東京大学 (略称: 東大)
The University of Tokyo (略称: UTokyo)
第5著者 氏名(和/英/ヨミ) 郭 百寧 / Baining Guo / グオ バイ ニーン
第5著者 所属(和/英) マイクロソフトリサーチ (略称: MSR)
Mircrosoft Research (略称: MSR)
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2023-02-22 13:15:00 
発表時間 15分 
申込先研究会 IEICE-IE 
資料番号  
巻番号(vol) vol.47 
号番号(no)  
ページ範囲  
ページ数  
発行日  


[研究会発表申込システムのトップページに戻る]

[映像情報メディア学会ホームページ]


ITE / 映像情報メディア学会