| 講演抄録/キーワード |
| 講演名 |
2025-02-18 16:10
Vision TransformerにおけるHEVC符号化された3DCG画像のAttention機構に関する実験的考察 ○河畑則文(コンピュータイメージングラボ) |
| 抄録 |
(和) |
ヒトが画像を観察するときに,どこを注目しているのかどこに関心を持っているのかを事前に把握した上でメディアコンテンツを作成することは重要である.今までに,ヒトが画像を注視する際の関心領域に関するコンピュータビジョン研究が多く行われてきており,我々は,特に,画像符号化と注視点に関する関係について,顕著性マップを用いることで面積を測定した.しかしながら,評価指標として,面積以外の要素を十分に考慮しておらず,精度として十分ではなかった.そのため,自然言語処理分野からコンピュータビジョン分野に派生して構築されたVision Transformerの知見を用いることにより,より精度高く関心領域推定ができるのではないかと考えた.本研究では,HEVC符号化された3DCG画像に対して,Vision TransformerのAttention機構を用いることにより,関心領域推定を行い,画像解析を行うことにより,画像の関心領域に関する評価が行えるかどうかを実験的に考察した. |
| (英) |
It is important to create media content based on a preliminary understanding of what people pay attention to and what they are interested in when they observe images. Many computer vision studies have been conducted on the Region Of Interest (ROI) when humans gaze at images. We specifically measured the Region Of Interest (ROI) between image coding and the gazing point by using saliency maps. However, we did not sufficiently consider factors other than area as an evaluation index, and the accuracy was not sufficient. Therefore, we thought that the knowledge of the Vision Transformer, which was derived the field of natural language processing and built in the field of computer vision, could be used to estimate the Region Of Interest (ROI) with higher accuracy. In this study, we experimentally examined whether Region Of Interest (ROI) estimation can be performed on HEVC encoded 3D CG images by using the Attention mechanism of the Vision Transformer, and whether Region Of Interest (ROI) evaluation of images can be performed by image analysis. |
| キーワード |
(和) |
3DCG画像 / H.265/HEVC / Vision Transformer / 関心領域 / 注視点マップ / AIアーキテクチャ / / |
| (英) |
3D CG Image / H.265/HEVC / Vision Transformer (ViT) / Region Of Interest (ROI) / Attention Map / Artificial Intelligence (AI) Architecture / / |
| 文献情報 |
映情学技報, vol. 49, no. 4, ME2025-19, pp. 96-101, 2025年2月. |
| 資料番号 |
ME2025-19 |
| 発行日 |
2025-02-11 (MMS, ME, AIT, SIP) |
| ISSN |
Online edition: ISSN 2424-1970 |
| PDFダウンロード |
|
| 研究会情報 |
| 研究会 |
ME AIT MMS IEICE-IE IEICE-ITS SIP |
| 開催期間 |
2025-02-18 - 2025-02-19 |
| 開催地(和) |
北海道大学 |
| 開催地(英) |
Hokkaido Univ. |
| テーマ(和) |
画像処理,一般 |
| テーマ(英) |
Image Processing, etc. |
| 講演論文情報の詳細 |
| 申込み研究会 |
ME |
| 会議コード |
2025-02-ME-AIT-MMS-IE-ITS-SIP |
| 本文の言語 |
日本語 |
| タイトル(和) |
Vision TransformerにおけるHEVC符号化された3DCG画像のAttention機構に関する実験的考察 |
| サブタイトル(和) |
|
| タイトル(英) |
Experimental Discussion on the Attention Mechanism of HEVC and 3D CG Images Using Vision Transformer |
| サブタイトル(英) |
|
| キーワード(1)(和/英) |
3DCG画像 / 3D CG Image |
| キーワード(2)(和/英) |
H.265/HEVC / H.265/HEVC |
| キーワード(3)(和/英) |
Vision Transformer / Vision Transformer (ViT) |
| キーワード(4)(和/英) |
関心領域 / Region Of Interest (ROI) |
| キーワード(5)(和/英) |
注視点マップ / Attention Map |
| キーワード(6)(和/英) |
AIアーキテクチャ / Artificial Intelligence (AI) Architecture |
| キーワード(7)(和/英) |
/ |
| キーワード(8)(和/英) |
/ |
| 第1著者 氏名(和/英/ヨミ) |
河畑 則文 / Norifumi Kawabata / カワバタ ノリフミ |
| 第1著者 所属(和/英) |
コンピュータイメージングラボ (略称: コンピュータイメージングラボ)
Computational Imaging Lab (略称: Computational Imaging Lab) |
| 第2著者 氏名(和/英/ヨミ) |
/ / |
| 第2著者 所属(和/英) |
(略称: )
(略称: ) |
| 第3著者 氏名(和/英/ヨミ) |
/ / |
| 第3著者 所属(和/英) |
(略称: )
(略称: ) |
| 第4著者 氏名(和/英/ヨミ) |
/ / |
| 第4著者 所属(和/英) |
(略称: )
(略称: ) |
| 第5著者 氏名(和/英/ヨミ) |
/ / |
| 第5著者 所属(和/英) |
(略称: )
(略称: ) |
| 第6著者 氏名(和/英/ヨミ) |
/ / |
| 第6著者 所属(和/英) |
(略称: )
(略称: ) |
| 第7著者 氏名(和/英/ヨミ) |
/ / |
| 第7著者 所属(和/英) |
(略称: )
(略称: ) |
| 第8著者 氏名(和/英/ヨミ) |
/ / |
| 第8著者 所属(和/英) |
(略称: )
(略称: ) |
| 第9著者 氏名(和/英/ヨミ) |
/ / |
| 第9著者 所属(和/英) |
(略称: )
(略称: ) |
| 第10著者 氏名(和/英/ヨミ) |
/ / |
| 第10著者 所属(和/英) |
(略称: )
(略称: ) |
| 第11著者 氏名(和/英/ヨミ) |
/ / |
| 第11著者 所属(和/英) |
(略称: )
(略称: ) |
| 第12著者 氏名(和/英/ヨミ) |
/ / |
| 第12著者 所属(和/英) |
(略称: )
(略称: ) |
| 第13著者 氏名(和/英/ヨミ) |
/ / |
| 第13著者 所属(和/英) |
(略称: )
(略称: ) |
| 第14著者 氏名(和/英/ヨミ) |
/ / |
| 第14著者 所属(和/英) |
(略称: )
(略称: ) |
| 第15著者 氏名(和/英/ヨミ) |
/ / |
| 第15著者 所属(和/英) |
(略称: )
(略称: ) |
| 第16著者 氏名(和/英/ヨミ) |
/ / |
| 第16著者 所属(和/英) |
(略称: )
(略称: ) |
| 第17著者 氏名(和/英/ヨミ) |
/ / |
| 第17著者 所属(和/英) |
(略称: )
(略称: ) |
| 第18著者 氏名(和/英/ヨミ) |
/ / |
| 第18著者 所属(和/英) |
(略称: )
(略称: ) |
| 第19著者 氏名(和/英/ヨミ) |
/ / |
| 第19著者 所属(和/英) |
(略称: )
(略称: ) |
| 第20著者 氏名(和/英/ヨミ) |
/ / |
| 第20著者 所属(和/英) |
(略称: )
(略称: ) |
| 第21著者 氏名(和/英/ヨミ) |
/ / |
| 第21著者 所属(和/英) |
(略称: )
(略称: ) |
| 第22著者 氏名(和/英/ヨミ) |
/ / |
| 第22著者 所属(和/英) |
(略称: )
(略称: ) |
| 第23著者 氏名(和/英/ヨミ) |
/ / |
| 第23著者 所属(和/英) |
(略称: )
(略称: ) |
| 第24著者 氏名(和/英/ヨミ) |
/ / |
| 第24著者 所属(和/英) |
(略称: )
(略称: ) |
| 第25著者 氏名(和/英/ヨミ) |
/ / |
| 第25著者 所属(和/英) |
(略称: )
(略称: ) |
| 第26著者 氏名(和/英/ヨミ) |
/ / |
| 第26著者 所属(和/英) |
(略称: )
(略称: ) |
| 第27著者 氏名(和/英/ヨミ) |
/ / |
| 第27著者 所属(和/英) |
(略称: )
(略称: ) |
| 第28著者 氏名(和/英/ヨミ) |
/ / |
| 第28著者 所属(和/英) |
(略称: )
(略称: ) |
| 第29著者 氏名(和/英/ヨミ) |
/ / |
| 第29著者 所属(和/英) |
(略称: )
(略称: ) |
| 第30著者 氏名(和/英/ヨミ) |
/ / |
| 第30著者 所属(和/英) |
(略称: )
(略称: ) |
| 第31著者 氏名(和/英/ヨミ) |
/ / |
| 第31著者 所属(和/英) |
(略称: )
(略称: ) |
| 第32著者 氏名(和/英/ヨミ) |
/ / |
| 第32著者 所属(和/英) |
(略称: )
(略称: ) |
| 第33著者 氏名(和/英/ヨミ) |
/ / |
| 第33著者 所属(和/英) |
(略称: )
(略称: ) |
| 第34著者 氏名(和/英/ヨミ) |
/ / |
| 第34著者 所属(和/英) |
(略称: )
(略称: ) |
| 第35著者 氏名(和/英/ヨミ) |
/ / |
| 第35著者 所属(和/英) |
(略称: )
(略称: ) |
| 第36著者 氏名(和/英/ヨミ) |
/ / |
| 第36著者 所属(和/英) |
(略称: )
(略称: ) |
| 講演者 |
第1著者 |
| 発表日時 |
2025-02-18 16:10:00 |
| 発表時間 |
15分 |
| 申込先研究会 |
ME |
| 資料番号 |
MMS2025-19, ME2025-19, AIT2025-19, SIP2025-19 |
| 巻番号(vol) |
vol.49 |
| 号番号(no) |
no.4 |
| ページ範囲 |
pp.96-101 |
| ページ数 |
6 |
| 発行日 |
2025-02-11 (MMS, ME, AIT, SIP) |
|