映像情報メディア学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
技報オンライン
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2026-03-02 14:30
SpecVQGANを用いた植物による環境音生成
廣木 茜石川知一東洋大
抄録 (和) 本研究では,映像から自然環境音を生成する既存モデル SpecVQGAN を基盤とし,植物環境音(葉擦れ音・枝擦れ音)に特化した音声生成手法を提案する.従来の汎用的な学習設定では植物特有の微細な音響現象の再現性に課題があった.本研究では植物映像のみから構成されるデータセットを構築し,フレーム差分および動き特徴を視覚条件として導入することで時間的整合性の向上を図った.評価には Melception 特徴量に基づく FID を用いた.その結果,既存モデルの中央値145.2に対し提案手法は130へ改善し,植物環境音生成における有効性を確認した. 
(英) This study proposes a plant-specific environmental sound generation method based on SpecVQGAN. While visually guided sound generation models can produce natural audio, they often fail to reproduce fine-grained acoustic characteristics of plant-related sounds such as leaf rustling. We constructed a plant-focused dataset and introduced motion features derived from frame differences to enhance temporal consistency. Experimental results demonstrate that the proposed method improves the median Fréchet Inception Distance (FID) from 145.2 to 130, indicating better distributional similarity to real plant sounds.
キーワード (和) 映像音声生成 / SpecVQGAN / 環境音生成 / Fréchet Inception Distance / / / /  
(英) Visual-to-Audio Generation / SpecVQGAN / Environmental Sound / FID / / / /  
文献情報 映情学技報, vol. 50, pp. 390-391, 2026年3月.
資料番号  
発行日 2026-02-23 (AIT) 
ISSN Online edition: ISSN 2424-1970
PDFダウンロード

研究会情報
研究会 AIT IIEEJ AS CG-ARTS  
開催期間 2026-03-02 - 2026-03-02 
開催地(和) 東京工芸大学中野キャンバス 
開催地(英) Tokyo Polytechnic Univ. (Nakano) 
テーマ(和) 映像表現・芸術科学フォーラム2026 (Expressive Japan 2026) 
テーマ(英) Expressive Japan 2026 
講演論文情報の詳細
申込み研究会 IIEEJ 
会議コード 2026-03-AIT-IIEEJ-AS-ARTS 
本文の言語 日本語 
タイトル(和) SpecVQGANを用いた植物による環境音生成 
サブタイトル(和)  
タイトル(英) Generating environmental sounds by plants using SpecVQGAN 
サブタイトル(英)  
キーワード(1)(和/英) 映像音声生成 / Visual-to-Audio Generation  
キーワード(2)(和/英) SpecVQGAN / SpecVQGAN  
キーワード(3)(和/英) 環境音生成 / Environmental Sound  
キーワード(4)(和/英) Fréchet Inception Distance / FID  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 廣木 茜 / Akane Hiroki / ヒロキ アカネ
第1著者 所属(和/英) 東洋大学 (略称: 東洋大)
Toyo University (略称: Toyo Univ.)
第2著者 氏名(和/英/ヨミ) 石川 知一 / Tomokazu Ishikawa /
第2著者 所属(和/英) 東洋大学 (略称: 東洋大)
Toyo University (略称: Toyo Univ.)
第3著者 氏名(和/英/ヨミ) / /
第3著者 所属(和/英) (略称: )
(略称: )
第4著者 氏名(和/英/ヨミ) / /
第4著者 所属(和/英) (略称: )
(略称: )
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
第21著者 氏名(和/英/ヨミ) / /
第21著者 所属(和/英) (略称: )
(略称: )
第22著者 氏名(和/英/ヨミ) / /
第22著者 所属(和/英) (略称: )
(略称: )
第23著者 氏名(和/英/ヨミ) / /
第23著者 所属(和/英) (略称: )
(略称: )
第24著者 氏名(和/英/ヨミ) / /
第24著者 所属(和/英) (略称: )
(略称: )
第25著者 氏名(和/英/ヨミ) / /
第25著者 所属(和/英) (略称: )
(略称: )
第26著者 氏名(和/英/ヨミ) / /
第26著者 所属(和/英) (略称: )
(略称: )
第27著者 氏名(和/英/ヨミ) / /
第27著者 所属(和/英) (略称: )
(略称: )
第28著者 氏名(和/英/ヨミ) / /
第28著者 所属(和/英) (略称: )
(略称: )
第29著者 氏名(和/英/ヨミ) / /
第29著者 所属(和/英) (略称: )
(略称: )
第30著者 氏名(和/英/ヨミ) / /
第30著者 所属(和/英) (略称: )
(略称: )
第31著者 氏名(和/英/ヨミ) / /
第31著者 所属(和/英) (略称: )
(略称: )
第32著者 氏名(和/英/ヨミ) / /
第32著者 所属(和/英) (略称: )
(略称: )
第33著者 氏名(和/英/ヨミ) / /
第33著者 所属(和/英) (略称: )
(略称: )
第34著者 氏名(和/英/ヨミ) / /
第34著者 所属(和/英) (略称: )
(略称: )
第35著者 氏名(和/英/ヨミ) / /
第35著者 所属(和/英) (略称: )
(略称: )
第36著者 氏名(和/英/ヨミ) / /
第36著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2026-03-02 14:30:00 
発表時間 80分 
申込先研究会 IIEEJ 
資料番号 AIT2026-150 
巻番号(vol) vol.50 
号番号(no) no.7 
ページ範囲 pp.390-391 
ページ数
発行日 2026-02-23 (AIT) 


[研究会発表申込システムのトップページに戻る]

[映像情報メディア学会ホームページ]


ITE / 映像情報メディア学会