講演抄録/キーワード |
講演名 |
2022-10-13 14:15
音声自然性改善に向けた音声強調ネットワークに対するカプセル構造の導入 ○春日玲人・島村徹也・杉浦陽介・安井希子(埼玉大) |
抄録 |
(和) |
音声強調の分野は世界中で幅広く研究が行われているが,音声信号処理で扱われる基本的な量の中で,振幅や周波数などに比べ,位相は軽視される傾向にある.これは人間の聴覚は位相の変化に鈍感であるという認識から,位相の音声品質への寄与は少ないと考えられていたためである.しかし音声信号処理の発展とともに,音声品質に対する位相の重要性が明らかにされた.本論文では,近年画像認識の分野において優れた性能を発揮しているCapsule Networkのカプセル構造を音声強調ネットワークに導入し,位相情報にも着目した音声強調モデルを構築することで,音声強調ネットワークの性能改善,及び音声自然性の改善を試みる. |
(英) |
Although the field of speech enhancement has been extensively studied around the world, phase tends to be neglected compared to amplitude and frequency among the basic quantities handled in speech signal processing. This is because it was believed that the contribution of phase to speech quality was small, based on the perception that human hearing is insensitive to changes in phase. However, with the development of speech signal processing, the importance of phase to speech quality has become clear. In this paper, we introduce the capsule structure of the Capsule Network, which has shown excellent performance in the field of image recognition in recent years, to the speech enhancement network, and attempt to improve the performance of the speech enhancement network and the naturalness of speech by constructing a speech enhancement model that also focuses on phase information. |
キーワード |
(和) |
音声強調 / 位相 / 音声品質 / Capsule Network / カプセル構造 / 音声自然性 / / |
(英) |
speech enhancement / phase / speech quality / Capsule Network / capsule structure / naturalness of speech / / |
文献情報 |
映情学技報 |
資料番号 |
|
発行日 |
|
ISSN |
|
PDFダウンロード |
|