お知らせ ◆映像情報メディア学会における研究会等の開催について (新型コロナウイルス関連)
映像情報メディア学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
技報オンライン
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2020-03-13 14:20
ゼミナールでの発言度合い調査のための深層学習による話者識別
秋田智希吉田典正日大
抄録 (和) ゼミナールでは,学生も積極的な参加が望まれる.本研究では,ゼミナールにおいて,学生の発言度合いを測定するシステムを提案する.具体的には,システムの作成に向けて畳み込みニューラルネットワーク(CNN)によって話者識別を行う.入力データは,録音したゼミナールの音声を1秒ごとに区切り,高速フーリエ変換によって作成したスペクトログラムの画像とした.6人と環境音の7つの分類で行った結果,正答率は56.7%であった.6人から4人を抜き出して話者識別を行った結果,正答率は最高で76.3%,最低で63.1%となった.結果より,話者識別の正答率を改善する案を提案する. 
(英) In seminars, students are expected to participate actively. In this study, we would like to create a system that can measure the activity of students in the seminar. Speaker identification is performed using a convolutional neural network to create a system. The input data was recorded spectrogram images created by fast Fourier transform by dividing the recorded speech of the seminar every one second. The classification was done in seven categories of 6 people and ambient sound. The correct answer rate was 56.7%. As a result of extracting speakers from six people, the correct answer rate was 76.3% at the maximum and 63.1% at the minimum. From the results, we propose a method to improve the correct answer rate of speaker diarization.
キーワード (和) AI / 深層学習 / 話者識別 / CNN / スペクトログラム / / /  
(英) AI / Deep learning / Speaker diarization / CNN / Spectrogram / / /  
文献情報 映情学技報, vol. 44, no. 10, AIT2020-144, pp. 313-314, 2020年3月.
資料番号  
発行日 2020-03-06 (AIT) 
ISSN Print edition: ISSN 1342-6893  Online edition: ISSN 2424-1970
PDFダウンロード

研究会情報
研究会 AIT IIEEJ AS CG-ARTS  
開催期間 2020-03-13 - 2020-03-13 
開催地(和) 東京工科大学 蒲田キャンパス 
開催地(英) Tokyo University of Technology 
テーマ(和) 映像表現・芸術科学フォーラム2020(Expressive Japan 2020) 
テーマ(英) Expressive Japan 2020 
講演論文情報の詳細
申込み研究会 IIEEJ 
会議コード 2020-03-AIT-IIEEJ-AS-ARTS 
本文の言語 日本語 
タイトル(和) ゼミナールでの発言度合い調査のための深層学習による話者識別 
サブタイトル(和)  
タイトル(英) Speaker Identification for Evaluating Speaking Activities in Seminar using Deep Learning 
サブタイトル(英)  
キーワード(1)(和/英) AI / AI  
キーワード(2)(和/英) 深層学習 / Deep learning  
キーワード(3)(和/英) 話者識別 / Speaker diarization  
キーワード(4)(和/英) CNN / CNN  
キーワード(5)(和/英) スペクトログラム / Spectrogram  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 秋田 智希 / Tomoki Akita / アキタ トモキ
第1著者 所属(和/英) 日本大学 (略称: 日大)
Nihon University (略称: Nihon Univ.)
第2著者 氏名(和/英/ヨミ) 吉田 典正 / Norimasa Yoshida / ヨシダ ノリマサ
第2著者 所属(和/英) 日本大学 (略称: 日大)
Nihon University (略称: Nihon Univ.)
第3著者 氏名(和/英/ヨミ) / /
第3著者 所属(和/英) (略称: )
(略称: )
第4著者 氏名(和/英/ヨミ) / /
第4著者 所属(和/英) (略称: )
(略称: )
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者
発表日時 2020-03-13 14:20:00 
発表時間 15 
申込先研究会 IIEEJ 
資料番号 ITE-AIT2020-144 
巻番号(vol) ITE-44 
号番号(no) no.10 
ページ範囲 pp.313-314 
ページ数 ITE-2 
発行日 ITE-AIT-2020-03-06 


[研究会発表申込システムのトップページに戻る]

[映像情報メディア学会ホームページ]


ITE / 映像情報メディア学会