映像情報メディア学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
技報オンライン
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2024-06-05 15:20
機械学習による口の形状を用いたコマンド認識に関する研究
田中亮太朗包 躍東京都市大
抄録 (和) 従来の口元の動きによる機器操作では、口元の動画を登録する必要があり、ユーザーに負担がかかっていた。本研究では、自然言語でコマンドを登録し、口元の動きから発話内容を推定する手法を提案した。自然言語と動画からそれぞれ特徴量を抽出するモデルを構築し、両者の特徴量の類似度から発話内容を推定する。実験では、提案手法により従来手法と同等の精度が得られた。しかし、ユーザー非依存の場合は精度が低下することが分かった。今後は更なる精度向上が課題である。 
(英) Conventional approaches for device control using lip movements require registering video samples of lip movements, burdening users. This study proposes a command recognition method that registers commands using natural language and infers utterances from lip movements. Two models were built to extract features from natural language and video, respectively. The utterance was inferred from the similarity between the two feature spaces. Experiments showed that the proposed method achieved comparable accuracy to conventional methods. However, accuracy declined in user-independent cases. Further performance improvement is needed for practical use.
キーワード (和) 機械学習 / 読唇術 / 画像処理 / 自然言語処理 / / / /  
(英) Machine Learning / Lip Reading / Image Processing / Natural Language Processing / / / /  
文献情報 映情学技報, vol. 48, no. 16, AIT2024-151, pp. 37-40, 2024年6月.
資料番号 AIT2024-151 
発行日 2024-05-29 (AIT) 
ISSN Online edition: ISSN 2424-1970
PDFダウンロード

研究会情報
研究会 IIEEJ AIT  
開催期間 2024-06-05 - 2024-06-05 
開催地(和) 東京情報デザイン専門職大学 
開催地(英) Tokyo Information Design Professional University 
テーマ(和) 画像一般(色再現,立体映像,CG,VR,アニメーション技術,画像処理,ME関係,画像符号化など幅広く扱います.年次大会投稿に向けた議論の場としても歓迎します.) 
テーマ(英)  
講演論文情報の詳細
申込み研究会 AIT 
会議コード 2024-06-IIEEJ-AIT 
本文の言語 日本語 
タイトル(和) 機械学習による口の形状を用いたコマンド認識に関する研究 
サブタイトル(和)  
タイトル(英) A Study on command recognition using mouth shape using machine learning 
サブタイトル(英)  
キーワード(1)(和/英) 機械学習 / Machine Learning  
キーワード(2)(和/英) 読唇術 / Lip Reading  
キーワード(3)(和/英) 画像処理 / Image Processing  
キーワード(4)(和/英) 自然言語処理 / Natural Language Processing  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 田中 亮太朗 / Ryotaro Tanaka / タナカ リョウタロウ
第1著者 所属(和/英) 東京都市大学 (略称: 東京都市大)
Tokyo City University (略称: Tokyo City Univ.)
第2著者 氏名(和/英/ヨミ) 包 躍 / Yao Bao / バオ ユエ
第2著者 所属(和/英) 東京都市大学 (略称: 東京都市大)
Tokyo City University (略称: Tokyo City Univ.)
第3著者 氏名(和/英/ヨミ) / /
第3著者 所属(和/英) (略称: )
(略称: )
第4著者 氏名(和/英/ヨミ) / /
第4著者 所属(和/英) (略称: )
(略称: )
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2024-06-05 15:20:00 
発表時間 20分 
申込先研究会 AIT 
資料番号 AIT2024-151 
巻番号(vol) vol.48 
号番号(no) no.16 
ページ範囲 pp.37-40 
ページ数
発行日 2024-05-29 (AIT) 


[研究会発表申込システムのトップページに戻る]

[映像情報メディア学会ホームページ]


ITE / 映像情報メディア学会