大規模言語モデルと視線情報による認知状態の推測 ～ マインドリーディング技術の検討 ～

多田,那由多; 中西,史佳; 山高,大乗; 小濱,剛

映像情報メディア学会研究会発表申込システム
講演論文詳細

技報閲覧サービス
技報オンライン

講演抄録／キーワード
講演名		2026-02-17 09:40 大規模言語モデルと視線情報による認知状態の推測～マインドリーディング技術の検討～ ○多田那由多（近畿大）・中西史佳・山高大乗（デンソー先端研）・小濱　剛（近畿大）
抄録	（和）	本研究では，視線に基づいたマインドリーディング技術の確立を目的として，画像からテキストを生成する深層学習モデルである BLIP-2 の attention 機構に視線情報を混合させるように拡張したモデルを構築した．学習データには，実験参加者に質問文を提示した上で画像を観察する際に計測された視線データを用いた．また，データ収集コストの削減を視野に入れ，既存のデータに対してヒトが指示内容を評価した主観評価データを作成し，これによる学習も試みた．その結果，実測データを用いたモデルでは，評価指標のスコアは良好であり，特定の画像に対して入力する視線データを変えることで，生成されるテキストが変化することを確認した．一方，主観評価データを用いた学習では早期に過学習に陥ったことから，データ構築方法に課題が残った．実測データに対する予測精度からは，視線情報が提案モデルのテキスト生成に寄与していたと考えられ，視線に基づいたマインドリーディング技術開発の可能性が示唆された．
	（英）	This study aimed to develop gaze-based mind-reading technology by extending BLIP-2, a deep learning model for image-to-text generation, to integrate gaze information into its attention mechanism. The training data consisted of gaze data measured while participants observed images after being presented with questions. Additionally, to reduce data collection costs, we created a subjective evaluation dataset in which humans assessed the instruction content of existing data and attempted to use this dataset for training purposes. The results showed that the model trained on the measured data achieved favorable scores for the evaluation metrics. Furthermore, we confirmed that varying the input gaze data for a given image alters the generated text. Conversely, training with the subjective evaluation dataset led to early overfitting, highlighting the remaining challenges in the data construction method. The prediction accuracy obtained with the measured data suggests that gaze information contributes to the proposed model's text generation, indicating the potential for developing gaze-based mind-reading technology.
キーワード	（和）	大規模言語モデル / 視線 / テキスト生成 / マインドリーディング / / / /
	（英）	Large language model / Gaze information / Text generation / Mind-reading / / / /
文献情報		映情学技報, vol. 50, no. 4, HI2026-1, pp. 1-5, 2026年2月.
資料番号		HI2026-1
発行日		2026-02-10 (HI)
ISSN		Online edition: ISSN 2424-1970
PDFダウンロード

研究会情報
研究会	IEICE-HIP HI VRPSY ASJ-H
開催期間	2026-02-17 - 2026-02-18
開催地（和）	那覇市IT創造館大会議室
開催地（英）
テーマ（和）	VR心理，ヒューマン情報処理，視覚，マルチモーダル，一般
テーマ（英）
講演論文情報の詳細
申込み研究会	HI
会議コード	2026-02-HIP-HI-VRPSY-H
本文の言語	日本語
タイトル（和）	大規模言語モデルと視線情報による認知状態の推測
サブタイトル（和）	マインドリーディング技術の検討
タイトル（英）	Inference of Cognitive States through Large Language Models and Gaze Information
サブタイトル（英）	An Examination of Mind-Reading Technology
キーワード(1)（和/英）	大規模言語モデル / Large language model
キーワード(2)（和/英）	視線 / Gaze information
キーワード(3)（和/英）	テキスト生成 / Text generation
キーワード(4)（和/英）	マインドリーディング / Mind-reading
キーワード(5)（和/英）	/
キーワード(6)（和/英）	/
キーワード(7)（和/英）	/
キーワード(8)（和/英）	/
第1著者氏名（和/英/ヨミ）	多田那由多 / Nayuta Tada / タダナユタ
第1著者所属（和/英）	近畿大学 (略称：近畿大) Kindai University (略称： Kindai Univ.)
第2著者氏名（和/英/ヨミ）	中西史佳 / Fumika Nakanishi / ナカニシフミカ
第2著者所属（和/英）	株式会社デンソー先端技術研究所 (略称：デンソー先端研) Advanced Research and Innovation Center, DENSO CORPORATION (略称： ARIC, DENSO CORP.)
第3著者氏名（和/英/ヨミ）	山高大乗 / Minori Yamataka / ヤマタカミノリ
第3著者所属（和/英）	株式会社デンソー先端技術研究所 (略称：デンソー先端研) Advanced Research and Innovation Center, DENSO CORPORATION (略称： ARIC, DENSO CORP.)
第4著者氏名（和/英/ヨミ）	小濱剛 / Takeshi Kohama / コハマタケシ
第4著者所属（和/英）	近畿大学 (略称：近畿大) Kindai University (略称： Kindai Univ.)
第5著者氏名（和/英/ヨミ）	/ /
第5著者所属（和/英）	(略称： ) (略称： )
第6著者氏名（和/英/ヨミ）	/ /
第6著者所属（和/英）	(略称： ) (略称： )
第7著者氏名（和/英/ヨミ）	/ /
第7著者所属（和/英）	(略称： ) (略称： )
第8著者氏名（和/英/ヨミ）	/ /
第8著者所属（和/英）	(略称： ) (略称： )
第9著者氏名（和/英/ヨミ）	/ /
第9著者所属（和/英）	(略称： ) (略称： )
第10著者氏名（和/英/ヨミ）	/ /
第10著者所属（和/英）	(略称： ) (略称： )
第11著者氏名（和/英/ヨミ）	/ /
第11著者所属（和/英）	(略称： ) (略称： )
第12著者氏名（和/英/ヨミ）	/ /
第12著者所属（和/英）	(略称： ) (略称： )
第13著者氏名（和/英/ヨミ）	/ /
第13著者所属（和/英）	(略称： ) (略称： )
第14著者氏名（和/英/ヨミ）	/ /
第14著者所属（和/英）	(略称： ) (略称： )
第15著者氏名（和/英/ヨミ）	/ /
第15著者所属（和/英）	(略称： ) (略称： )
第16著者氏名（和/英/ヨミ）	/ /
第16著者所属（和/英）	(略称： ) (略称： )
第17著者氏名（和/英/ヨミ）	/ /
第17著者所属（和/英）	(略称： ) (略称： )
第18著者氏名（和/英/ヨミ）	/ /
第18著者所属（和/英）	(略称： ) (略称： )
第19著者氏名（和/英/ヨミ）	/ /
第19著者所属（和/英）	(略称： ) (略称： )
第20著者氏名（和/英/ヨミ）	/ /
第20著者所属（和/英）	(略称： ) (略称： )
第21著者氏名（和/英/ヨミ）	/ /
第21著者所属（和/英）	(略称： ) (略称： )
第22著者氏名（和/英/ヨミ）	/ /
第22著者所属（和/英）	(略称： ) (略称： )
第23著者氏名（和/英/ヨミ）	/ /
第23著者所属（和/英）	(略称： ) (略称： )
第24著者氏名（和/英/ヨミ）	/ /
第24著者所属（和/英）	(略称： ) (略称： )
第25著者氏名（和/英/ヨミ）	/ /
第25著者所属（和/英）	(略称： ) (略称： )
第26著者氏名（和/英/ヨミ）	/ /
第26著者所属（和/英）	(略称： ) (略称： )
第27著者氏名（和/英/ヨミ）	/ /
第27著者所属（和/英）	(略称： ) (略称： )
第28著者氏名（和/英/ヨミ）	/ /
第28著者所属（和/英）	(略称： ) (略称： )
第29著者氏名（和/英/ヨミ）	/ /
第29著者所属（和/英）	(略称： ) (略称： )
第30著者氏名（和/英/ヨミ）	/ /
第30著者所属（和/英）	(略称： ) (略称： )
第31著者氏名（和/英/ヨミ）	/ /
第31著者所属（和/英）	(略称： ) (略称： )
第32著者氏名（和/英/ヨミ）	/ /
第32著者所属（和/英）	(略称： ) (略称： )
第33著者氏名（和/英/ヨミ）	/ /
第33著者所属（和/英）	(略称： ) (略称： )
第34著者氏名（和/英/ヨミ）	/ /
第34著者所属（和/英）	(略称： ) (略称： )
第35著者氏名（和/英/ヨミ）	/ /
第35著者所属（和/英）	(略称： ) (略称： )
第36著者氏名（和/英/ヨミ）	/ /
第36著者所属（和/英）	(略称： ) (略称： )
講演者	第1著者
発表日時	2026-02-17 09:40:00
発表時間	20分
申込先研究会	HI
資料番号	HI2026-1
巻番号（vol）	vol.50
号番号（no）	no.4
ページ範囲	pp.1-5
ページ数	5
発行日	2026-02-10 (HI)

[研究会発表申込システムのトップページに戻る]

[映像情報メディア学会ホームページ]

ITE / 映像情報メディア学会