映像情報メディア学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
技報オンライン
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2025-02-18 09:30
Llava-Planner: Enhancing Spatial Awareness of LLaVA for Cost-Effective Path Planning
Ling XiaoHiromasa YamanishiToshihiko YamasakiUTokyo
抄録 (和) (まだ登録されていません) 
(英) Cost-effective path planning is essential for unmanned systems, particularly considering the challenges of recharging during prolonged outdoor operations. Despite its significance, this area has been largely overlooked in prior research. Traditional path planning methods are proposed aiming at obstacle avoidance, often resulting in cost-inefficient paths. Meanwhile, large multimodal models (LMMs) exhibit exceptional contextual understanding but remain underutilized in path planning due to their limited spatial awareness.
To bridge this gap, we present Llava-Planner, a large multimodal model designed for cost-effective path planning. Llava-Planner explores a novel approach to leverage LMMs for path planning. This paper also proposes three carefully designed pretraining tasks to further enhance the spatial awareness of Llava-Planner, including: terrain description generation, identification of the coordinates of the start and end point coordinates, and obstacle avoidance prediction.
Experimental evaluations on a newly created grid map dataset demonstrate that LMMs can effectively perform path planning with well-crafted prompts, demonstrating their potential as a robust and efficient solution for robot path planning and navigation. However, there are some random errors found in Llava-Planner generated path points, highlighting the need for human-in-the-loop integration as a potential future direction to enhance reliability and performance.
キーワード (和) / / / / / / /  
(英) Cost-effective path planning / large multimodal models / robot navigation / / / / /  
文献情報 映情学技報
資料番号  
発行日  
ISSN Online edition: ISSN 2424-1970
PDFダウンロード

研究会情報
研究会 ME AIT MMS IEICE-IE IEICE-ITS SIP  
開催期間 2025-02-18 - 2025-02-19 
開催地(和) 北海道大学 
開催地(英) Hokkaido Univ. 
テーマ(和) 画像処理,一般 
テーマ(英) Image Processing, etc. 
講演論文情報の詳細
申込み研究会 IEICE-IE 
会議コード 2025-02-ITS-IE-MMS-ME-AIT 
本文の言語 英語 
タイトル(和)  
サブタイトル(和)  
タイトル(英) Llava-Planner: Enhancing Spatial Awareness of LLaVA for Cost-Effective Path Planning 
サブタイトル(英)  
キーワード(1)(和/英) / Cost-effective path planning  
キーワード(2)(和/英) / large multimodal models  
キーワード(3)(和/英) / robot navigation  
キーワード(4)(和/英) /  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 肖 玲 / Ling Xiao /
第1著者 所属(和/英) 東京大学 (略称: 東大)
The University of Tokyo (略称: UTokyo)
第2著者 氏名(和/英/ヨミ) 山西 博雅 / Hiromasa Yamanishi /
第2著者 所属(和/英) 東京大学 (略称: 東大)
The University of Tokyo (略称: UTokyo)
第3著者 氏名(和/英/ヨミ) 山崎 俊彦 / Toshihiko Yamasaki /
第3著者 所属(和/英) 東京大学 (略称: 東大)
The University of Tokyo (略称: UTokyo)
第4著者 氏名(和/英/ヨミ) / /
第4著者 所属(和/英) (略称: )
(略称: )
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
第21著者 氏名(和/英/ヨミ) / /
第21著者 所属(和/英) (略称: )
(略称: )
第22著者 氏名(和/英/ヨミ) / /
第22著者 所属(和/英) (略称: )
(略称: )
第23著者 氏名(和/英/ヨミ) / /
第23著者 所属(和/英) (略称: )
(略称: )
第24著者 氏名(和/英/ヨミ) / /
第24著者 所属(和/英) (略称: )
(略称: )
第25著者 氏名(和/英/ヨミ) / /
第25著者 所属(和/英) (略称: )
(略称: )
第26著者 氏名(和/英/ヨミ) / /
第26著者 所属(和/英) (略称: )
(略称: )
第27著者 氏名(和/英/ヨミ) / /
第27著者 所属(和/英) (略称: )
(略称: )
第28著者 氏名(和/英/ヨミ) / /
第28著者 所属(和/英) (略称: )
(略称: )
第29著者 氏名(和/英/ヨミ) / /
第29著者 所属(和/英) (略称: )
(略称: )
第30著者 氏名(和/英/ヨミ) / /
第30著者 所属(和/英) (略称: )
(略称: )
第31著者 氏名(和/英/ヨミ) / /
第31著者 所属(和/英) (略称: )
(略称: )
第32著者 氏名(和/英/ヨミ) / /
第32著者 所属(和/英) (略称: )
(略称: )
第33著者 氏名(和/英/ヨミ) / /
第33著者 所属(和/英) (略称: )
(略称: )
第34著者 氏名(和/英/ヨミ) / /
第34著者 所属(和/英) (略称: )
(略称: )
第35著者 氏名(和/英/ヨミ) / /
第35著者 所属(和/英) (略称: )
(略称: )
第36著者 氏名(和/英/ヨミ) / /
第36著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2025-02-18 09:30:00 
発表時間 15分 
申込先研究会 IEICE-IE 
資料番号  
巻番号(vol) vol.49 
号番号(no)  
ページ範囲  
ページ数  
発行日  


[研究会発表申込システムのトップページに戻る]

[映像情報メディア学会ホームページ]


ITE / 映像情報メディア学会