This study introduces a novel approach to electric wheelchair automatic navigation utilizing Large Language Models and Visual Language Models. An autopilot system using Large Language Models and Visual Language Models is implemented, and field tests are performed.
A comparative analysis was performed using field test data to evaluate the performance of different VLMs in landmark recognition. Furthermore, an assessment of map analysis performance among different VLMs was conducted.
本研究は、大規模言語モデル(LLM)および視覚言語モデル(VLM)を活用した、電動車椅子の自動ナビゲーションにおける新たなアプローチを導入するものである。LLMとVLMを用いたオートパイロットシステムを実装し、フィールドテストを実施した。 フィールドテストのデータを用いて比較分析を行い、ランドマーク認識における異なるVLMの性能を評価した。さらに、異なるVLM間での地図解析性能の評価も行った。