Съвместен доклад на XPeng Motors и Националната ключова лаборатория за обработка на мултимедийна информация към Факултета по компютърни науки на Пекинския университет беше приет на AAAI 2026, една от най-добрите конференции за AI в света. Степента на приемане за тазгодишната конференция е едва 17,6%.

Озаглавен „FastDriveVLA: Ефективно шофиране от край до край чрез съкращаване на токени, базирано на Plug-and-Play Reconstruction,“ документът представя FastDriveVLA, ефективна рамка за изрязване на визуални токени, проектирана специално за модели от край до край на визуално-езиково действие (VLA) при автономно шофиране.

Тъй като VLA моделите се мащабират, огромният брой визуални токени създава значителни изчислителни тежести върху хардуера от страната на превозното средство. FastDriveVLA се справя с това чрез plug-and-play секатор, наречен ReconPruner, който използва противопоставителна стратегия за реконструкция на преден план и заден план. Този подход обучава модела да се фокусира върху критични елементи на преден план – като пешеходци, превозни средства и пътни знаци – като същевременно филтрира неподходящи визуални детайли, отразявайки начина, по който шофьорите приоритизират вниманието.

За да подпомогне обучението, екипът създаде nuScenes-FG, широкомащабен набор от данни за сегментиране на преден план, съдържащ 241 000 двойки изображение–маска. Експерименталните резултати от бенчмарка на nuScenes показват, че съкращаването на 25% от визуалните токени не води до почти никаква загуба на производителност, докато съкращаването на 50% поддържа балансирана производителност в показателите. Намаляването на токените от 3249 на 812 намалява изчисленията с почти 7,5 пъти и значително намалява латентността на извода.

Това бележи още едно голямо присъствие на XPeng на първокласна AI конференция тази година, след по-ранното му представяне на CVPR WAD. Изследването поставя нова еталонна точка за ефективно внедряване на големи модели в реални среди от страната на автомобила.

Източник: XPeng

Source link

Like this:

Like Loading…

Нашия източник е Българо-Китайска Търговско-промишлена палaта

By admin