One Token to Seg Them All: Language Instructed Reasoning Segmentation in Videos

[Zechen Bai](https://www.baizechen.site/) ¹ [Tong He](https://hetong007.github.io/) ² [Haiyang Mei](https://mhaiyang.github.io/) ¹ [Pichao Wang](https://wangpichao.github.io/) ² [Ziteng Gao](https://sebgao.github.io/) ¹ [Joya Chen](https://chenjoya.github.io/) ¹ [Lei Liu](https://openreview.net/profile?id=~liulei2) ² [Zheng Zhang](https://scholar.google.com/citations?user=k0KiE4wAAAAJ&hl=en) ² [Mike Zheng Shou](https://sites.google.com/view/showlab) ¹ NeurIPS 2024 ¹ [Show Lab, National University of Singapore](https://sites.google.com/view/showlab/home?authuser=0) ² Amazon [![arXiv](https://img.shields.io/badge/arXiv-<2409.19603>-.svg)](https://arxiv.org/abs/2409.19603) Please find the code at: https://github.com/showlab/VideoLISA