Nov 21, 2024

Research Works

Title: Loong: Generating Minute-level Long Videos with Autoregressive Language Models

Presenter: WANG Yuqing

Presentation Date: November 21, 2024 (Thursday)

Research Areas: Computer vision, video generation

Title: Visual Instruction Tuning

Presenter: ZHU Chenming

Presentation Date: November 21, 2024 (Thursday)

Research Areas: Computer vision, multi-modal LLM

Title: LLaVA-OneVision: Easy Visual Task Transfer

Presenter: ZHU Chenming

Presentation Date: November 21, 2024 (Thursday)

Research Areas: Computer vision, multi-modal LLM

Title: LLaVA-3D: A Simple yet Effective Pathway to Empowering LMMs with 3D-awareness

Presenter: ZHU Chenming

Presentation Date: November 21, 2024 (Thursday)

Research Areas: Computer vision, multi-modal LLM