paper-conference | ZHANG HAO

MMR1: Enhancing Multimodal Reasoning with Variance-Aware Sampling and Open Resources

Large multimodal reasoning models have achieved rapid progress, but their advancement is constrained by two major limitations: the …

Sicong Leng, Jing Wang, Jiaxi Li, Hao Zhang, Zhiqiang Hu, Boqiang Zhang, Yuming Jiang, Hang Zhang, Xin Li, Lidong Bing, Deli Zhao, Wei Lu, Yu Rong, Aixin Sun, Shijian Lu

Video-KTR: Reinforcing Video Reasoning via Key Token Attribution

Reinforcement learning (RL) has shown strong potential for enhancing reasoning in multimodal large language models, yet existing video …

Ziyue Wang, Sheng Jin, Zhongrong Zuo, Jiawei Wu, Han Qiu, Qi She, Hao Zhang, Xudong Jiang

Hesitation and Tolerance in Recommender Systems

User interactions in recommender systems are inherently complex, often involving behaviors that go beyond simple acceptance or …

Kuan Zou, Aixin Sun, Xuemeng Jiang, Yitong Ji, Hao Zhang, Jing Wang, Ruijie Guo

GeoPQA: Bridging the Visual Perception Gap in MLLMs for Geometric Reasoning

Recent advancements in reinforcement learning (RL) have enhanced the reasoning abilities of large language models (LLMs), yet the …

Guizhen Chen, Weiwen Xu, Hao Zhang, Hou Pong Chan, Deli Zhao, Anh Tuan Luu, Yu Rong

GeoPQA: Bridging the Visual Perception Gap in MLLMs for Geometric Reasoning

ReasonMed: A 370K Multi-Agent Generated Dataset for Advancing Medical Reasoning

Reasoning-based large language models have excelled in mathematics and programming, yet their potential in knowledge-intensive medical …

Yu Sun, Xingyu Qian, Weiwen Xu, Hao Zhang, Chenghao Xiao, Long Li, Yu Rong, Wenbing Huang, Qifeng Bai, Tingyang Xu

Scaling Language-Centric Omnimodal Representation Learning

Recent multimodal embedding approaches leveraging multimodal large language models (MLLMs) fine-tuned with contrastive learning (CL) …

Chenghao Xiao, Hou Pong Chan, Hao Zhang, Weiwen Xu, Mahani Aljunied, Yu Rong

FineReason: Evaluating and Improving LLMs' Deliberate Reasoning through Reflective Puzzle Solving

Many challenging reasoning tasks require not just rapid, intuitive responses, but a more deliberate, multi-step approach. Recent …

Guizhen Chen, Weiwen Xu, Hao Zhang, Hou Pong Chan, Chaoqun Liu, Lidong Bing, Deli Zhao, Anh Tuan Luu, Yu Rong

Analyzing LLMs' Knowledge Boundary Cognition Across Languages Through the Lens of Internal Representations

While understanding the knowledge boundaries of LLMs is crucial to prevent hallucination, research on knowledge boundaries of LLMs has …

Chenghao Xiao, Hou Pong Chan, Hao Zhang, Mahani Aljunied, Lidong Bing, Noura Al Moubayed, Yu Rong

Analyzing LLMs' Knowledge Boundary Cognition Across Languages Through the Lens of Internal Representations

CoIR: A Comprehensive Benchmark for Code Information Retrieval Models

Despite the substantial success of Information Retrieval (IR) in various NLP tasks, most IR systems predominantly handle queries and …

Xiangyang Li, Kuicai Dong, Yi Quan Lee, Wei Xia, Yichun Yin, Hao Zhang, Yong Liu, Yasheng Wang, Ruiming Tang

CoIR: A Comprehensive Benchmark for Code Information Retrieval Models

Adaptive Tool Use in Large Language Models with Meta-Cognition Trigger

Large language models (LLMs) have shown remarkable emergent capabilities, transforming the execution of functional tasks by leveraging …

Wenjun Li, Dexun Li, Kuicai Dong, Cong Zhang, Hao Zhang, Weiwen Liu, Yasheng Wang, Ruiming Tang, Yong Liu

Adaptive Tool Use in Large Language Models with Meta-Cognition Trigger