30 4

Zeyu Zhang

SteveZeyuZhang

https://steve-zeyu-zhang.github.io/

steve-zeyu-zhang

AI & ML interests

Geometric Learning, Generative AI, Computer Vision, Robotics, AI for Health

Recent Activity

submitted a paper about 13 hours ago

MMA: Multimodal Memory Agent

authored a paper 1 day ago

MoRL: Reinforced Reasoning for Unified Motion Understanding and Generation

authored a paper 1 day ago

Light4D: Training-Free Extreme Viewpoint 4D Video Relighting

View all activity

Organizations

submitted a paper to Daily Papers about 13 hours ago

MMA: Multimodal Memory Agent

Paper • 2602.16493 • Published 1 day ago • 4

authored 12 papers 1 day ago

GeneralVLA: Generalizable Vision-Language-Action Models with Knowledge-Guided Trajectory Planning

Paper • 2602.04315 • Published 15 days ago • 1

V-Retrver: Evidence-Driven Agentic Reasoning for Universal Multimodal Retrieval

Paper • 2602.06034 • Published 14 days ago • 8

SafeMo: Linguistically Grounded Unlearning for Trustworthy Text-to-Motion Generation

Paper • 2601.00590 • Published Jan 2

WebCryptoAgent: Agentic Crypto Trading with Web Informatics

Paper • 2601.04687 • Published Jan 8

MMCLIP: Cross-modal Attention Masked Modelling for Medical Language-Image Pre-Training

Paper • 2407.19546 • Published Jul 28, 2024

ManipLVM-R1: Reinforcement Learning for Reasoning in Embodied Manipulation with Large Vision-Language Models

Paper • 2505.16517 • Published May 22, 2025

DragMesh: Interactive 3D Generation Made Easy

Paper • 2512.06424 • Published Dec 6, 2025 • 1

VaseVQA-3D: Benchmarking 3D VLMs on Ancient Greek Pottery

Paper • 2510.04479 • Published Oct 6, 2025

Audio Jailbreak: An Open Comprehensive Benchmark for Jailbreaking Large Audio-Language Models

Paper • 2505.15406 • Published May 21, 2025 • 5

submitted a paper to Daily Papers 2 days ago

MoRL: Reinforced Reasoning for Unified Motion Understanding and Generation

Paper • 2602.14534 • Published 3 days ago • 2

submitted 3 papers to Daily Papers 4 days ago

Light4D: Training-Free Extreme Viewpoint 4D Video Relighting

Paper • 2602.11769 • Published 7 days ago • 2

Code2Worlds: Empowering Coding LLMs for 4D World Generation

Paper • 2602.11757 • Published 7 days ago • 3

GeneralVLA: Generalizable Vision-Language-Action Models with Knowledge-Guided Trajectory Planning

Paper • 2602.04315 • Published 15 days ago • 1

published a dataset 4 days ago

AIGeeksGroup/MoBench

Updated 4 days ago • 8

published a dataset 5 days ago

AIGeeksGroup/Code4D

Viewer • Updated 3 days ago • 22 • 77 • 2

upvoted a paper 14 days ago