Alvin Lau

AlpsCracker

AlpsCracker

AI & ML interests

None yet

Recent Activity

upvoted a paper about 21 hours ago

MemDreamer: Decoupling Perception and Reasoning for Long Video Understanding via Hierarchical Graph Memory and Agentic Retrieval Mechanism

upvoted a paper about 22 hours ago

WorldOlympiad: Can Your World Model Survive a Triathlon?

upvoted a paper 8 days ago

Where to Look: Can Foundation Models Reach a Target Viewpoint Through Active Exploration?

View all activity

Organizations

None yet

upvoted a paper about 21 hours ago

MemDreamer: Decoupling Perception and Reasoning for Long Video Understanding via Hierarchical Graph Memory and Agentic Retrieval Mechanism

Paper • 2606.07512 • Published 6 days ago • 35

upvoted a paper about 22 hours ago

WorldOlympiad: Can Your World Model Survive a Triathlon?

Paper • 2606.11129 • Published 2 days ago • 29

upvoted a paper 8 days ago

Where to Look: Can Foundation Models Reach a Target Viewpoint Through Active Exploration?

Paper • 2606.01247 • Published 11 days ago • 30

upvoted a paper 19 days ago

OmniJigsaw: Enhancing Omni-Modal Reasoning via Modality-Orchestrated Reordering

Paper • 2604.08209 • Published Apr 9 • 26

upvoted 2 papers about 1 month ago

MARBLE: Multi-Aspect Reward Balance for Diffusion RL

Paper • 2605.06507 • Published May 7 • 40

World-R1: Reinforcing 3D Constraints for Text-to-Video Generation

Paper • 2604.24764 • Published Apr 27 • 118

upvoted a collection about 2 months ago

DeepSeek-V4

Collection

4 items • Updated Apr 24 • 676

upvoted a paper 2 months ago

TriAttention: Efficient Long Reasoning with Trigonometric KV Compression

Paper • 2604.04921 • Published Apr 6 • 114

upvoted a paper 5 months ago

Beyond Hard Masks: Progressive Token Evolution for Diffusion Language Models

Paper • 2601.07351 • Published Jan 12 • 26

liked a model 5 months ago

facebook/sam-3d-objects

Updated 9 days ago • 2.2k • 404

upvoted a paper 8 months ago

Less is More: Recursive Reasoning with Tiny Networks

Paper • 2510.04871 • Published Oct 6, 2025 • 516

upvoted 2 papers 9 months ago

Video models are zero-shot learners and reasoners

Paper • 2509.20328 • Published Sep 24, 2025 • 101

OmniWorld: A Multi-Domain and Multi-Modal Dataset for 4D World Modeling

Paper • 2509.12201 • Published Sep 15, 2025 • 107

upvoted a paper 10 months ago

ODYSSEY: Open-World Quadrupeds Exploration and Manipulation for Long-Horizon Tasks

Paper • 2508.08240 • Published Aug 11, 2025 • 45

upvoted 3 papers 11 months ago

liked a dataset 11 months ago

RoboVerseOrg/roboverse_data

Updated 3 days ago • 58.1k • 23

liked a Space 11 months ago

EmbodiedGen Text To 3D

📝

Create 3D models from text descriptions

upvoted a paper about 1 year ago

Molmo and PixMo: Open Weights and Open Data for State-of-the-Art Multimodal Models

Paper • 2409.17146 • Published Sep 25, 2024 • 123

Alvin Lau

AI & ML interests

Recent Activity

Organizations

AlpsCracker's activity

EmbodiedGen Text To 3D