new

Get trending papers in your email inbox once a day!

Get trending papers in your email inbox!

Daily Papers

byAK and the research community

May 22

Submitted by

Cardlnal

DelTA: Discriminative Token Credit Assignment for Reinforcement Learning from Verifiable Rewards

·
3 authors

Submitted by

xiaochonglinghu

TransitLM: A Large-Scale Dataset and Benchmark for Map-Free Transit Route Generation

GD-ML

Submitted by

Ukpkmkkk

Perception or Prejudice: Can MLLMs Go Beyond First Impressions of Personality?

utokyo-ai

The University of Tokyo

Submitted by

zzzhr97

π-Bench: Evaluating Proactive Personal Assistant Agents in Long-Horizon Workflows

Simplified-Reasoning

Simplified Reasoning

Submitted by

zykRichard

Full Attention Strikes Back: Transferring Full Attention into Sparse within Hundred Training Steps

RTP-LLM

1

Submitted by

groundhogLLM

ACC: Compiling Agent Trajectories for Long-Context Training

ustc-community

University of Science and Technology of China

1

Submitted by

Ziqi

PhysX-Omni: Unified Simulation-Ready Physical 3D Generation for Rigid, Deformable, and Articulated Objects

·
8 authors

Submitted by

zbhpku

LatentOmni: Rethinking Omni-Modal Understanding via Unified Audio-Visual Latent Reasoning

KlingTeam

Submitted by

Nova2001

SEGA: Spectral-Energy Guided Attention for Resolution Extrapolation in Diffusion Transformers

uoft-cs

University of Toronto Computer Science

2

Submitted by

SeanWu25

Forecasting Scientific Progress with Artificial Intelligence

Oxford

University of Oxford

Submitted by

YJ-142150

WorldKV: Efficient World Memory with World Retrieval and Compression

kaist-ai

Submitted by

taesiri

Spreadsheet-RL: Advancing Large Language Model Agents on Realistic Spreadsheet Tasks via Reinforcement Learning

UIUC-CS

University of Illinois at Urbana-Champaign

Submitted by

Zuica96

SpaceDG: Benchmarking Spatial Intelligence under Visual Degradation

Visionary-Laboratoary

Visionary-Laboratoary

Submitted by

jiahaoplus

Sensor2Sensor: Cross-Embodiment Sensor Conversion for Autonomous Driving

google

Submitted by

jhpark96

FlowLong: Inference-time Long Video Generation via Manifold-constrained Tweedie Matching

kaist-ai

Submitted by

sibasmarakp

Unsupervised Process Reward Models

·
5 authors

2

Submitted by

taesiri

Gated DeltaNet-2: Decoupling Erase and Write in Linear Attention

nvidia

Submitted by

ttu1818

Q-ARVD: Quantizing Autoregressive Video Diffusion Models

NationalUniversityofSingapore

National University of Singapore

Submitted by

Jinyang23

Maestro: Reinforcement Learning to Orchestrate Hierarchical Model-Skill Ensembles

·
10 authors

Submitted by

Johnson0213

AutoRubric-T2I: Robust Rule-Based Reward Model for Text-to-Image Alignment

lmarena-ai

Submitted by

Bturtel

Training Large Language Models to Predict Clinical Events

LightningRodLabs

Lightning Rod Labs

Submitted by

Ephemeral182

GenEvolve: Self-Evolving Image Generation Agents via Tool-Orchestrated Visual Experience Distillation

Submitted by

arkilpatel

Forecasting Downstream Performance of LLMs With Proxy Metrics

McGill-NLP

McGill NLP Group

Submitted by

CapitalLiu

KVServe: Service-Aware KV Cache Compression for Communication-Efficient Disaggregated LLM Serving

ict-cas

Institute of Computing Technology, Chinese Academy of Sciences

Submitted by

Chtholly17

ClinSeekAgent: Automating Multimodal Evidence Seeking for Agentic Clinical Reasoning

UCSC-VLAA

Submitted by

Master-Shi

One Sentence, One Drama: Personalized Short-Form Drama Generation via Multi-Agent Systems

NanyangTechnologicalUniversity

Nanyang Technological University

Submitted by

dahyekim

Swift Sampling: Selecting Temporal Surprises via Taylor Series

BostonU

Boston University

1

Submitted by

mingkaid

Efficient Agentic Reasoning Through Self-Regulated Simulative Planning

sailing-lab

SAILING Lab (CMU & MBZUAI)

Submitted by

taesiri

Bernini: Latent Semantic Planning for Video Diffusion

ByteDance

Submitted by

jhcho99

SceneAligner: 3D-Grounded Floorplan Localization in the Wild

cornell

Cornell University

Submitted by

beomjin-ahn

LoREnc: Low-Rank Encryption for Securing Foundation Models and LoRA Adapters

SamsungResearch

Samsung Research

2

Submitted by

VoyageWang

Segment Anything with Motion, Geometry, and Semantic Adaptation for Complex Nonlinear Visual Object Tracking

Tsinghua University

Submitted by

taesiri

TerminalWorld: Benchmarking Agents on Real-World Terminal Tasks

EuniAI

Submitted by

jusjinuk

Rule2DRC: Benchmarking LLM Agents for DRC Script Synthesis with Execution-Guided Test Generation

SeoulNatlUniv

Seoul National University

Submitted by

dora2023

Diversed Model Discovery via Structured Table Discovery

UWaterloo

University of Waterloo

Submitted by

VictorYeste

More Context, Larger Models, or Moral Knowledge? A Systematic Study of Schwartz Value Detection in Political Texts

·
2 authors

Submitted by

EunsuKim

"I didn't Make the Micro Decisions": Measuring, Inducing, and Exposing Goal-Level AI Contributions in Collaboration

·
4 authors

Submitted by

xxayt

OmniPro: A Comprehensive Benchmark for Omni-Proactive Streaming Video Understanding

·
7 authors

Submitted by

ZacharyNovack

Live Music Diffusion Models: Efficient Fine-Tuning and Post-Training of Interactive Diffusion Music Generators

·
11 authors

Submitted by

Breezelled

AnyMo: Geometry-Aware Setup-Agnostic Modeling of Human Motion in the Wild

CRUISEResearchGroup

CRUISE Research Group (UNSW)

Submitted by

taesiri

From Reasoning Chains to Verifiable Subproblems: Curriculum Reinforcement Learning Enables Credit Assignment for LLM Reasoning

·
6 authors

Submitted by

Songweii

DecQ: Detail-Condensing Queries for Enhanced Reconstruction and Generation in Representation Autoencoders

·
6 authors

Submitted by

nandan523

Same Architecture, Different Capacity: Optimizer-Induced Spectral Scaling Laws

New York University

Submitted by

pablomm

Platonic Representations in the Human Brain: Unsupervised Recovery of Universal Geometry

UniversitatDeBarcelona

Universitat de Barcelona

Submitted by

wuyangchen

Lean Refactor: Multi-Objective Controllable Proof Optimization via Agentic Strategy Search

·
7 authors

1

Submitted by

luoxue-star

SAM 3D Animal: Promptable Animal 3D Reconstruction from Images in the Wild

·
7 authors

Submitted by

wdika

Disentangling Sampling from Training Budget in Class-Imbalanced CT Body Composition Segmentation

·
3 authors

Submitted by

HaokunWen

FashionLens: Toward Versatile Fashion Image Retrieval via Task-Adaptive Learning

·
6 authors

1

Submitted by

pastifra

Minimalist Visual Inertial Odometry

columbia

Columbia University