4 284 43

Dazhi Jiang

thuzhizhi

jiangzizi

AI & ML interests

None yet

Recent Activity

liked a dataset 18 days ago

qi6776/Recflow

upvoted a paper about 1 month ago

Data-Efficient RLVR via Off-Policy Influence Guidance

liked a Space about 1 month ago

HuggingFaceTB/smol-training-playbook

View all activity

Organizations

None yet

liked a dataset 18 days ago

qi6776/Recflow

Updated Jul 11 • 66 • 1

upvoted a paper about 1 month ago

Data-Efficient RLVR via Off-Policy Influence Guidance

Paper • 2510.26491 • Published Oct 30 • 9

liked a Space about 1 month ago

The Smol Training Playbook

📚

2.53k

The secrets to building world-class LLMs

liked 2 models about 1 month ago

inclusionAI/LLaDA-MoE-7B-A1B-Instruct

7B • Updated Oct 28 • 3.69k • 60

inclusionAI/LLaDA2.0-mini-preview

Text Generation • 16B • Updated 11 days ago • 3.09k • 82

upvoted a collection about 1 month ago

LLaDA 2.0

Collection

4 items • Updated 11 days ago • 20

updated a Space 2 months ago

MorningMind NewsCards 🌱

🐳

Flip through news flashcards to stay informed

published a Space 2 months ago

MorningMind NewsCards 🌱

🐳

Flip through news flashcards to stay informed

liked a Space 2 months ago

DeepSite v3

🐳

16k

Generate any application by Vibe Coding

liked a model 3 months ago

SJTU-Deng-Lab/D2F_LLaDA_Instruct_8B_Lora

Text Generation • Updated Aug 14 • 5

liked a Space 3 months ago

Qwen Image Edit

✒

768

Edit images based on user instructions

New activity in GSAI-ML/LLaDA-1.5 3 months ago

期待demo

#1 opened 6 months ago by

zzzgry

liked 2 models 4 months ago

deepseek-ai/DeepSeek-V3.1

Text Generation • 685B • Updated Sep 5 • 78.7k • • 807

deepseek-ai/DeepSeek-V3.1-Base

Text Generation • 685B • Updated Aug 26 • 7.71k • 1k

authored a paper 4 months ago

GLM-4.5: Agentic, Reasoning, and Coding (ARC) Foundation Models

Paper • 2508.06471 • Published Aug 8 • 192

liked a model 4 months ago

zai-org/GLM-4.5V

Image-Text-to-Text • 108B • Updated Oct 25 • 48.5k • • 694

upvoted a paper 4 months ago

GLM-4.5: Agentic, Reasoning, and Coding (ARC) Foundation Models

Paper • 2508.06471 • Published Aug 8 • 192

liked 2 models 4 months ago

Qwen/Qwen-Image

Text-to-Image • Updated Aug 18 • 302k • • 2.26k

zai-org/GLM-4.5

Text Generation • 358B • Updated Aug 11 • 22.2k • • 1.39k

liked a model 5 months ago

Qwen/Qwen3-Coder-480B-A35B-Instruct

Text Generation • 480B • Updated Aug 21 • 196k • • 1.25k

Dazhi Jiang

AI & ML interests

Recent Activity

Organizations

thuzhizhi's activity

The Smol Training Playbook

MorningMind NewsCards 🌱

MorningMind NewsCards 🌱

DeepSite v3

Qwen Image Edit

期待demo