Edit Models filters

Model Tree

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

47,090

Base only

Active filters: 4-bit

josefprusa/ThinkingCap-Qwen3.6-27B-int4-AutoRound-v1

Text Generation • 6B • Updated 7 days ago • 4.5k • 44

antirez/deepseek-v4-gguf

Text Generation • 284B • Updated May 31 • 4.91M • 321

Nguuma/security-slm-unsloth-1.5b

Text Generation • 2B • Updated May 7 • 1.94k • 44

mlx-community/Qwen3.6-27B-OptiQ-4bit

Text Generation • 27B • Updated 3 days ago • 13.4k • 67

AEON-7/Ornith-1.0-35B-AEON-Ultimate-Uncensored-NVFP4

Text Generation • 21B • Updated 15 days ago • 41k • 52

Jundot/Qwen3.6-27B-oQ4e-mtp

5B • Updated 5 days ago • 1.83k • 9

avlp12/Hy3-Alis-MLX-Dynamic

Text Generation • 295B • Updated 6 days ago • 2.15k • 8

Jundot/Qwen3.6-35B-A3B-oQ4e-mtp

6B • Updated 5 days ago • 1.39k • 8

Jiunsong/supergemma4-26b-uncensored-mlx-4bit-v2

Text Generation • 25B • Updated Apr 12 • 18.1k • 275

mlx-community/gemma-4-12b-coder-fable5-composer2.5-4bit

Text Generation • 12B • Updated 22 days ago • 8.8k • 21

mlx-community/Qwen3.5-9B-OptiQ-4bit

Text Generation • 9B • Updated 3 days ago • 11.8k • 79

mlx-community/Qwen3.6-35B-A3B-4bit

Image-Text-to-Text • 6B • Updated Apr 16 • 64k • 86

cloudyu/gpt-oss-120b-Fable-5-Distilled

117B • Updated 17 days ago • 11.9k • 36

mlx-community/Qwen3.6-27B-4bit

Image-Text-to-Text • 5B • Updated Apr 22 • 34.4k • 47

mlx-community/Qwen3.6-35B-A3B-OptiQ-4bit

Text Generation • 35B • Updated 3 days ago • 15.5k • 48

huihui-ai/Huihui-DeepSeek-V4-Flash-abliterated-ds4-GGUF

284B • Updated Jun 6 • 616k • 96

avlp12/GLM-5.2-Alis-MLX-Dynamic-3.5bpw

Text Generation • 753B • Updated about 14 hours ago • 9.71k • 6

Jundot/Ornith-1.0-35B-oQ4e

6B • Updated 12 days ago • 730 • 4

mlx-community/Qwen3.5-9B-Fable-5-v1-oQ4

2B • Updated 10 days ago • 572 • 4

Jiunsong/SuperHY3-abliterated-MLX-4bit

Text Generation • 48B • Updated about 17 hours ago • 12 • 4

mlx-community/gpt-oss-20b-MXFP4-Q8

Text Generation • 21B • Updated Mar 19 • 367k • 72

mlx-community/Qwen3.5-9B-MLX-4bit

Image-Text-to-Text • 2B • Updated Mar 23 • 21k • 144

Jiunsong/supergemma4-26b-abliterated-multimodal-mlx-4bit

Image-Text-to-Text • 5B • Updated Apr 18 • 3.69k • 67

cyankiwi/Qwen3.6-35B-A3B-AWQ-4bit

Image-Text-to-Text • 36B • Updated 10 days ago • 2M • 85

AEON-7/Qwen3.6-35B-A3B-heretic-NVFP4

Image-Text-to-Text • 21B • Updated 16 days ago • 210k • 60

mlx-community/gemma-4-26B-A4B-it-OptiQ-4bit

Text Generation • 25B • Updated 3 days ago • 13.5k • 14

froggeric/Qwen3.6-35B-A3B-Uncensored-Heretic-MLX-4bit

Image-Text-to-Text • 6B • Updated May 6 • 8.63k • 24

AlicanKiraz0/Titus-CybersecurityLLM-v1.0-mlx-4Bit

Text Generation • 35B • Updated May 27 • 960 • 42

mlx-community/diffusiongemma-26B-A4B-it-OptiQ-4bit

Image-Text-to-Text • 25B • Updated about 19 hours ago • 5.65k • 15

mlx-community/gemma-4-12B-it-qat-OptiQ-4bit

Text Generation • 12B • Updated 3 days ago • 7.84k • 8