Mixtral HQQ Quantized Models - a mobiuslabsgmbh Collection

mobiuslabsgmbh 's Collections

DeepSeek-R1-ReDistill

Aana

Llama2 HQQ Quantized Models

Mixtral HQQ Quantized Models

ViT HQQ Quantized Models

Mixtral HQQ Quantized Models

updated Mar 29, 2024

4-bit and 2-bit Mixtral models quantized using https://github.com/mobiusml/hqq

mobiuslabsgmbh/Mixtral-8x7B-Instruct-v0.1-hf-4bit_g64-HQQ

Text Generation • Updated 2 days ago • 19 • 9
mobiuslabsgmbh/Mixtral-8x7B-Instruct-v0.1-hf-2bit_g16_s128-HQQ

Text Generation • Updated 2 days ago • 17 • 9
mobiuslabsgmbh/Mixtral-8x7B-v0.1-hf-2bit_g16_s128-HQQ

Text Generation • Updated 2 days ago • 33 • 4
mobiuslabsgmbh/Mixtral-8x7B-v0.1-hf-4bit_g64-HQQ

Text Generation • Updated 2 days ago • 14 • 1
mobiuslabsgmbh/Mixtral-8x7B-Instruct-v0.1-hf-attn-4bit-moe-2bit-HQQ

Text Generation • Updated 2 days ago • 25 • 38

Note If you are considering 2-bit instruct model use this one.
mobiuslabsgmbh/Mixtral-8x7B-v0.1-hf-attn-4bit-moe-2bit-HQQ

Text Generation • Updated 2 days ago • 24 • 6

Note If you are considering 2-bit base model use this one.
mobiuslabsgmbh/Mixtral-8x7B-Instruct-v0.1-hf-attn-4bit-moe-2bit-metaoffload-HQQ

Text Generation • Updated 2 days ago • 35 • 15

Note If you are considering 2-bit base model but is GPU pure this is a good option. Requires 13GB of RAM, but it will be slower.
mobiuslabsgmbh/Mixtral-8x7B-Instruct-v0.1-hf-attn-4bit-moe-3bit-metaoffload-HQQ

Text Generation • Updated 2 days ago • 21 • 13
mobiuslabsgmbh/Mixtral-8x7B-Instruct-v0.1-hf-attn-4bit-moe-2bitgs8-metaoffload-HQQ

Text Generation • Updated 2 days ago • 38 • 20