Sumail
/

Llama-3.1-8B-Instruct-125m-4bit

Text Generation

Inference Endpoints

4-bit precision

Model card Files Files and versions Community

Llama-3.1-8B-Instruct-125m-4bit

1 contributor

History: 3 commits

Sumail's picture

Upload tokenizer

0f59fac verified 3 months ago

.gitattributes

1.57 kB

Upload tokenizer 3 months ago
README.md

5.17 kB

Upload tokenizer 3 months ago
config.json

1.38 kB

AutoGPTQ model for NousResearch/Meta-Llama-3.1-8B-Instruct: 4bits, gr128, desc_act=False 3 months ago
gptq_model-4bit-128g.safetensors

5.74 GB
LFS

AutoGPTQ model for NousResearch/Meta-Llama-3.1-8B-Instruct: 4bits, gr128, desc_act=False 3 months ago
quantize_config.json

349 Bytes

AutoGPTQ model for NousResearch/Meta-Llama-3.1-8B-Instruct: 4bits, gr128, desc_act=False 3 months ago
special_tokens_map.json

296 Bytes

Upload tokenizer 3 months ago
tokenizer.json

17.2 MB
LFS

Upload tokenizer 3 months ago
tokenizer_config.json

50.9 kB

Upload tokenizer 3 months ago