steerapi
/

Llama-2-7b-chat-hf-onnx-awq

Text Generation

Inference Endpoints

Model card Files Files and versions Community

Llama-2-7b-chat-hf-onnx-awq / onnx

1 contributor

History: 2 commits

steerapi's picture

Upload folder using huggingface_hub

f236c3f over 1 year ago

q1
Upload folder using huggingface_hub over 1 year ago
decoder_model.onnx

5.44 MB
LFS

Upload folder using huggingface_hub over 1 year ago
decoder_model.onnx_data

27 GB
LFS

Upload folder using huggingface_hub over 1 year ago
decoder_model_merged.onnx

10.9 MB
LFS

Upload folder using huggingface_hub over 1 year ago
decoder_model_merged.onnx_data

27 GB
LFS

Upload folder using huggingface_hub over 1 year ago
decoder_model_merged_quantized.onnx

19 MB
LFS

Upload folder using huggingface_hub over 1 year ago
decoder_model_merged_quantized.onnx_data

6.74 GB
LFS

Upload folder using huggingface_hub over 1 year ago
decoder_with_past_model.onnx

5.47 MB
LFS

Upload folder using huggingface_hub over 1 year ago
decoder_with_past_model.onnx_data

27 GB
LFS

Upload folder using huggingface_hub over 1 year ago
quantize_config.json

991 Bytes

Upload folder using huggingface_hub over 1 year ago