Spaces:

KBaba7
/

Quantization-LLM

Running

KBaba7 commited on 19 days ago

Commit

c306a09

verified ·

1 Parent(s): 21e2278

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -51,13 +51,13 @@ def quantize_llama(model_path, quantized_output_path, quant_type):
     """
     st.write(f"⚡ Quantizing `{model_path}` with `{quant_type}` precision...")
     os.makedirs(os.path.dirname(quantized_output_path), exist_ok=True)
-    cmd = [
-        f"{model_dir_path}/build/bin/llama-quantize",
-        model_path,
-        quantized_output_path,
-        quant_type
-    ]
     process = subprocess.run(cmd, text=True, stdout=subprocess.PIPE, stderr=subprocess.PIPE)
     if process.returncode == 0:
         st.success(f"✅ Quantized model saved at `{quantized_output_path}`")
     else:

     """
     st.write(f"⚡ Quantizing `{model_path}` with `{quant_type}` precision...")
     os.makedirs(os.path.dirname(quantized_output_path), exist_ok=True)
+    uantize_path = f"{model_dir_path}/build/bin/llama-quantize"
+    subprocess.run(["chmod", "+x", quantize_path], check=True)
+    cmd = [quantize_path, input_file, output_file, quant_type]
     process = subprocess.run(cmd, text=True, stdout=subprocess.PIPE, stderr=subprocess.PIPE)
     if process.returncode == 0:
         st.success(f"✅ Quantized model saved at `{quantized_output_path}`")
     else: