Buildwellai
/

BuildwellAI-CoT-Reasoning

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Buildwellai commited on 9 days ago

Commit

9f067b2

·

verified ·

1 Parent(s): 3b46e02

Update handler.py

Files changed (1) hide show

handler.py +2 -1

handler.py CHANGED Viewed

@@ -2,7 +2,7 @@ import os
 from typing import Dict, List, Any
 from transformers import AutoTokenizer, AutoModelForCausalLM, AutoConfig
 import torch
-from peft import PeftModel
 from dotenv import load_dotenv
 load_dotenv()
@@ -12,6 +12,7 @@ class EndpointHandler:
         """
         Initializes the model and tokenizer.
         """
         max_seq_length = int(os.getenv("MAX_SEQ_LENGTH", 2048))
         max_new_tokens = int(os.getenv("MAX_NEW_TOKENS", 512))
         self.hf_token = os.getenv("HUGGINGFACE_TOKEN")

 from typing import Dict, List, Any
 from transformers import AutoTokenizer, AutoModelForCausalLM, AutoConfig
 import torch
+from peft import PeftModel  # Import PeftModel
 from dotenv import load_dotenv
 load_dotenv()
         """
         Initializes the model and tokenizer.
         """
+        # Key settings (from environment variables, with defaults)
         max_seq_length = int(os.getenv("MAX_SEQ_LENGTH", 2048))
         max_new_tokens = int(os.getenv("MAX_NEW_TOKENS", 512))
         self.hf_token = os.getenv("HUGGINGFACE_TOKEN")