Spaces:

ZennyKenny
/

note-to-text

Running on Zero

ZennyKenny commited on 7 days ago

Commit

3fa52bd

verified ·

1 Parent(s): fd11c5a

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -2,13 +2,12 @@ import gradio as gr
 from transformers import TrOCRProcessor, VisionEncoderDecoderModel
 from PIL import Image
 import torch
-import spaces
 # Load TrOCR model
 processor = TrOCRProcessor.from_pretrained("microsoft/trocr-large-handwritten")
 model = VisionEncoderDecoderModel.from_pretrained("microsoft/trocr-large-handwritten")
-@spaces.GPU
 def recognize_text(image):
     try:
         # Convert image to RGB if it's not already
@@ -19,6 +18,11 @@ def recognize_text(image):
         pixel_values = processor(images=image, return_tensors="pt").pixel_values
         print("Image preprocessed. Pixel values shape:", pixel_values.shape)
         # Generate text from the image
         with torch.no_grad():  # Disable gradient calculation for inference
             generated_ids = model.generate(pixel_values)

 from transformers import TrOCRProcessor, VisionEncoderDecoderModel
 from PIL import Image
 import torch
+import matplotlib.pyplot as plt
 # Load TrOCR model
 processor = TrOCRProcessor.from_pretrained("microsoft/trocr-large-handwritten")
 model = VisionEncoderDecoderModel.from_pretrained("microsoft/trocr-large-handwritten")
 def recognize_text(image):
     try:
         # Convert image to RGB if it's not already
         pixel_values = processor(images=image, return_tensors="pt").pixel_values
         print("Image preprocessed. Pixel values shape:", pixel_values.shape)
+        # Visualize preprocessed image
+        plt.imshow(pixel_values.squeeze().permute(1, 2, 0))
+        plt.title("Preprocessed Image")
+        plt.show()
         # Generate text from the image
         with torch.no_grad():  # Disable gradient calculation for inference
             generated_ids = model.generate(pixel_values)