Spaces:

diginoron
/

callcenter

Runtime error

diginoron commited on Aug 2

Commit

f0889c4

verified ·

1 Parent(s): 72b62e7

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -6,6 +6,7 @@ import os
 import spaces
 import soundfile as sf
 import numpy as np
 # تنظیم کلید API از متغیر محیطی
 client = OpenAI(api_key=os.getenv("OPENAI_API_KEY"))
@@ -22,7 +23,7 @@ def speech_to_text(audio_file):
         audio_data, sample_rate = sf.read(audio_file)
         # اطمینان از نرخ نمونه‌برداری 16kHz (استاندارد برای Whisper)
         if sample_rate != 16000:
-            audio_data = sf.resample(audio_data, sample_rate, 16000)
         # پردازش با Whisper بدون پارامتر sampling_rate
         result = whisper(audio_data)
         return result["text"]
@@ -60,7 +61,7 @@ def process_audio(audio_file, progress=gr.Progress()):
     return text, summary, table
 with gr.Blocks() as app:
-    gr.Markdown("## اپلیکیشن تبدیل صوت به متن و خلاصه‌سازی\n**توجه**: برای بهترین عملکرد، از فایل‌های صوتی کوتاه (کمتر از ۵ مگابایت، ۱۰-۲۰ ثانیه) با فرمت MP3، WAV یا M4A استفاده کنید. آپلود فایل‌های بزرگ ممکن است چند دقیقه طول بکشد.")
     audio_input = gr.Audio(type="filepath", label="فایل صوتی را آپلود کنید (MP3، WAV، M4A)")
     text_output = gr.Textbox(label="متن تبدیل‌شده")
     summary_output = gr.Textbox(label="خلاصه گزارش")

 import spaces
 import soundfile as sf
 import numpy as np
+import librosa
 # تنظیم کلید API از متغیر محیطی
 client = OpenAI(api_key=os.getenv("OPENAI_API_KEY"))
         audio_data, sample_rate = sf.read(audio_file)
         # اطمینان از نرخ نمونه‌برداری 16kHz (استاندارد برای Whisper)
         if sample_rate != 16000:
+            audio_data = librosa.resample(audio_data, orig_sr=sample_rate, target_sr=16000)
         # پردازش با Whisper بدون پارامتر sampling_rate
         result = whisper(audio_data)
         return result["text"]
     return text, summary, table
 with gr.Blocks() as app:
+    gr.Markdown("## اپلیکیشن تبدیل صوت به متن و خلاصه‌سازی\n**توجه**: برای بهترین عملکرد، از فایل‌های صوتی کوتاه (کمتر از ۵ مگابایت، ۱۰-۲۰ ثانیه) با فرمت MP3، WAV یا M4A استفاده کنید. آپلود فایل‌های بزرگ ممکن است چند دقیقه طول بکشد و باعث قطع ارتباط شود.")
     audio_input = gr.Audio(type="filepath", label="فایل صوتی را آپلود کنید (MP3، WAV، M4A)")
     text_output = gr.Textbox(label="متن تبدیل‌شده")
     summary_output = gr.Textbox(label="خلاصه گزارش")