Spaces:

healthtechbrasil
/

ProvaObjetiva

Runtime error

App Files Files Community

healthtechbrasil commited on Jun 11, 2025

Commit

4e991ba

1 Parent(s): fe0707a

app logs

Browse files

Files changed (1) hide show

app.py +38 -27

app.py CHANGED Viewed

@@ -35,7 +35,7 @@ except FileNotFoundError:
 # Função para carregar modelo e tokenizer
 def get_model():
     if not hasattr(get_model, "model_data"):
-        logger.info("Carregando modelo e tokenizer...")
         start_time = time.time()
         try:
             tokenizer = AutoTokenizer.from_pretrained(
@@ -43,41 +43,19 @@ def get_model():
                 legacy=False,
                 clean_up_tokenization_spaces=True
             )
-            logger.info(f"Tokenizer carregado em {time.time() - start_time:.2f} segundos.")
             model = T5ForConditionalGeneration.from_pretrained(
                 "unicamp-dl/ptt5-small-portuguese-vocab"
             )
-            logger.info(f"Modelo carregado em {time.time() - start_time:.2f} segundos.")
             get_model.model_data = {"tokenizer": tokenizer, "model": model}
         except Exception as e:
             logger.error(f"Erro ao carregar modelo ou tokenizer: {e}")
             get_model.model_data = None
     return get_model.model_data
-# Função para gerar e exibir simulado
-def generate_simulado():
-    simulado = []
-    for i in range(5):
-        example = examples[i % len(examples)] if examples else None
-        question_data = generate_question_from_prompt("clinica medica", "medio", example)
-        simulado.append(question_data)
-        logger.info(f"Questão {i + 1}: {question_data['question']}")
-        for opt in question_data['options']:
-            logger.info(f"  {opt}")
-        logger.info(f"  Gabarito: {question_data['answer']}")
-        logger.info(f"  Explicação: {question_data['explanation']}")
-    return {"simulado": simulado}
-# Força carregamento inicial
-logger.info("Testando carregamento inicial do modelo...")
-start_time = time.time()
-model_data = get_model()
-if model_data:
-    logger.info(f"Modelo e tokenizer inicializados em {time.time() - start_time:.2f} segundos.")
-    generate_simulado()
-else:
-    logger.error("Falha na inicialização do modelo.")
 def parse_model_output(response):
     pattern = r"Enunciado clínico: (.*?)\s*Alternativas: (.*?)\s*Gabarito: (.*?)\s*Explicação: (.*)"
     match = re.match(pattern, response, re.DOTALL)
@@ -97,11 +75,14 @@ def parse_model_output(response):
 def generate_question_from_prompt(theme, difficulty, example_question=None):
     model_data = get_model()
     if not model_data or not model_data["tokenizer"] or not model_data["model"]:
         return {"question": "Erro: Modelo ou tokenizer não carregado.", "options": [], "answer": "", "explanation": "Por favor, verifique os logs."}
     tokenizer = model_data["tokenizer"]
     model = model_data["model"]
     if example_question:
         example_text = (
@@ -126,12 +107,42 @@ def generate_question_from_prompt(theme, difficulty, example_question=None):
         outputs = model.generate(**inputs, max_new_tokens=256, temperature=0.7, top_p=0.9)
         response = tokenizer.decode(outputs[0], skip_special_tokens=True)
         result = parse_model_output(response)
         gc.collect()
         return result
     except Exception as e:
         gc.collect()
         return {"question": f"Erro na geração: {e}", "options": [], "answer": "", "explanation": "Tente novamente."}
 @app.get("/generate")
 async def generate_question(theme: str, difficulty: str):
     valid_difficulties = ["fácil", "médio", "difícil"]

 # Função para carregar modelo e tokenizer
 def get_model():
     if not hasattr(get_model, "model_data"):
+        logger.info("Iniciando carregamento de modelo e tokenizer...")
         start_time = time.time()
         try:
             tokenizer = AutoTokenizer.from_pretrained(
                 legacy=False,
                 clean_up_tokenization_spaces=True
             )
+            logger.info(f"Tokenizer baixado e carregado em {time.time() - start_time:.2f} segundos.")
             model = T5ForConditionalGeneration.from_pretrained(
                 "unicamp-dl/ptt5-small-portuguese-vocab"
             )
+            logger.info(f"Modelo baixado e carregado em {time.time() - start_time:.2f} segundos.")
             get_model.model_data = {"tokenizer": tokenizer, "model": model}
+            logger.info("Modelo e tokenizer armazenados com sucesso em model_data.")
         except Exception as e:
             logger.error(f"Erro ao carregar modelo ou tokenizer: {e}")
             get_model.model_data = None
+    logger.debug(f"Retornando model_data: {get_model.model_data is not None}")
     return get_model.model_data
 def parse_model_output(response):
     pattern = r"Enunciado clínico: (.*?)\s*Alternativas: (.*?)\s*Gabarito: (.*?)\s*Explicação: (.*)"
     match = re.match(pattern, response, re.DOTALL)
 def generate_question_from_prompt(theme, difficulty, example_question=None):
     model_data = get_model()
+    logger.debug(f"Verificando model_data: {model_data is not None}")
     if not model_data or not model_data["tokenizer"] or not model_data["model"]:
+        logger.error("Modelo ou tokenizer não disponível.")
         return {"question": "Erro: Modelo ou tokenizer não carregado.", "options": [], "answer": "", "explanation": "Por favor, verifique os logs."}
     tokenizer = model_data["tokenizer"]
     model = model_data["model"]
+    logger.info(f"Gerando questão com tema: {theme}, dificuldade: {difficulty}")
     if example_question:
         example_text = (
         outputs = model.generate(**inputs, max_new_tokens=256, temperature=0.7, top_p=0.9)
         response = tokenizer.decode(outputs[0], skip_special_tokens=True)
         result = parse_model_output(response)
+        logger.debug(f"Questão gerada com sucesso: {result}")
         gc.collect()
         return result
     except Exception as e:
+        logger.error(f"Erro na geração da questão: {e}")
         gc.collect()
         return {"question": f"Erro na geração: {e}", "options": [], "answer": "", "explanation": "Tente novamente."}
+# Função para gerar e exibir simulado
+def generate_simulado():
+    logger.info("Iniciando geração de simulado...")
+    simulado = []
+    for i in range(5):
+        example = examples[i % len(examples)] if examples else None
+        logger.debug(f"Processando questão {i + 1} com exemplo: {example is not None}")
+        question_data = generate_question_from_prompt("clinica medica", "medio", example)
+        simulado.append(question_data)
+        logger.info(f"Questão {i + 1}: {question_data['question']}")
+        for opt in question_data['options']:
+            logger.info(f"  {opt}")
+        logger.info(f"  Gabarito: {question_data['answer']}")
+        logger.info(f"  Explicação: {question_data['explanation']}")
+    logger.info("Geração de simulado concluída.")
+    return {"simulado": simulado}
+# Força carregamento inicial
+logger.info("Testando carregamento inicial do modelo...")
+start_time = time.time()
+model_data = get_model()
+if model_data:
+    logger.info(f"Modelo e tokenizer inicializados em {time.time() - start_time:.2f} segundos.")
+    time.sleep(1)  # Adiciona delay de 1 segundo para garantir estabilidade
+    generate_simulado()
+else:
+    logger.error("Falha na inicialização do modelo.")
 @app.get("/generate")
 async def generate_question(theme: str, difficulty: str):
     valid_difficulties = ["fácil", "médio", "difícil"]