Spaces:

krislette
/

bach-or-bot

Running

App Files Files Community

bach-or-bot / app /server.py

krislette

Auto-deploy from GitHub: bb659763110ffbe4c2a85e186bebb84edb7010de

0534c29 about 2 months ago

raw

history blame contribute delete

11.5 kB

	# Fast API imports
	from fastapi import Depends, FastAPI, HTTPException
	from fastapi.middleware.cors import CORSMiddleware

	# Utils/schemas imports
	from app.schemas import (
	ModelInfoResponse,
	PredictionResponse,
	PredictionXAIResponse,
	AudioOnlyPredictionResponse,
	AudioOnlyPredictionXAIResponse,
	WelcomeResponse,
	CombinedExplanationResponse,
	CombinedPredictionResponse,
	)
	from app.utils import load_server_config, load_model_config
	from app.validators import validate_lyrics, validate_audio_source, validate_audio_only

	# Model/XAI-related imports
	from scripts.explain import musiclime_multimodal, musiclime_unimodal, musiclime_combined
	from scripts.predict import predict_multimodal, predict_unimodal, predict_combined

	# Other imports
	import io
	import librosa
	from typing import Tuple

	# Load configs at startup
	server_config = load_server_config()
	model_config = load_model_config()

	# Extract configuration values
	MAX_FILE_SIZE = server_config["file_upload"]["max_file_size_mb"] * 1024 * 1024
	MAX_LYRICS_LENGTH = server_config["file_upload"]["max_lyrics_length"]
	ALLOWED_AUDIO_TYPES = server_config["file_upload"]["allowed_audio_types"]

	# Initialize fast API app with extracted config values
	app = FastAPI(
	title=server_config["server"]["title"], version=server_config["server"]["version"]
	)

	# Initialize CORS with config values
	cors_config = server_config["api"]["cors"]
	app.add_middleware(
	CORSMiddleware,
	allow_origins=cors_config["allow_origins"],
	allow_credentials=cors_config["allow_credentials"],
	allow_methods=cors_config["allow_methods"],
	allow_headers=cors_config["allow_headers"],
	)


	@app.get("/", response_model=WelcomeResponse, tags=["Root"])
	def root():
	"""Root endpoint to check if the API is running."""
	return WelcomeResponse(
	status="success",
	message="Welcome to Bach or Bot API!",
	endpoints={
	"/": "This welcome message",
	"/docs": "FastAPI auto-generated API docs",
	"/api/v1/model/info": "Model information and capabilities",
	"/api/v1/predict": "POST endpoint for bach-or-bot prediction (legacy)",
	"/api/v1/explain": "POST endpoint for prediction with explainability (legacy)",
	"/api/v1/predict/multimodal": "POST endpoint for multimodal prediction",
	"/api/v1/explain/multimodal": "POST endpoint for multimodal explainability",
	"/api/v1/predict/audio": "POST endpoint for audio-only prediction",
	"/api/v1/explain/audio": "POST endpoint for audio-only explainability",
	"/api/v1/predict/combined": "POST endpoint for BOTH predictions",
	"/api/v1/explain/combined": "POST endpoint for BOTH explanations",
	},
	)


	# Legacy endpoints (backward compatibility)
	@app.post("/api/v1/predict", response_model=PredictionResponse)
	async def predict_music_legacy(
	lyrics: str = Depends(validate_lyrics),
	audio_data_tuple: Tuple = Depends(validate_audio_source),
	):
	"""Legacy multimodal prediction endpoint."""
	return await predict_multimodal_endpoint(lyrics, audio_data_tuple)


	@app.post("/api/v1/explain", response_model=PredictionXAIResponse)
	async def explain_music_legacy(
	lyrics: str = Depends(validate_lyrics),
	audio_data_tuple: Tuple = Depends(validate_audio_source),
	):
	"""Legacy multimodal explanation endpoint."""
	return await explain_multimodal_endpoint(lyrics, audio_data_tuple)


	# New multimodal endpoints
	@app.post("/api/v1/predict/multimodal", response_model=PredictionResponse)
	async def predict_multimodal_endpoint(
	lyrics: str = Depends(validate_lyrics),
	audio_data_tuple: Tuple = Depends(validate_audio_source),
	):
	"""
	Endpoint to predict whether a music sample is human-composed or AI-generated.
	Accepts either an audio file upload or a YouTube URL.
	"""
	try:
	# Unpack validated data
	audio_content, audio_file_name, audio_content_type = audio_data_tuple

	# Load audio with librosa
	try:
	audio_data, sr = librosa.load(io.BytesIO(audio_content))
	except Exception as e:
	raise HTTPException(status_code=400, detail=f"Invalid audio file: {str(e)}")

	# Call MLP predict runner script
	results = predict_multimodal(audio_data, lyrics)

	return PredictionResponse(
	status="success",
	lyrics=lyrics,
	audio_file_name=audio_file_name,
	audio_content_type=audio_content_type,
	audio_file_size=len(audio_content),
	results=results,
	)
	except HTTPException:
	raise
	except Exception as e:
	raise HTTPException(status_code=500, detail=str(e))


	@app.post("/api/v1/explain/multimodal", response_model=PredictionXAIResponse)
	async def explain_multimodal_endpoint(
	lyrics: str = Depends(validate_lyrics),
	audio_data_tuple: Tuple = Depends(validate_audio_source),
	):
	"""
	Endpoint to predict whether a music sample is human-composed or AI-generated with explainability.
	Accepts either an audio file upload or a YouTube URL.
	"""
	try:
	# Unpack validated data
	audio_content, audio_file_name, audio_content_type = audio_data_tuple

	# Load audio with librosa
	try:
	audio_data, sr = librosa.load(io.BytesIO(audio_content))
	except Exception as e:
	raise HTTPException(status_code=400, detail=f"Invalid audio file: {str(e)}")

	# Call musiclime runner script
	results = musiclime_multimodal(audio_data, lyrics)

	return PredictionXAIResponse(
	status="success",
	lyrics=lyrics,
	audio_file_name=audio_file_name,
	audio_content_type=audio_content_type,
	audio_file_size=len(audio_content),
	results=results,
	)
	except HTTPException:
	raise
	except Exception as e:
	raise HTTPException(status_code=500, detail=str(e))


	# New audio-only endpoints
	@app.post("/api/v1/predict/audio", response_model=AudioOnlyPredictionResponse)
	async def predict_audio_only_endpoint(
	audio_data_tuple: Tuple = Depends(validate_audio_only),
	):
	"""Audio-only prediction endpoint."""
	try:
	audio_content, audio_file_name, audio_content_type = audio_data_tuple

	try:
	audio_data, sr = librosa.load(io.BytesIO(audio_content))
	except Exception as e:
	raise HTTPException(status_code=400, detail=f"Invalid audio file: {str(e)}")

	results = predict_unimodal(audio_data)

	return AudioOnlyPredictionResponse(
	status="success",
	audio_file_name=audio_file_name,
	audio_content_type=audio_content_type,
	audio_file_size=len(audio_content),
	results=results,
	)
	except HTTPException:
	raise
	except Exception as e:
	raise HTTPException(status_code=500, detail=str(e))


	@app.post("/api/v1/explain/audio", response_model=AudioOnlyPredictionXAIResponse)
	async def explain_audio_only_endpoint(
	audio_data_tuple: Tuple = Depends(validate_audio_only),
	):
	"""Audio-only explanation endpoint."""
	try:
	audio_content, audio_file_name, audio_content_type = audio_data_tuple

	try:
	audio_data, sr = librosa.load(io.BytesIO(audio_content))
	except Exception as e:
	raise HTTPException(status_code=400, detail=f"Invalid audio file: {str(e)}")

	results = musiclime_unimodal(audio_data, modality="audio")

	return AudioOnlyPredictionXAIResponse(
	status="success",
	audio_file_name=audio_file_name,
	audio_content_type=audio_content_type,
	audio_file_size=len(audio_content),
	results=results,
	)
	except HTTPException:
	raise
	except Exception as e:
	raise HTTPException(status_code=500, detail=str(e))


	# New combined endpoints (multimodal and audio-only)
	@app.post("/api/v1/predict/combined", response_model=CombinedPredictionResponse)
	async def predict_combined_endpoint(
	lyrics: str = Depends(validate_lyrics),
	audio_data_tuple: Tuple = Depends(validate_audio_source),
	):
	"""Combined multimodal and audio-only prediction endpoint (optimized)."""
	try:
	audio_content, audio_file_name, audio_content_type = audio_data_tuple

	try:
	audio_data, sr = librosa.load(io.BytesIO(audio_content))
	except Exception as e:
	raise HTTPException(status_code=400, detail=f"Invalid audio file: {str(e)}")

	# Generate both predictions with shared audio processing
	results = predict_combined(audio_data, lyrics)

	return CombinedPredictionResponse(
	status="success",
	lyrics=lyrics,
	audio_file_name=audio_file_name,
	audio_content_type=audio_content_type,
	audio_file_size=len(audio_content),
	results=results,
	)
	except HTTPException:
	raise
	except Exception as e:
	raise HTTPException(status_code=500, detail=str(e))


	@app.post("/api/v1/explain/combined", response_model=CombinedExplanationResponse)
	async def explain_combined_endpoint(
	lyrics: str = Depends(validate_lyrics),
	audio_data_tuple: Tuple = Depends(validate_audio_source),
	):
	"""Combined multimodal and audio-only explanation endpoint (optimized)."""
	try:
	audio_content, audio_file_name, audio_content_type = audio_data_tuple

	try:
	audio_data, sr = librosa.load(io.BytesIO(audio_content))
	except Exception as e:
	raise HTTPException(status_code=400, detail=f"Invalid audio file: {str(e)}")

	# Generate both explanations with single source separation
	results = musiclime_combined(audio_data, lyrics)

	return CombinedExplanationResponse(
	status="success",
	lyrics=lyrics,
	audio_file_name=audio_file_name,
	audio_content_type=audio_content_type,
	audio_file_size=len(audio_content),
	results=results,
	)
	except HTTPException:
	raise
	except Exception as e:
	raise HTTPException(status_code=500, detail=str(e))


	@app.get("/api/v1/model/info", response_model=ModelInfoResponse, tags=["Model"])
	async def get_model_info():
	"""
	Get information about the current model and its capabilities.
	"""
	try:
	# Get supported formats from config
	supported_formats = [fmt.replace("audio/", "") for fmt in ALLOWED_AUDIO_TYPES]

	# Get model info from config
	model_metadata = model_config["metadata"]
	model_architecture = model_config["mlp"]

	return ModelInfoResponse(
	status="success",
	message="Model information retrieved successfully",
	model_name=model_metadata["name"],
	model_version=model_metadata["version"],
	supported_formats=supported_formats,
	max_file_size_mb=server_config["file_upload"]["max_file_size_mb"],
	training_info={
	"dataset": model_metadata["dataset"],
	"architecture": f"{model_metadata['architecture']} - Layers: {model_architecture['hidden_layers']}",
	"accuracy": model_metadata["accuracy"],
	},
	last_updated=model_metadata["last_updated"],
	)

	except Exception as e:
	raise HTTPException(status_code=500, detail=str(e))