dongtruong1910
Deploy
f817340
import torch
import os
# Lấy đường dẫn gốc của dự án
BASE_DIR = os.path.dirname(os.path.dirname(os.path.abspath(__file__)))
class Config:
# --- ĐƯỜNG DẪN DỮ LIỆU ---
TRAIN_PATH = os.path.join(BASE_DIR, 'data', 'raw', 'train.csv')
DEV_PATH = os.path.join(BASE_DIR, 'data', 'raw', 'dev.csv')
TEST_PATH = os.path.join(BASE_DIR, 'data', 'raw', 'test.csv')
# Nơi lưu model
MODEL_SAVE_PATH = os.path.join(BASE_DIR, 'saved_models', 'best_model.pth')
# --- CẤU HÌNH PHOBERT ---
MODEL_NAME = "vinai/phobert-base"
# Tham số xử lý văn bản
MAX_LEN = 100 # Độ dài câu tối đa
N_CLASSES = 3 # <--- DÒNG BẠN ĐANG THIẾU (0: Clean, 1: Offensive, 2: Hate)
# --- THAM SỐ HUẤN LUYỆN (Fine-tuning) ---
BATCH_SIZE = 16 # PhoBERT nặng nên để batch size nhỏ (16 hoặc 8)
EPOCHS = 10
LEARNING_RATE = 2e-5 # Learning rate rất nhỏ cho Transformer
# Tự động chọn GPU
DEVICE = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
if __name__ == '__main__':
print(f"Device: {Config.DEVICE}")