BK_ResumeSkillQualityClassifier / handler.py

Update handler.py

8973d97 verified 9 months ago

4.49 kB

	import torch
	from typing import Dict, Any, List
	from transformers import AutoTokenizer, AutoModelForMaskedLM

	class EndpointHandler():
	def __init__(self, path=""):
	self.device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

	# Load the models -- Leadership
	self.leadership_model_name = "roberta-large-mnli"
	self.leadership_model_path = path + "/pet-leadership-model-roberta-large-mnli_bs4_gas4_lr1e-05_ep5" + "/checkpoint-1855"
	self.leadership_pattern = "Sentence: {} Question: Does this show leadership? Answer: <mask>"

	# Load the models -- Collaboration
	self.collab_model_name = "roberta-large-mnli"
	self.collab_model_path = path + "/pet-collaboration-model-roberta-large-mnli_bs4_gas4_lr1e-05_ep5" + "/checkpoint-1560"
	self.collab_pattern = "Sentence: {} Question: Does this show teamwork? Answer: <mask>"

	# Load the tokenizer
	self.leadership_tokenizer = AutoTokenizer.from_pretrained(self.leadership_model_name)
	self.collab_tokenizer = AutoTokenizer.from_pretrained(self.collab_model_name)
	self.model_lead = AutoModelForMaskedLM.from_pretrained(self.leadership_model_path)
	self.model_collab = AutoModelForMaskedLM.from_pretrained(self.collab_model_path)

	def __call__(self, data: Dict[str, Any]) -> List[Dict[str, Any]]:
	"""
	data args:
	inputs (:obj: `str` \| `PIL.Image` \| `np.array`)
	kwargs
	Return:
	A :obj:`list` \| `dict`: will be serialized and returned
	"""
	sentence = data["inputs"]
	pl, pt, pc, pct = self.extract_skill_quality(sentence)
	return {"leadership": pl, "leadership_token": pt, "collaboration": pc, "collaboration_token": pct}


	def predict_trait(self, model, sentence, pattern, task_name):
	prompt = pattern.format(sentence)
	# Select appropriate tokenizer based on task
	tokenizer = self.leadership_tokenizer if task_name == "leadership" else self.collab_tokenizer

	enc = tokenizer(prompt, return_tensors="pt")

	if torch.cuda.is_available():
	model = model.cuda()
	enc = {k: v.cuda() for k, v in enc.items()}

	outputs = model(**enc)
	logits = outputs.logits

	# Find the <mask> token position
	mask_index = (enc["input_ids"] == tokenizer.mask_token_id).nonzero(as_tuple=True)[1]
	mask_logits = logits[0, mask_index, :]

	# Predicted token
	pred_token_id = mask_logits.argmax(dim=-1).item()
	pred_token = tokenizer.decode([pred_token_id]).strip()

	# We label 1 if the model predicted something starting with "yes", else 0
	pred_label = 1 if pred_token.lower().startswith("yes") else 0
	return pred_label, pred_token

	def extract_skill_quality(self, sentence):
	# Check leadership
	pl, pt = self.predict_trait(self.model_lead, sentence, self.leadership_pattern, "leadership")
	# Check collaboration
	pc, pct = self.predict_trait(self.model_collab, sentence, self.collab_pattern, "collaboration")
	return pl, pt, pc, pct


	if __name__ == "__main__":
	# Initialize the handler
	from handler import EndpointHandler
	handler = EndpointHandler(path=".") # Assuming proper initialization parameters are set in __init__

	# Test sentences
	test_sentences = [
	"I am leading a team of engineers.",
	"I am not leading my team.",
	"Exemplified the second-to-none customer service delivery in all interactions with customers and potential clients",
	"Collaborated with cross-functional teams to deliver the product on time.",
	"Finished my work on time.",
	"Mentored interns and coordinated weekly sync-ups."
	]

	# Process each sentence
	for sentence in test_sentences:
	print(f"Sentence: \"{sentence}\"")
	result = handler({"inputs": sentence})

	# Format leadership prediction
	lead_token = result["leadership_token"]
	lead_pred = "Yes" if result["leadership"] == 1 else "No"
	print(f" Leadership Prediction: {lead_pred} (Predicted token: '{lead_token}')")

	# Format collaboration prediction
	collab_token = result["collaboration_token"]
	collab_pred = "Yes" if result["collaboration"] == 1 else "No"
	print(f" Collaboration Prediction: {collab_pred} (Predicted token: '{collab_token}')")
	print()