Spaces:

ierhon
/

neural-chatbot-constructor

Sleeping

ierhon commited on Feb 4, 2024

Commit

c5cb10d

verified ·

1 Parent(s): a282150

Add !gethash and using a hash as data

Files changed (1) hide show

chatbot_constructor.py CHANGED Viewed

@@ -16,15 +16,22 @@ def hash_str(data: str):
     return hashlib.md5(data.encode('utf-8')).hexdigest()
 def train(message: str = "", epochs: int = 16, learning_rate: float = 0.001, emb_size: int = 128, inp_len: int = 16, data: str = ""):
     if "→" not in data or "\n" not in data:
-        return "Dataset example:\nquestion→answer\nquestion→answer\netc."
     dset, responses = todset(data)
     resps_len = len(responses)
     tokenizer = Tokenizer()
     tokenizer.fit_on_texts(list(dset.keys()))
     vocab_size = len(tokenizer.word_index) + 1
-    data_hash = hash_str(data)+str(epochs)+str(learning_rate)+str(emb_size)+str(inp_len)+".keras"
     if data_hash in os.listdir("cache"):
         model = load_model("cache/"+data_hash)
     else:

     return hashlib.md5(data.encode('utf-8')).hexdigest()
 def train(message: str = "", epochs: int = 16, learning_rate: float = 0.001, emb_size: int = 128, inp_len: int = 16, data: str = ""):
+    data_hash = None
     if "→" not in data or "\n" not in data:
+            if data in os.listdir("cache"):
+                data_hash = data
+            else:
+                return "Dataset example:\nquestion→answer\nquestion→answer\netc."
     dset, responses = todset(data)
     resps_len = len(responses)
     tokenizer = Tokenizer()
     tokenizer.fit_on_texts(list(dset.keys()))
     vocab_size = len(tokenizer.word_index) + 1
+    if data_hash is None:
+        data_hash = hash_str(data)+str(epochs)+str(learning_rate)+str(emb_size)+str(inp_len)+".keras"
+    elif message == "!getmodelhash":
+        return data_hash
     if data_hash in os.listdir("cache"):
         model = load_model("cache/"+data_hash)
     else: