Upload 16 files
Browse files- 1_Pooling/config.json +10 -0
- README.md +659 -0
- config.json +25 -0
- config_sentence_transformers.json +10 -0
- model.safetensors +3 -0
- modules.json +14 -0
- optimizer.pt +3 -0
- rng_state.pth +3 -0
- scheduler.pt +3 -0
- sentence_bert_config.json +4 -0
- special_tokens_map.json +37 -0
- tokenizer.json +0 -0
- tokenizer_config.json +94 -0
- trainer_state.json +933 -0
- training_args.bin +3 -0
- vocab.txt +0 -0
1_Pooling/config.json
ADDED
|
@@ -0,0 +1,10 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
{
|
| 2 |
+
"word_embedding_dimension": 768,
|
| 3 |
+
"pooling_mode_cls_token": false,
|
| 4 |
+
"pooling_mode_mean_tokens": true,
|
| 5 |
+
"pooling_mode_max_tokens": false,
|
| 6 |
+
"pooling_mode_mean_sqrt_len_tokens": false,
|
| 7 |
+
"pooling_mode_weightedmean_tokens": false,
|
| 8 |
+
"pooling_mode_lasttoken": false,
|
| 9 |
+
"include_prompt": true
|
| 10 |
+
}
|
README.md
ADDED
|
@@ -0,0 +1,659 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
---
|
| 2 |
+
tags:
|
| 3 |
+
- sentence-transformers
|
| 4 |
+
- sentence-similarity
|
| 5 |
+
- feature-extraction
|
| 6 |
+
- generated_from_trainer
|
| 7 |
+
- dataset_size:16201
|
| 8 |
+
- loss:MatryoshkaLoss
|
| 9 |
+
- loss:MultipleNegativesRankingLoss
|
| 10 |
+
base_model: Omartificial-Intelligence-Space/Arabic-Triplet-Matryoshka-V2
|
| 11 |
+
widget:
|
| 12 |
+
- source_sentence: ما هو الحكم الشرعي لرهن ملك الغير في العلاقة بين المتعاقدين وفقًا
|
| 13 |
+
للرأي السائد في الفقه المصري؟
|
| 14 |
+
sentences:
|
| 15 |
+
- أعمال تجارية وكذلك عمليات إعادة البيع أو التأجير ثانية تعتبر بدورها أعمالاً تجارية
|
| 16 |
+
أ شروط إعتبار الشراء أو الاستئجار بقصد البيع أو التأجير عملا تجارياً على أي حال،
|
| 17 |
+
وبصرف النظر عن الملاحظتين السابقتين فإنه يشترط لإعتبار الشراء أو الإستئجار بقصد
|
| 18 |
+
البيع أو التأجير عملا تجارياً ثلاثة شروط الأول أن يكون الحصول على الشئ قد تم بطريق
|
| 19 |
+
الشراء أو الإستئجار والثاني أن يقع الشراء أو الإستئجار على منقول ن أما الشرط الثالث
|
| 20 |
+
والأخير فهو قصد إعادة البيع أو التأجير الحصول على ربح الشرط الأول أن يكون هناك
|
| 21 |
+
شراء أو إستئجار لم توضح الفقرات أ،ب من المادة الرابعة من قانون التجارة الجديد
|
| 22 |
+
المقصود بالشراء الذي
|
| 23 |
+
- فإن حق الراهن لا يترتب على العقار إلا من الوقت الذي يصبح فيه هذا العقار مملوكًا
|
| 24 |
+
للراهن وندرس فيما يلي حكم رهن ملك الغير فيما بين المتعاقدين ثم في مواجهة المالك
|
| 25 |
+
الحقيقي المطلب الأول حكم رهن ملك الغير في العلاقة بين المتعاقدين ثار خلاف في الفقه
|
| 26 |
+
المصري حول حكم رهن ملك الغير، فمنهم من يعتبره باطلاً بطلانًا نسبيًا، وذلك أسوة
|
| 27 |
+
بما يقرره القانون بصدد بيع ملك الغير فحيث تتحد العلة في اتساق التشريع يقتضي وحدة
|
| 28 |
+
الحكم وملكية العقار شرط لصحة العقد ومن الفقه من ذهب إلى أن رهن ملك الغير يعتبر
|
| 29 |
+
باطلاً بطلانًا مطلقًا تأسيسًا على أن فاقد الشيء لا يعطيه، وغير المالك لا يمكنه
|
| 30 |
+
ترتيب رهن العقار فيكون محل
|
| 31 |
+
- ويملك في سبيل تفنيد أدلة الاتهام أن يأتي بأدلة غير مشروعة وهو ما لا يملكه الاتهام
|
| 32 |
+
الذي يتقيد بالأدلة المشروعة في أعماله فضلاً عما يلتزم به الاتهام من موضوعية في
|
| 33 |
+
آرائه وتصرفاته وما لا يلتزم به الدفاع، فالاتهام ليس عدواً للدفاع بل يجب أن يشارك
|
| 34 |
+
معه أثناء المحاكمة من أجل إثبات الحقيقة لضمان فاعلية العدالة وقد كرس المشرع الدستوري
|
| 35 |
+
هذا المبدأ بما نصت عليه المادة ١٩٦ من دستور ٢٠١٤ من أن المتهم برئ حتى تثبت إدانته
|
| 36 |
+
في محاكمة قانونية عادلة، تكفل له فيها ضمانات الدفاع عن نفسه المطلب الخامس تدوين
|
| 37 |
+
الاجراءات أولًا أهمية المبدأ واساسه القانوني يعد تدوين إجراءات المحاكمة مبدأ مكملاً
|
| 38 |
+
لمبدأ الشفوية، ولا
|
| 39 |
+
- source_sentence: ما هي التغييرات التي طرأت على المادة 80 من قانون الشركات فيما يتعلق
|
| 40 |
+
بدعوة مجلس الإدارة للاجتماع؟
|
| 41 |
+
sentences:
|
| 42 |
+
- عند دراستنا لخصائص الموازنة العامة ولقد ترتب على مبدأ تدخلية الدولة زيادة النفقات
|
| 43 |
+
العامة للدولة وذلك على عكس ما يحدث فى ظل سيادة مبدأ الدولة الحارسة وعلى عكس ما
|
| 44 |
+
سبق، فإن سيادة المذهب الاشتراكى أو الايديولوجية الشمولية فى مجتمع ما من شأنه أن
|
| 45 |
+
يزيد من حجم النفقات العامة بصورة كبيرة جدا ويرجع ذلك إلى أن الدولة تحمل على عاتقها
|
| 46 |
+
فى ظل هذه الايديولوجية رقم الصفحه 23 القيام بكافة الأنشطة الاقتصادية والاجتماعية
|
| 47 |
+
والثقافية وتقوم بإنتاج الجزء الأكبر من الناتج القومى الإجمالى، بينما يتهمش دور
|
| 48 |
+
الفرد أو القطاع الخاص بصورة عامة فى ظل المجتمع الاشتراكى وفى الواقع، فإن العالم
|
| 49 |
+
قد شهد تحولا فكريا واقتصاديا
|
| 50 |
+
- سنوات بدلاً من اثنتين ومثال النوع الثاني القانون الصادر بمنع صناعة من الصناعات
|
| 51 |
+
أو عمل من الأعمال دون أن يكون لصدور هذا القانون مبرر من الصحة العامة أو الآداب
|
| 52 |
+
٢ نظرية الإثراء بلا سبب ذهب العميد هوريو إلى تقرير مسئولية الدولة عن القوانين
|
| 53 |
+
في بعض الأحوال على أساس فكرة الإثراء بلا سبب فإذا صدر قانون باحتكار صناعة من الصناعات
|
| 54 |
+
لحساب الدولة، وترتب على ذلك إغلاق المصانع التي كانت تمارس تلك الصناعة، جاز لأصحاب
|
| 55 |
+
هذه المصانع المطالبة بالتعويض لأن الدولة حينئذ تكون قد أثرت على حساب الغير بدون
|
| 56 |
+
سبب ونظرية الإثراء بلا سبب نظرية معروفة في القانون المدني، وتقوم على أن كل من
|
| 57 |
+
أثرى على حساب الغير دون سبب قانوني يلتزم
|
| 58 |
+
- ثمانين في المائة في عضوية مجالس إدارة الجمعيات التعاونية الزراعية والجمعيات التعاونية
|
| 59 |
+
الصناعية رقم الصفحه 121 كانت المَادَّة 80 من قَانُون الشَّرِكَات قبل تعديلها بموجب
|
| 60 |
+
القَانُون 4 لِسَنَةِ 1792018 تقصر حق الدعوة لاجتماع المَجْلِس على الرئيس أو بناء
|
| 61 |
+
على طلب مقدم من ثلث الأعضاء أو كلما دعت الحاجة لذلك ووفقًا للنص الحالي، يكون اجتماع
|
| 62 |
+
المَجْلِس وفقًا لما يلي يجتمع مَجْلِس الإِدَارَة بدعوة من رئيسه أو من أغلبية أعضائه
|
| 63 |
+
في حالة خلو منصب الرئيس بمعنى آخر أضحت الدعوة من الأغلبية فقط عند خلو منصب الرئيس
|
| 64 |
+
أجاز المُشَرِّع للمرة الأولي لثلث أعضاء المَجْلِس أن يتقدموا بطلب کتابي لرئیس
|
| 65 |
+
المَجْلِس لعقد اجتماع
|
| 66 |
+
- source_sentence: ما هو دور وزير العدل في الإشراف على المحاكم؟
|
| 67 |
+
sentences:
|
| 68 |
+
- لم يخطئ في قصده، بل أخطأ في فعله ٤ والقتل الجاري مجرى الخطأ هو القتل الواقع ممن
|
| 69 |
+
لا قصد له، وذلك كنائم ينقلب على مورثه فيقتله، أو يسقط من مكان مرتفع عليه فيموت
|
| 70 |
+
٩٨ رقم الصفحه 94 والنوع الأول يستوجب القصاص، وأما الثاني فالواجب فيه دية مغلظة
|
| 71 |
+
مع الكفارة، والأخيران الواجب فيهما الكفارة مع الدية، والقاتل في الأنواع الأربعة
|
| 72 |
+
قد باشر القتل بنفسه أما القتل الذي لا يستوجب القصاص ولا الكفارة فلا يكون مانعاً
|
| 73 |
+
من الميراث، ويشمل ذلك عندهم ما يأتي ١ القتل بحق كقتل الشخص مورثه بحكم وظيفته قصاصاً
|
| 74 |
+
إذا قتل غيره عدواناً، أو حداً كقتل المرتد عن الإسلام، أو دفاعاً علن النفس إذا
|
| 75 |
+
تعين القتل طريقاً
|
| 76 |
+
- والأجور والعقارات وعلى العكس من ذلك، فإن الضريبة غير المباشرة هى التى تنصب على
|
| 77 |
+
وعاء مادى غير مستقر ولا يتمتع بالثبات أو الاستمرارية فالضرائب غير المباشرة تفرض
|
| 78 |
+
على وقائع أو أعمال عرضية مؤقتة مثل الاستهلاك والتداول والاستعمال والإنتاج٣٤ وفى
|
| 79 |
+
الواقع فإنه على الرغم من قدرة هذا المعيار على التمييز أحيانا بين الضرائب المباشرة
|
| 80 |
+
وغير المباشرة إلا أنه يتسم بالغموض وعدم الدقة فى أحيان أخرى فالضريبة على التركات
|
| 81 |
+
والتى تفرض على رأس المال هى ضريبة مباشرة ولكنه يمكن اعتبارها ضريبة غير مباشرة
|
| 82 |
+
وفقا لمعيار استقرار وثبات المادة الخاضعة للضريبة باعتبار أنها تفرض عند انتقال
|
| 83 |
+
الثروة من المتوفى إلى الورثة وهى واقعة عرضية
|
| 84 |
+
- فإن هذا الدور يظل مع ذلك دورًا مشاركاً وليس أصيلاً فالقرارات التي تصدرها السلطة
|
| 85 |
+
التنفيذية في خصوص هذه الشئون تعتمد في وجه أو في آخر على موافقة الهيئات القضائية
|
| 86 |
+
أو بالأقل استطلاع رأيها وفي هذا الإطار يتحدد مضمون نص المادة ٩٣ من قانون السلط��
|
| 87 |
+
القضائية والذي يقضي بأن لوزير العدل حق الإشراف الإداري على المحاكم، ولرئيس كل
|
| 88 |
+
محكمة وللجمعية العامة حق الإشراف على القضاة التابعين لها ١ فالمقصود بالإشراف في
|
| 89 |
+
هذا المقام هو مجرد الإشراف الإداري، وهو لا يتجسد في غالب الحالات في قرارات إلا
|
| 90 |
+
بعد موافقة الجهات القضائية المختصة أو بالأقل التعرف على رأيها ويجد هذا الدور أساسه
|
| 91 |
+
في سندين فمن ناحية
|
| 92 |
+
- source_sentence: ما هو موقف المحكمة الدستورية العليا من فصل ملكية العين عن ملكية
|
| 93 |
+
الرقبة بشكل دائم؟
|
| 94 |
+
sentences:
|
| 95 |
+
- الحبوب لأصحاب المطاحن الذين يقومون بطحنها لحسابهم وبيعها دقيقا بالسعر الجبري فإذا
|
| 96 |
+
انتهت عمليتهم بربح أو خسارة فإنهم يتحملون نتيجتها الطعن رقم 56 لسنة 35 ق جلسة
|
| 97 |
+
196924 س 20 ع 1 ص248 على أنه يبقى التأكيد على أن القيود التي تفرض على الملكية
|
| 98 |
+
، استنادا إلى مبررات الوظيفة الاجتماعية للملكية ينبغي أن تكون مؤقتة وعارضة 34
|
| 99 |
+
وان بقاء هذه القيود بما يستغرق حياة طرفي العلاقة العقدية أو أحدهما ، يعني أنها
|
| 100 |
+
قيود مؤبدة وان في ذلك أهدار لحق الملكية ومساس بجوهر الملكية وسلطات المالك وأن
|
| 101 |
+
فصل ملكية العين عن ملكية الرقبة فصلا دائما ومؤبدا يهدر بالضرورة حق الملكية ، كما
|
| 102 |
+
أكدت على ذلك المحكمة الدستورية العليا في العديد من
|
| 103 |
+
- الجامعات، والمعاهد، والسكك الحديدية، والمطابع الأميرية إلخ إلا أن المشرع المصرى
|
| 104 |
+
بالرغم من ذلك فإنه لم يأخذ بفكرة استقلال الميزانيات المستقلة على إطلاقها، وإنما
|
| 105 |
+
وجب عرض تلك الميزانيات على السلطة التشريعية لمناقشتها واعتمادها ثم فى وقت لاحق
|
| 106 |
+
عدل المشرع المصرى الأخذ بنظام الميزانيات المستقلة وأدمجها فى الميزانية العامة
|
| 107 |
+
للدولة وذلك بموجب صدور القرار الجمهورى رقم ١٢٨٨ لسنة ١٩٦٣ ثم عاد المشرع المصرى
|
| 108 |
+
إلى الأخذ بنظام الميزانيات المستقلة وذلك فى قانون الموازنة العامة رقم ٥٣ لسنة
|
| 109 |
+
١٩٧٣ والمعدل بالقانون رقم ١١ لسنة ١٩٧٩ حيث نصت المادة الثالثة بالفقرة الثانية
|
| 110 |
+
على أن الموازنة العامة للدولة
|
| 111 |
+
- هذه الوصية وهم أهل لتلك الإجازة، أما إذا لم يكن هناك وارث فلا تنفذ الوصية بما
|
| 112 |
+
زاد على الثلث ولقد اتجه قانون الوصية في مصر إلى الأخذ بمذهب الحنفية والحنابلة،
|
| 113 |
+
وجاء النص على ذلك في الفقرة الثانية من المادة ٣٧ من هذا القانون حيث جاء فيها تنفذ
|
| 114 |
+
وصية من لا دين عليه ولا وارث له بكل ماله أو بعضه من غير توقف على إجازة الخزانة
|
| 115 |
+
العامة وجاء في المادة الرابعة من قانون المواريث إذا لم توجد ورثة قضى من التركة
|
| 116 |
+
بالترتيب الآتي أولاً استحقاق من أقر له الميت بنسب على غيره ثانياً ما أوصى به فيما
|
| 117 |
+
زاد على الحد الذي تنفذ فيه الوصية فإذا لم يوجد أحد من هؤلاء آلت التركة أو ما بقى
|
| 118 |
+
منها إلى الخزانة العامة وإنما
|
| 119 |
+
- source_sentence: ما هي الوسائل الحسية التي يمكن استخدامها في عملية المعاينة؟
|
| 120 |
+
sentences:
|
| 121 |
+
- الفصل في المنازعات فقد كان من اختصاص الوزير قانوناً ، وهو ما يعبر عنه بنظرية الوزير
|
| 122 |
+
القاضي، أو القضاء المحجوز وظل الحال هكذا حتى قيام الجمهورية الثالثة وصدور قانون
|
| 123 |
+
٢٤ مايو ١٨٧٢ والذي منح مجلس الدولة سلطة الفصل في المنازعات الإدارية رقم الصفحه
|
| 124 |
+
33 بصفة نهائية أي سلطة إصدار أحكام نهائية دون تدخل من جانب رئيس الدولة أو الوزير
|
| 125 |
+
المختص، فأصبح بذلك محكمة بالمعنى الصحيح ولهذا يطلق على هذه المرحلة بمرحلة القضاء
|
| 126 |
+
البات أو القضاء المفوض كما نص هذا القانون على إنشاء محكمة للفصل في حالات تنازع
|
| 127 |
+
الاختصاص بين المحاكم الإدارية والمحاكم العادية أطلق عليه أسم محكمة التنازع وهكذا
|
| 128 |
+
نستطيع القول إن صدور
|
| 129 |
+
- إشكالاً وجب عليه وقف التنفيذ وتحديد جلسة لنظره أمام قاضي التنفيذ، وإذا ذيل الحكم
|
| 130 |
+
بالصيغة التنفيذية وتبين للمحضر أنه غير مشمول بالنفاذ المعجل بأمر المحكمة ولم تتوافر
|
| 131 |
+
الشروط اللازمة لاعتباره نافذاً بقوة القانون بخلوه من البيان الذي يفيد صدوره في
|
| 132 |
+
مادة تجارية أو مستعجلة ، تعين عليه أن يمتنع عن تنفيذه أو بوقف تنفيذه ، أنور طلبه
|
| 133 |
+
، مرجع سابق ، ص 284 201 تحكم بالنفاذ المعجل ؛ فسلطتها في ذلك جوازية808 ، ويطلب
|
| 134 |
+
هذا النفاذ أمام أول درجة فإذا انتهت الخصومة أمامها دون طلبه تكون هذه المحكمة قد
|
| 135 |
+
استنفدت ولايتها ، ولا يجوز العودة إليها مرة ثانية ، كما لا يجوز طلبه أمام الاستئناف
|
| 136 |
+
لأن أحكام
|
| 137 |
+
- جدية الطلب أو اقتنعت بجدوى الانتقال للمعاينة فى إثبات الحقيقة، ولها أن ترفض طلبهم
|
| 138 |
+
هذا على أن تسبب رفضها حتى لا يعتور حكمها القصور وإذا كان طلب إجراء المعاينة لا
|
| 139 |
+
يتجه إلى نفى الفعل المسند للمتهم ولا إلى إثبات استحالة حصوله، ٦٣ وتتم المعاينة
|
| 140 |
+
بأى حاسة من الحواس التى تتسق مع الواقعة محل المعاينة، فقد تتمثل المعاينة فى المشاهدة
|
| 141 |
+
فتعتمد على البصر أو تتمثل فى اللمس أو فى السمع أو فى الشم أو فى التذوق وقد تنصب
|
| 142 |
+
المعاينة على شخص من الأشخاص، كمعاينة جسم المجنى عليه للتأكد من وقوع إكراه عليه
|
| 143 |
+
أثناء ارتكاب المتهم لجريمته، كما قد تنصب المعاينة على مكان معين كمعاينة مكان القذف
|
| 144 |
+
أو السب للتأكد
|
| 145 |
+
pipeline_tag: sentence-similarity
|
| 146 |
+
library_name: sentence-transformers
|
| 147 |
+
metrics:
|
| 148 |
+
- cosine_accuracy@1
|
| 149 |
+
- cosine_accuracy@3
|
| 150 |
+
- cosine_accuracy@5
|
| 151 |
+
- cosine_accuracy@10
|
| 152 |
+
- cosine_precision@1
|
| 153 |
+
- cosine_precision@3
|
| 154 |
+
- cosine_precision@5
|
| 155 |
+
- cosine_precision@10
|
| 156 |
+
- cosine_recall@1
|
| 157 |
+
- cosine_recall@3
|
| 158 |
+
- cosine_recall@5
|
| 159 |
+
- cosine_recall@10
|
| 160 |
+
- cosine_ndcg@10
|
| 161 |
+
- cosine_mrr@10
|
| 162 |
+
- cosine_map@100
|
| 163 |
+
model-index:
|
| 164 |
+
- name: SentenceTransformer based on Omartificial-Intelligence-Space/Arabic-Triplet-Matryoshka-V2
|
| 165 |
+
results:
|
| 166 |
+
- task:
|
| 167 |
+
type: information-retrieval
|
| 168 |
+
name: Information Retrieval
|
| 169 |
+
dataset:
|
| 170 |
+
name: custom dataset evaluation
|
| 171 |
+
type: custom_dataset_evaluation
|
| 172 |
+
metrics:
|
| 173 |
+
- type: cosine_accuracy@1
|
| 174 |
+
value: 0.621963262887616
|
| 175 |
+
name: Cosine Accuracy@1
|
| 176 |
+
- type: cosine_accuracy@3
|
| 177 |
+
value: 0.8262393837645665
|
| 178 |
+
name: Cosine Accuracy@3
|
| 179 |
+
- type: cosine_accuracy@5
|
| 180 |
+
value: 0.8843077226940549
|
| 181 |
+
name: Cosine Accuracy@5
|
| 182 |
+
- type: cosine_accuracy@10
|
| 183 |
+
value: 0.9401046810191586
|
| 184 |
+
name: Cosine Accuracy@10
|
| 185 |
+
- type: cosine_precision@1
|
| 186 |
+
value: 0.621963262887616
|
| 187 |
+
name: Cosine Precision@1
|
| 188 |
+
- type: cosine_precision@3
|
| 189 |
+
value: 0.2754131279215221
|
| 190 |
+
name: Cosine Precision@3
|
| 191 |
+
- type: cosine_precision@5
|
| 192 |
+
value: 0.17686154453881098
|
| 193 |
+
name: Cosine Precision@5
|
| 194 |
+
- type: cosine_precision@10
|
| 195 |
+
value: 0.09401046810191586
|
| 196 |
+
name: Cosine Precision@10
|
| 197 |
+
- type: cosine_recall@1
|
| 198 |
+
value: 0.621963262887616
|
| 199 |
+
name: Cosine Recall@1
|
| 200 |
+
- type: cosine_recall@3
|
| 201 |
+
value: 0.8262393837645665
|
| 202 |
+
name: Cosine Recall@3
|
| 203 |
+
- type: cosine_recall@5
|
| 204 |
+
value: 0.8843077226940549
|
| 205 |
+
name: Cosine Recall@5
|
| 206 |
+
- type: cosine_recall@10
|
| 207 |
+
value: 0.9401046810191586
|
| 208 |
+
name: Cosine Recall@10
|
| 209 |
+
- type: cosine_ndcg@10
|
| 210 |
+
value: 0.7849111131501391
|
| 211 |
+
name: Cosine Ndcg@10
|
| 212 |
+
- type: cosine_mrr@10
|
| 213 |
+
value: 0.7346985522104195
|
| 214 |
+
name: Cosine Mrr@10
|
| 215 |
+
- type: cosine_map@100
|
| 216 |
+
value: 0.7376242387041089
|
| 217 |
+
name: Cosine Map@100
|
| 218 |
+
---
|
| 219 |
+
|
| 220 |
+
# SentenceTransformer based on Omartificial-Intelligence-Space/Arabic-Triplet-Matryoshka-V2
|
| 221 |
+
|
| 222 |
+
This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [Omartificial-Intelligence-Space/Arabic-Triplet-Matryoshka-V2](https://huggingface.co/Omartificial-Intelligence-Space/Arabic-Triplet-Matryoshka-V2). It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
|
| 223 |
+
|
| 224 |
+
## Model Details
|
| 225 |
+
|
| 226 |
+
### Model Description
|
| 227 |
+
- **Model Type:** Sentence Transformer
|
| 228 |
+
- **Base model:** [Omartificial-Intelligence-Space/Arabic-Triplet-Matryoshka-V2](https://huggingface.co/Omartificial-Intelligence-Space/Arabic-Triplet-Matryoshka-V2) <!-- at revision ed357f222f0b6ea6670d2c9b5a1cb93950d34200 -->
|
| 229 |
+
- **Maximum Sequence Length:** 512 tokens
|
| 230 |
+
- **Output Dimensionality:** 768 dimensions
|
| 231 |
+
- **Similarity Function:** Cosine Similarity
|
| 232 |
+
<!-- - **Training Dataset:** Unknown -->
|
| 233 |
+
<!-- - **Language:** Unknown -->
|
| 234 |
+
<!-- - **License:** Unknown -->
|
| 235 |
+
|
| 236 |
+
### Model Sources
|
| 237 |
+
|
| 238 |
+
- **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
|
| 239 |
+
- **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
|
| 240 |
+
- **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
|
| 241 |
+
|
| 242 |
+
### Full Model Architecture
|
| 243 |
+
|
| 244 |
+
```
|
| 245 |
+
SentenceTransformer(
|
| 246 |
+
(0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: BertModel
|
| 247 |
+
(1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
|
| 248 |
+
)
|
| 249 |
+
```
|
| 250 |
+
|
| 251 |
+
## Usage
|
| 252 |
+
|
| 253 |
+
### Direct Usage (Sentence Transformers)
|
| 254 |
+
|
| 255 |
+
First install the Sentence Transformers library:
|
| 256 |
+
|
| 257 |
+
```bash
|
| 258 |
+
pip install -U sentence-transformers
|
| 259 |
+
```
|
| 260 |
+
|
| 261 |
+
Then you can load this model and run inference.
|
| 262 |
+
```python
|
| 263 |
+
from sentence_transformers import SentenceTransformer
|
| 264 |
+
|
| 265 |
+
# Download from the 🤗 Hub
|
| 266 |
+
model = SentenceTransformer("sentence_transformers_model_id")
|
| 267 |
+
# Run inference
|
| 268 |
+
sentences = [
|
| 269 |
+
'ما هي الوسائل الحسية التي يمكن استخدامها في عملية المعاينة؟',
|
| 270 |
+
'جدية الطلب أو اقتنعت بجدوى الانتقال للمعاينة فى إثبات الحقيقة، ولها أن ترفض طلبهم هذا على أن تسبب رفضها حتى لا يعتور حكمها القصور وإذا كان طلب إجراء المعاينة لا يتجه إلى نفى الفعل المسند للمتهم ولا إلى إثبات استحالة حصوله، ٦٣ وتتم المعاينة بأى حاسة من الحواس التى تتسق مع الواقعة محل المعاينة، فقد تتمثل المعاينة فى المشاهدة فتعتمد على البصر أو تتمثل فى اللمس أو فى السمع أو فى الشم أو فى التذوق وقد تنصب المعاينة على شخص من الأشخاص، كمعاينة جسم المجنى عليه للتأكد من وقوع إكراه عليه أثناء ارتكاب المتهم لجريمته، كما قد تنصب المعاينة على مكان معين كمعاينة مكان القذف أو السب للتأكد',
|
| 271 |
+
'إشكالاً وجب عليه وقف التنفيذ وتحديد جلسة لنظره أمام قاضي التنفيذ، وإذا ذيل الحكم بالصيغة التنفيذية وتبين للمحضر أنه غير مشمول بالنفاذ المعجل بأمر المحكمة ولم تتوافر الشروط اللازمة لاعتباره نافذاً بقوة القانون بخلوه من البيان الذي يفيد صدوره في مادة تجارية أو مستعجلة ، تعين عليه أن يمتنع عن تنفيذه أو بوقف تنفيذه ، أنور طلبه ، مرجع سابق ، ص 284 201 تحكم بالنفاذ المعجل ؛ فسلطتها في ذلك جوازية808 ، ويطلب هذا النفاذ أمام أول درجة فإذا انتهت الخصومة أمامها دون طلبه تكون هذه المحكمة قد استنفدت ولايتها ، ولا يجوز العودة إليها مرة ثانية ، كما لا يجوز طلبه أمام الاستئناف لأن أحكام',
|
| 272 |
+
]
|
| 273 |
+
embeddings = model.encode(sentences)
|
| 274 |
+
print(embeddings.shape)
|
| 275 |
+
# [3, 768]
|
| 276 |
+
|
| 277 |
+
# Get the similarity scores for the embeddings
|
| 278 |
+
similarities = model.similarity(embeddings, embeddings)
|
| 279 |
+
print(similarities.shape)
|
| 280 |
+
# [3, 3]
|
| 281 |
+
```
|
| 282 |
+
|
| 283 |
+
<!--
|
| 284 |
+
### Direct Usage (Transformers)
|
| 285 |
+
|
| 286 |
+
<details><summary>Click to see the direct usage in Transformers</summary>
|
| 287 |
+
|
| 288 |
+
</details>
|
| 289 |
+
-->
|
| 290 |
+
|
| 291 |
+
<!--
|
| 292 |
+
### Downstream Usage (Sentence Transformers)
|
| 293 |
+
|
| 294 |
+
You can finetune this model on your own dataset.
|
| 295 |
+
|
| 296 |
+
<details><summary>Click to expand</summary>
|
| 297 |
+
|
| 298 |
+
</details>
|
| 299 |
+
-->
|
| 300 |
+
|
| 301 |
+
<!--
|
| 302 |
+
### Out-of-Scope Use
|
| 303 |
+
|
| 304 |
+
*List how the model may foreseeably be misused and address what users ought not to do with the model.*
|
| 305 |
+
-->
|
| 306 |
+
|
| 307 |
+
## Evaluation
|
| 308 |
+
|
| 309 |
+
### Metrics
|
| 310 |
+
|
| 311 |
+
#### Information Retrieval
|
| 312 |
+
|
| 313 |
+
* Dataset: `custom_dataset_evaluation`
|
| 314 |
+
* Evaluated with [<code>InformationRetrievalEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.InformationRetrievalEvaluator)
|
| 315 |
+
|
| 316 |
+
| Metric | Value |
|
| 317 |
+
|:--------------------|:-----------|
|
| 318 |
+
| cosine_accuracy@1 | 0.622 |
|
| 319 |
+
| cosine_accuracy@3 | 0.8262 |
|
| 320 |
+
| cosine_accuracy@5 | 0.8843 |
|
| 321 |
+
| cosine_accuracy@10 | 0.9401 |
|
| 322 |
+
| cosine_precision@1 | 0.622 |
|
| 323 |
+
| cosine_precision@3 | 0.2754 |
|
| 324 |
+
| cosine_precision@5 | 0.1769 |
|
| 325 |
+
| cosine_precision@10 | 0.094 |
|
| 326 |
+
| cosine_recall@1 | 0.622 |
|
| 327 |
+
| cosine_recall@3 | 0.8262 |
|
| 328 |
+
| cosine_recall@5 | 0.8843 |
|
| 329 |
+
| cosine_recall@10 | 0.9401 |
|
| 330 |
+
| **cosine_ndcg@10** | **0.7849** |
|
| 331 |
+
| cosine_mrr@10 | 0.7347 |
|
| 332 |
+
| cosine_map@100 | 0.7376 |
|
| 333 |
+
|
| 334 |
+
<!--
|
| 335 |
+
## Bias, Risks and Limitations
|
| 336 |
+
|
| 337 |
+
*What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
|
| 338 |
+
-->
|
| 339 |
+
|
| 340 |
+
<!--
|
| 341 |
+
### Recommendations
|
| 342 |
+
|
| 343 |
+
*What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
|
| 344 |
+
-->
|
| 345 |
+
|
| 346 |
+
## Training Details
|
| 347 |
+
|
| 348 |
+
### Training Dataset
|
| 349 |
+
|
| 350 |
+
#### Unnamed Dataset
|
| 351 |
+
|
| 352 |
+
* Size: 16,201 training samples
|
| 353 |
+
* Columns: <code>question</code> and <code>context</code>
|
| 354 |
+
* Approximate statistics based on the first 1000 samples:
|
| 355 |
+
| | question | context |
|
| 356 |
+
|:--------|:---------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
|
| 357 |
+
| type | string | string |
|
| 358 |
+
| details | <ul><li>min: 7 tokens</li><li>mean: 16.2 tokens</li><li>max: 46 tokens</li></ul> | <ul><li>min: 49 tokens</li><li>mean: 125.02 tokens</li><li>max: 191 tokens</li></ul> |
|
| 359 |
+
* Samples:
|
| 360 |
+
| question | context |
|
| 361 |
+
|:-------------------------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
|
| 362 |
+
| <code>ما هي الدعوى التي رفعها المعلن إلي الطالب وما هي مطالبته؟</code> | <code>الحد المقرر قانونا باعتبارها مؤجرة خاليه فأقام المعلن اليه الدعوى رقم سنة مستعجل الجيزة بطلب طرد الطالب زاعما فيها انه استأجر شقة النزاع مفروشة ولم يشر فيها الى انها مكتب لفرع شركة تجارية كما ورد بعقد الإيجار، وقدم في ملف تلك الدعوى عقد الإيجار المؤرخ وقدم كذلك قائمة بمنقولات زعم انها ملحقة لذلك العقد، وزورها على الطالب صلبا وتوقيعا ولما كان تقديم ورقة في الدعوى ليس في استطاعة من احتج عليه بها أن يطعن عليها بالتزوير، كما إذا قدمت في دعوى مستعجلة، فانه يجوز له أن يرفع دعوى تزوير أصلية فقد قضت محكمة النقض بأنه إذا لم يكن لمن احتج عليه بالورقة أن يسلك سبيل الادعاء</code> |
|
| 363 |
+
| <code>ما هو الأثر القانوني لصدور حكم بعدم الدستورية على القانون أو المعاهدة الدولية؟</code> | <code>بعدم الدستورية، أو من التاريخ الذى يحدده المجلس؛ فهو أى القانون المقضى بعدم دستوريته يتوقف من هذه اللحظة عن أن يشكل جزءاً من الكيان أو النظام القانونى بالمجتمع هذا من ناحية ومن ناحية أخرى، فإنه يتضح من النص سالف الذكر، أن إلغاء القانون أو المع��هدة الدولية بمقتضى الحكم بعدم الدستورية لا يسرى بأثر رجعى، وإنما بأثر فورى من تاريخ صدوره ، وهو ما يتعارض فى حقيقة الأمر مع ما ينبغى أن يكون الأصل فى هذا الشأن وهو الأثر الرجعى، ذلك أن إبطال نص لعدم الدستورية ليس صفة عارضة تلحقه، ولا هو بعنصر جديد يضاف إليه، وإنما هو كاشف لحالته التى كان عليها ابتداء عند صدوره أو إقراره ،</code> |
|
| 364 |
+
| <code>ما هي الشروط والإجراءات المطلوبة لإنشاء منشآت على الشواطئ البحرية في جمهورية مصر العربية؟</code> | <code>وحظر القرار ضمن مواده الترخيص بإقامة أي منشآت علي الشواطئ البحرية لجمهورية مصر العربية لمسافة 200 متر إلي الداخل من خط الشاطئ، أو إقامة هذه المنشآت إلا بعد موافقة الهيئة المصرية العامة لحماية الشواطئ وجهاز شئون البيئة ويتبع في شأن الترخيص بإقامة تلك المنشآت بوجه خاص، أن يقدم الطلب كتابة إلي الجهة المانحة للترخيص، موضحاً فيه نوعية المنشأة داخل مناطق الحظر علي أن يرفق بالطلب دراسة متكاملة عن تقويم التأثير البيئي للمشروع أو الأعمال المستجدة المطلوب تنفيذها، بما في ذلك تأثيرها علي الاتزان البيئي للمنطقة الساحلية وعلي خط الشاطئ، وعلي عدد من العناصر أهمها النحر والإرساب والتيارات الساحلية والتلوث الناجم</code> |
|
| 365 |
+
* Loss: [<code>MatryoshkaLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#matryoshkaloss) with these parameters:
|
| 366 |
+
```json
|
| 367 |
+
{
|
| 368 |
+
"loss": "MultipleNegativesRankingLoss",
|
| 369 |
+
"matryoshka_dims": [
|
| 370 |
+
768,
|
| 371 |
+
512,
|
| 372 |
+
256,
|
| 373 |
+
128,
|
| 374 |
+
64
|
| 375 |
+
],
|
| 376 |
+
"matryoshka_weights": [
|
| 377 |
+
1,
|
| 378 |
+
1,
|
| 379 |
+
1,
|
| 380 |
+
1,
|
| 381 |
+
1
|
| 382 |
+
],
|
| 383 |
+
"n_dims_per_step": -1
|
| 384 |
+
}
|
| 385 |
+
```
|
| 386 |
+
|
| 387 |
+
### Evaluation Dataset
|
| 388 |
+
|
| 389 |
+
#### Unnamed Dataset
|
| 390 |
+
|
| 391 |
+
* Size: 2,025 evaluation samples
|
| 392 |
+
* Columns: <code>question</code> and <code>context</code>
|
| 393 |
+
* Approximate statistics based on the first 1000 samples:
|
| 394 |
+
| | question | context |
|
| 395 |
+
|:--------|:----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
|
| 396 |
+
| type | string | string |
|
| 397 |
+
| details | <ul><li>min: 8 tokens</li><li>mean: 16.24 tokens</li><li>max: 38 tokens</li></ul> | <ul><li>min: 76 tokens</li><li>mean: 125.61 tokens</li><li>max: 186 tokens</li></ul> |
|
| 398 |
+
* Samples:
|
| 399 |
+
| question | context |
|
| 400 |
+
|:--------------------------------------------------------------------------------------------------------------------------------|:--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
|
| 401 |
+
| <code>ما هي نسبة الأغلبية المطلوبة في الحالات التي تترتب عليها حقوق إضافية في التصويت أو توزيعات الأرباح أو عند التصفية؟</code> | <code>بأغلبية لا تقل عن ثلاثة أرباع رأس المال، أو بأغلبية أكبر في الحالات الآتية 1 إذا ترتبت على الاتفاق حُقُوق إضافية في التصويت أو توزيعات الأرباح أو عند التصفية 2 إذا كان الاتفاق ينطبق عليه ضوابط عقود المعاوضة 3 إذا كان العقد يضع ضوابط أو قيودًا على التعامل على الأَسْهُم أو على إدارة الشَّرِكَة 246 علی عکس المُشَرِّعِ الجزائري الذي نص في المَادَّة 715 المکرر علی أن المُسَاهِم إذا لم يسدد قيمة الأَسْهُم فهو لم يشارك في تكوين رَأسمَال الشَّرِكَة وبالتالي ليس له الحق في المشاركة فِي الجَمْعِيَّةِ العَامَّة أي إن المُسَاهِم يوقف حقه في التصويت كإجراء عقابي؛ وذلك لعدم تحرير الحصة</code> |
|
| 402 |
+
| <code>ما هو المظهر الخارجي للقرار الإداري وما هي آثار عدم اتباع الشكل المحدد قانوناً؟</code> | <code>القرار المظهر الخارجي الذي تبدو أو تتجسد فيه إرادة الإدارة أو المظهر الذي يتضمن ما أفصحت به الإدارة عن إرادتها وترتيباً علي ذلك إذا لم يكن المشرع قد ألزم الإدارة بضرورة إفراغ إرادتها في شكل معين فإنه يكون لها وهذا هو الأصل مطلق الحرية في كيفية التعبير عن هذه الإرادة ١ أما إذا نص القانون علي ضرورة إتباع شكل معين كأن يتطلب مثلاً أن يأخذ القرار شكلاً مكتوبا ففي هذه الحالة يتحتم علي رجل الإدارة ضرورة الالتزام بذلك وإلا كان قراره معيباً باطلاً وكان بالتالي جديراً بالإلغاء وإذا كان الأصل أن الإدارة ليست ملزمة بتسبيب قراراتها أي بذكر أسباب قراراتها إذ يفترض دائماً أن هذه القرارات</code> |
|
| 403 |
+
| <code>ما هي الميزات التي يتمتع بها صاحب الحق العيني التبعي في القانون الكويتي؟</code> | <code>أو الإجرائية في التنفيذ، وصاحب الحق العيني التبعي يتمتع بميزتي التتبع والتقدم أو الأولوية 205 نقض مدني 9 يناير 1939 مجموعة عمر 2 158 ، مشار إليه في فتحي والي ، التنفيذ الجبري في القانون الكويتي ، ص 87 هامش 5 206 استئناف مختلف 5 فبراير 1929 بيلتان 41 198 ، مشار إليه في فتحي والي ، مرجع سابق، ص 87 ، هامش 6 207 أحمد هندي وسيد أحمد محمود وعبدالستار الملا، التنفيذ الجبري في القانون الكويتي، قواعده وإجراءاته، الجزء الأول 2000 ، ص 418 بند 85 208 فتحي والي ، التنفيذ الجبري الكويتي ، ص 87 فنسان وبريفوليه ، طرق التنفيذ وإجراءات التوزيع ، ط 15 ، داللوز 1984 ، ص 57 ، بند 70 209 وجدي راغب ، النظرية العامة للتنفيذ القضائي ، ص 264 ، محمد عبدالخالق عمر ، مبادئ التنفيذ ، ص 189 210</code> |
|
| 404 |
+
* Loss: [<code>MatryoshkaLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#matryoshkaloss) with these parameters:
|
| 405 |
+
```json
|
| 406 |
+
{
|
| 407 |
+
"loss": "MultipleNegativesRankingLoss",
|
| 408 |
+
"matryoshka_dims": [
|
| 409 |
+
768,
|
| 410 |
+
512,
|
| 411 |
+
256,
|
| 412 |
+
128,
|
| 413 |
+
64
|
| 414 |
+
],
|
| 415 |
+
"matryoshka_weights": [
|
| 416 |
+
1,
|
| 417 |
+
1,
|
| 418 |
+
1,
|
| 419 |
+
1,
|
| 420 |
+
1
|
| 421 |
+
],
|
| 422 |
+
"n_dims_per_step": -1
|
| 423 |
+
}
|
| 424 |
+
```
|
| 425 |
+
|
| 426 |
+
### Training Hyperparameters
|
| 427 |
+
#### Non-Default Hyperparameters
|
| 428 |
+
|
| 429 |
+
- `eval_strategy`: steps
|
| 430 |
+
- `per_device_train_batch_size`: 16
|
| 431 |
+
- `per_device_eval_batch_size`: 16
|
| 432 |
+
- `learning_rate`: 2e-05
|
| 433 |
+
- `warmup_ratio`: 0.1
|
| 434 |
+
- `batch_sampler`: no_duplicates
|
| 435 |
+
|
| 436 |
+
#### All Hyperparameters
|
| 437 |
+
<details><summary>Click to expand</summary>
|
| 438 |
+
|
| 439 |
+
- `overwrite_output_dir`: False
|
| 440 |
+
- `do_predict`: False
|
| 441 |
+
- `eval_strategy`: steps
|
| 442 |
+
- `prediction_loss_only`: True
|
| 443 |
+
- `per_device_train_batch_size`: 16
|
| 444 |
+
- `per_device_eval_batch_size`: 16
|
| 445 |
+
- `per_gpu_train_batch_size`: None
|
| 446 |
+
- `per_gpu_eval_batch_size`: None
|
| 447 |
+
- `gradient_accumulation_steps`: 1
|
| 448 |
+
- `eval_accumulation_steps`: None
|
| 449 |
+
- `torch_empty_cache_steps`: None
|
| 450 |
+
- `learning_rate`: 2e-05
|
| 451 |
+
- `weight_decay`: 0.0
|
| 452 |
+
- `adam_beta1`: 0.9
|
| 453 |
+
- `adam_beta2`: 0.999
|
| 454 |
+
- `adam_epsilon`: 1e-08
|
| 455 |
+
- `max_grad_norm`: 1.0
|
| 456 |
+
- `num_train_epochs`: 3
|
| 457 |
+
- `max_steps`: -1
|
| 458 |
+
- `lr_scheduler_type`: linear
|
| 459 |
+
- `lr_scheduler_kwargs`: {}
|
| 460 |
+
- `warmup_ratio`: 0.1
|
| 461 |
+
- `warmup_steps`: 0
|
| 462 |
+
- `log_level`: passive
|
| 463 |
+
- `log_level_replica`: warning
|
| 464 |
+
- `log_on_each_node`: True
|
| 465 |
+
- `logging_nan_inf_filter`: True
|
| 466 |
+
- `save_safetensors`: True
|
| 467 |
+
- `save_on_each_node`: False
|
| 468 |
+
- `save_only_model`: False
|
| 469 |
+
- `restore_callback_states_from_checkpoint`: False
|
| 470 |
+
- `no_cuda`: False
|
| 471 |
+
- `use_cpu`: False
|
| 472 |
+
- `use_mps_device`: False
|
| 473 |
+
- `seed`: 42
|
| 474 |
+
- `data_seed`: None
|
| 475 |
+
- `jit_mode_eval`: False
|
| 476 |
+
- `use_ipex`: False
|
| 477 |
+
- `bf16`: False
|
| 478 |
+
- `fp16`: False
|
| 479 |
+
- `fp16_opt_level`: O1
|
| 480 |
+
- `half_precision_backend`: auto
|
| 481 |
+
- `bf16_full_eval`: False
|
| 482 |
+
- `fp16_full_eval`: False
|
| 483 |
+
- `tf32`: None
|
| 484 |
+
- `local_rank`: 0
|
| 485 |
+
- `ddp_backend`: None
|
| 486 |
+
- `tpu_num_cores`: None
|
| 487 |
+
- `tpu_metrics_debug`: False
|
| 488 |
+
- `debug`: []
|
| 489 |
+
- `dataloader_drop_last`: False
|
| 490 |
+
- `dataloader_num_workers`: 0
|
| 491 |
+
- `dataloader_prefetch_factor`: None
|
| 492 |
+
- `past_index`: -1
|
| 493 |
+
- `disable_tqdm`: False
|
| 494 |
+
- `remove_unused_columns`: True
|
| 495 |
+
- `label_names`: None
|
| 496 |
+
- `load_best_model_at_end`: False
|
| 497 |
+
- `ignore_data_skip`: False
|
| 498 |
+
- `fsdp`: []
|
| 499 |
+
- `fsdp_min_num_params`: 0
|
| 500 |
+
- `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
|
| 501 |
+
- `fsdp_transformer_layer_cls_to_wrap`: None
|
| 502 |
+
- `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
|
| 503 |
+
- `deepspeed`: None
|
| 504 |
+
- `label_smoothing_factor`: 0.0
|
| 505 |
+
- `optim`: adamw_torch
|
| 506 |
+
- `optim_args`: None
|
| 507 |
+
- `adafactor`: False
|
| 508 |
+
- `group_by_length`: False
|
| 509 |
+
- `length_column_name`: length
|
| 510 |
+
- `ddp_find_unused_parameters`: None
|
| 511 |
+
- `ddp_bucket_cap_mb`: None
|
| 512 |
+
- `ddp_broadcast_buffers`: False
|
| 513 |
+
- `dataloader_pin_memory`: True
|
| 514 |
+
- `dataloader_persistent_workers`: False
|
| 515 |
+
- `skip_memory_metrics`: True
|
| 516 |
+
- `use_legacy_prediction_loop`: False
|
| 517 |
+
- `push_to_hub`: False
|
| 518 |
+
- `resume_from_checkpoint`: None
|
| 519 |
+
- `hub_model_id`: None
|
| 520 |
+
- `hub_strategy`: every_save
|
| 521 |
+
- `hub_private_repo`: None
|
| 522 |
+
- `hub_always_push`: False
|
| 523 |
+
- `gradient_checkpointing`: False
|
| 524 |
+
- `gradient_checkpointing_kwargs`: None
|
| 525 |
+
- `include_inputs_for_metrics`: False
|
| 526 |
+
- `include_for_metrics`: []
|
| 527 |
+
- `eval_do_concat_batches`: True
|
| 528 |
+
- `fp16_backend`: auto
|
| 529 |
+
- `push_to_hub_model_id`: None
|
| 530 |
+
- `push_to_hub_organization`: None
|
| 531 |
+
- `mp_parameters`:
|
| 532 |
+
- `auto_find_batch_size`: False
|
| 533 |
+
- `full_determinism`: False
|
| 534 |
+
- `torchdynamo`: None
|
| 535 |
+
- `ray_scope`: last
|
| 536 |
+
- `ddp_timeout`: 1800
|
| 537 |
+
- `torch_compile`: False
|
| 538 |
+
- `torch_compile_backend`: None
|
| 539 |
+
- `torch_compile_mode`: None
|
| 540 |
+
- `dispatch_batches`: None
|
| 541 |
+
- `split_batches`: None
|
| 542 |
+
- `include_tokens_per_second`: False
|
| 543 |
+
- `include_num_input_tokens_seen`: False
|
| 544 |
+
- `neftune_noise_alpha`: None
|
| 545 |
+
- `optim_target_modules`: None
|
| 546 |
+
- `batch_eval_metrics`: False
|
| 547 |
+
- `eval_on_start`: False
|
| 548 |
+
- `use_liger_kernel`: False
|
| 549 |
+
- `eval_use_gather_object`: False
|
| 550 |
+
- `average_tokens_across_devices`: False
|
| 551 |
+
- `prompts`: None
|
| 552 |
+
- `batch_sampler`: no_duplicates
|
| 553 |
+
- `multi_dataset_batch_sampler`: proportional
|
| 554 |
+
|
| 555 |
+
</details>
|
| 556 |
+
|
| 557 |
+
### Training Logs
|
| 558 |
+
| Epoch | Step | Training Loss | Validation Loss | custom_dataset_evaluation_cosine_ndcg@10 |
|
| 559 |
+
|:------:|:----:|:-------------:|:---------------:|:----------------------------------------:|
|
| 560 |
+
| -1 | -1 | - | - | 0.6198 |
|
| 561 |
+
| 0.0987 | 100 | 0.4785 | 0.4484 | 0.6508 |
|
| 562 |
+
| 0.1974 | 200 | 0.4112 | 0.3707 | 0.6739 |
|
| 563 |
+
| 0.2962 | 300 | 0.2838 | 0.3282 | 0.6920 |
|
| 564 |
+
| 0.3949 | 400 | 0.2422 | 0.2887 | 0.7051 |
|
| 565 |
+
| 0.4936 | 500 | 0.2369 | 0.2837 | 0.7144 |
|
| 566 |
+
| 0.5923 | 600 | 0.2899 | 0.2684 | 0.7232 |
|
| 567 |
+
| 0.6910 | 700 | 0.1801 | 0.2665 | 0.7320 |
|
| 568 |
+
| 0.7897 | 800 | 0.2279 | 0.2617 | 0.7299 |
|
| 569 |
+
| 0.8885 | 900 | 0.2051 | 0.2683 | 0.7334 |
|
| 570 |
+
| 0.9872 | 1000 | 0.2097 | 0.2445 | 0.7417 |
|
| 571 |
+
| 1.0859 | 1100 | 0.1047 | 0.2397 | 0.7467 |
|
| 572 |
+
| 1.1846 | 1200 | 0.0984 | 0.2229 | 0.7558 |
|
| 573 |
+
| 1.2833 | 1300 | 0.0498 | 0.2587 | 0.7433 |
|
| 574 |
+
| 1.3820 | 1400 | 0.0993 | 0.2147 | 0.7568 |
|
| 575 |
+
| 1.4808 | 1500 | 0.0621 | 0.2045 | 0.7617 |
|
| 576 |
+
| 1.5795 | 1600 | 0.0922 | 0.2054 | 0.7601 |
|
| 577 |
+
| 1.6782 | 1700 | 0.1093 | 0.1993 | 0.7678 |
|
| 578 |
+
| 1.7769 | 1800 | 0.0795 | 0.1943 | 0.7712 |
|
| 579 |
+
| 1.8756 | 1900 | 0.1181 | 0.2066 | 0.7701 |
|
| 580 |
+
| 1.9743 | 2000 | 0.0709 | 0.2000 | 0.7699 |
|
| 581 |
+
| 2.0731 | 2100 | 0.0423 | 0.1928 | 0.7793 |
|
| 582 |
+
| 2.1718 | 2200 | 0.0365 | 0.2017 | 0.7797 |
|
| 583 |
+
| 2.2705 | 2300 | 0.0488 | 0.2220 | 0.7714 |
|
| 584 |
+
| 2.3692 | 2400 | 0.0405 | 0.2090 | 0.7775 |
|
| 585 |
+
| 2.4679 | 2500 | 0.0327 | 0.1960 | 0.7822 |
|
| 586 |
+
| 2.5666 | 2600 | 0.0369 | 0.1985 | 0.7827 |
|
| 587 |
+
| 2.6654 | 2700 | 0.0493 | 0.1987 | 0.7848 |
|
| 588 |
+
| 2.7641 | 2800 | 0.0466 | 0.2008 | 0.7856 |
|
| 589 |
+
| 2.8628 | 2900 | 0.03 | 0.2035 | 0.7847 |
|
| 590 |
+
| 2.9615 | 3000 | 0.0633 | 0.2036 | 0.7849 |
|
| 591 |
+
|
| 592 |
+
|
| 593 |
+
### Framework Versions
|
| 594 |
+
- Python: 3.11.11
|
| 595 |
+
- Sentence Transformers: 3.4.1
|
| 596 |
+
- Transformers: 4.48.3
|
| 597 |
+
- PyTorch: 2.5.1+cu124
|
| 598 |
+
- Accelerate: 1.3.0
|
| 599 |
+
- Datasets: 3.3.0
|
| 600 |
+
- Tokenizers: 0.21.0
|
| 601 |
+
|
| 602 |
+
## Citation
|
| 603 |
+
|
| 604 |
+
### BibTeX
|
| 605 |
+
|
| 606 |
+
#### Sentence Transformers
|
| 607 |
+
```bibtex
|
| 608 |
+
@inproceedings{reimers-2019-sentence-bert,
|
| 609 |
+
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
|
| 610 |
+
author = "Reimers, Nils and Gurevych, Iryna",
|
| 611 |
+
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
|
| 612 |
+
month = "11",
|
| 613 |
+
year = "2019",
|
| 614 |
+
publisher = "Association for Computational Linguistics",
|
| 615 |
+
url = "https://arxiv.org/abs/1908.10084",
|
| 616 |
+
}
|
| 617 |
+
```
|
| 618 |
+
|
| 619 |
+
#### MatryoshkaLoss
|
| 620 |
+
```bibtex
|
| 621 |
+
@misc{kusupati2024matryoshka,
|
| 622 |
+
title={Matryoshka Representation Learning},
|
| 623 |
+
author={Aditya Kusupati and Gantavya Bhatt and Aniket Rege and Matthew Wallingford and Aditya Sinha and Vivek Ramanujan and William Howard-Snyder and Kaifeng Chen and Sham Kakade and Prateek Jain and Ali Farhadi},
|
| 624 |
+
year={2024},
|
| 625 |
+
eprint={2205.13147},
|
| 626 |
+
archivePrefix={arXiv},
|
| 627 |
+
primaryClass={cs.LG}
|
| 628 |
+
}
|
| 629 |
+
```
|
| 630 |
+
|
| 631 |
+
#### MultipleNegativesRankingLoss
|
| 632 |
+
```bibtex
|
| 633 |
+
@misc{henderson2017efficient,
|
| 634 |
+
title={Efficient Natural Language Response Suggestion for Smart Reply},
|
| 635 |
+
author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
|
| 636 |
+
year={2017},
|
| 637 |
+
eprint={1705.00652},
|
| 638 |
+
archivePrefix={arXiv},
|
| 639 |
+
primaryClass={cs.CL}
|
| 640 |
+
}
|
| 641 |
+
```
|
| 642 |
+
|
| 643 |
+
<!--
|
| 644 |
+
## Glossary
|
| 645 |
+
|
| 646 |
+
*Clearly define terms in order to be accessible across audiences.*
|
| 647 |
+
-->
|
| 648 |
+
|
| 649 |
+
<!--
|
| 650 |
+
## Model Card Authors
|
| 651 |
+
|
| 652 |
+
*Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
|
| 653 |
+
-->
|
| 654 |
+
|
| 655 |
+
<!--
|
| 656 |
+
## Model Card Contact
|
| 657 |
+
|
| 658 |
+
*Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
|
| 659 |
+
-->
|
config.json
ADDED
|
@@ -0,0 +1,25 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
{
|
| 2 |
+
"_name_or_path": "Omartificial-Intelligence-Space/Arabic-Triplet-Matryoshka-V2",
|
| 3 |
+
"architectures": [
|
| 4 |
+
"BertModel"
|
| 5 |
+
],
|
| 6 |
+
"attention_probs_dropout_prob": 0.1,
|
| 7 |
+
"classifier_dropout": null,
|
| 8 |
+
"hidden_act": "gelu",
|
| 9 |
+
"hidden_dropout_prob": 0.1,
|
| 10 |
+
"hidden_size": 768,
|
| 11 |
+
"initializer_range": 0.02,
|
| 12 |
+
"intermediate_size": 3072,
|
| 13 |
+
"layer_norm_eps": 1e-12,
|
| 14 |
+
"max_position_embeddings": 512,
|
| 15 |
+
"model_type": "bert",
|
| 16 |
+
"num_attention_heads": 12,
|
| 17 |
+
"num_hidden_layers": 12,
|
| 18 |
+
"pad_token_id": 0,
|
| 19 |
+
"position_embedding_type": "absolute",
|
| 20 |
+
"torch_dtype": "float32",
|
| 21 |
+
"transformers_version": "4.48.3",
|
| 22 |
+
"type_vocab_size": 2,
|
| 23 |
+
"use_cache": true,
|
| 24 |
+
"vocab_size": 64000
|
| 25 |
+
}
|
config_sentence_transformers.json
ADDED
|
@@ -0,0 +1,10 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
{
|
| 2 |
+
"__version__": {
|
| 3 |
+
"sentence_transformers": "3.4.1",
|
| 4 |
+
"transformers": "4.48.3",
|
| 5 |
+
"pytorch": "2.5.1+cu124"
|
| 6 |
+
},
|
| 7 |
+
"prompts": {},
|
| 8 |
+
"default_prompt_name": null,
|
| 9 |
+
"similarity_fn_name": "cosine"
|
| 10 |
+
}
|
model.safetensors
ADDED
|
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
version https://git-lfs.github.com/spec/v1
|
| 2 |
+
oid sha256:1d3cb7fbea2b8516ed27c3727e81e5635a0885cff8660dd4ea3c2bf1fed3d7c3
|
| 3 |
+
size 540795752
|
modules.json
ADDED
|
@@ -0,0 +1,14 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
[
|
| 2 |
+
{
|
| 3 |
+
"idx": 0,
|
| 4 |
+
"name": "0",
|
| 5 |
+
"path": "",
|
| 6 |
+
"type": "sentence_transformers.models.Transformer"
|
| 7 |
+
},
|
| 8 |
+
{
|
| 9 |
+
"idx": 1,
|
| 10 |
+
"name": "1",
|
| 11 |
+
"path": "1_Pooling",
|
| 12 |
+
"type": "sentence_transformers.models.Pooling"
|
| 13 |
+
}
|
| 14 |
+
]
|
optimizer.pt
ADDED
|
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
version https://git-lfs.github.com/spec/v1
|
| 2 |
+
oid sha256:31928a059b5d3b0110bb75c7a76e9722bb115c2d252e29ff75599855ff1497d2
|
| 3 |
+
size 1076986810
|
rng_state.pth
ADDED
|
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
version https://git-lfs.github.com/spec/v1
|
| 2 |
+
oid sha256:2954a4ece94a8e003c67b5e30b040e264e73a9861675e465f19102d5479446ab
|
| 3 |
+
size 14244
|
scheduler.pt
ADDED
|
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
version https://git-lfs.github.com/spec/v1
|
| 2 |
+
oid sha256:d2da84600df310c80e3ddbaf08c14bbafd7477428303afb008dbfa763b281711
|
| 3 |
+
size 1064
|
sentence_bert_config.json
ADDED
|
@@ -0,0 +1,4 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
{
|
| 2 |
+
"max_seq_length": 512,
|
| 3 |
+
"do_lower_case": false
|
| 4 |
+
}
|
special_tokens_map.json
ADDED
|
@@ -0,0 +1,37 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
{
|
| 2 |
+
"cls_token": {
|
| 3 |
+
"content": "[CLS]",
|
| 4 |
+
"lstrip": false,
|
| 5 |
+
"normalized": false,
|
| 6 |
+
"rstrip": false,
|
| 7 |
+
"single_word": false
|
| 8 |
+
},
|
| 9 |
+
"mask_token": {
|
| 10 |
+
"content": "[MASK]",
|
| 11 |
+
"lstrip": false,
|
| 12 |
+
"normalized": false,
|
| 13 |
+
"rstrip": false,
|
| 14 |
+
"single_word": false
|
| 15 |
+
},
|
| 16 |
+
"pad_token": {
|
| 17 |
+
"content": "[PAD]",
|
| 18 |
+
"lstrip": false,
|
| 19 |
+
"normalized": false,
|
| 20 |
+
"rstrip": false,
|
| 21 |
+
"single_word": false
|
| 22 |
+
},
|
| 23 |
+
"sep_token": {
|
| 24 |
+
"content": "[SEP]",
|
| 25 |
+
"lstrip": false,
|
| 26 |
+
"normalized": false,
|
| 27 |
+
"rstrip": false,
|
| 28 |
+
"single_word": false
|
| 29 |
+
},
|
| 30 |
+
"unk_token": {
|
| 31 |
+
"content": "[UNK]",
|
| 32 |
+
"lstrip": false,
|
| 33 |
+
"normalized": false,
|
| 34 |
+
"rstrip": false,
|
| 35 |
+
"single_word": false
|
| 36 |
+
}
|
| 37 |
+
}
|
tokenizer.json
ADDED
|
The diff for this file is too large to render.
See raw diff
|
|
|
tokenizer_config.json
ADDED
|
@@ -0,0 +1,94 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
{
|
| 2 |
+
"added_tokens_decoder": {
|
| 3 |
+
"0": {
|
| 4 |
+
"content": "[PAD]",
|
| 5 |
+
"lstrip": false,
|
| 6 |
+
"normalized": false,
|
| 7 |
+
"rstrip": false,
|
| 8 |
+
"single_word": false,
|
| 9 |
+
"special": true
|
| 10 |
+
},
|
| 11 |
+
"1": {
|
| 12 |
+
"content": "[UNK]",
|
| 13 |
+
"lstrip": false,
|
| 14 |
+
"normalized": false,
|
| 15 |
+
"rstrip": false,
|
| 16 |
+
"single_word": false,
|
| 17 |
+
"special": true
|
| 18 |
+
},
|
| 19 |
+
"2": {
|
| 20 |
+
"content": "[CLS]",
|
| 21 |
+
"lstrip": false,
|
| 22 |
+
"normalized": false,
|
| 23 |
+
"rstrip": false,
|
| 24 |
+
"single_word": false,
|
| 25 |
+
"special": true
|
| 26 |
+
},
|
| 27 |
+
"3": {
|
| 28 |
+
"content": "[SEP]",
|
| 29 |
+
"lstrip": false,
|
| 30 |
+
"normalized": false,
|
| 31 |
+
"rstrip": false,
|
| 32 |
+
"single_word": false,
|
| 33 |
+
"special": true
|
| 34 |
+
},
|
| 35 |
+
"4": {
|
| 36 |
+
"content": "[MASK]",
|
| 37 |
+
"lstrip": false,
|
| 38 |
+
"normalized": false,
|
| 39 |
+
"rstrip": false,
|
| 40 |
+
"single_word": false,
|
| 41 |
+
"special": true
|
| 42 |
+
},
|
| 43 |
+
"5": {
|
| 44 |
+
"content": "[رابط]",
|
| 45 |
+
"lstrip": false,
|
| 46 |
+
"normalized": true,
|
| 47 |
+
"rstrip": false,
|
| 48 |
+
"single_word": true,
|
| 49 |
+
"special": true
|
| 50 |
+
},
|
| 51 |
+
"6": {
|
| 52 |
+
"content": "[بريد]",
|
| 53 |
+
"lstrip": false,
|
| 54 |
+
"normalized": true,
|
| 55 |
+
"rstrip": false,
|
| 56 |
+
"single_word": true,
|
| 57 |
+
"special": true
|
| 58 |
+
},
|
| 59 |
+
"7": {
|
| 60 |
+
"content": "[مستخدم]",
|
| 61 |
+
"lstrip": false,
|
| 62 |
+
"normalized": true,
|
| 63 |
+
"rstrip": false,
|
| 64 |
+
"single_word": true,
|
| 65 |
+
"special": true
|
| 66 |
+
}
|
| 67 |
+
},
|
| 68 |
+
"clean_up_tokenization_spaces": true,
|
| 69 |
+
"cls_token": "[CLS]",
|
| 70 |
+
"do_basic_tokenize": true,
|
| 71 |
+
"do_lower_case": false,
|
| 72 |
+
"extra_special_tokens": {},
|
| 73 |
+
"mask_token": "[MASK]",
|
| 74 |
+
"max_len": 512,
|
| 75 |
+
"max_length": 512,
|
| 76 |
+
"model_max_length": 512,
|
| 77 |
+
"never_split": [
|
| 78 |
+
"[بريد]",
|
| 79 |
+
"[مستخدم]",
|
| 80 |
+
"[رابط]"
|
| 81 |
+
],
|
| 82 |
+
"pad_to_multiple_of": null,
|
| 83 |
+
"pad_token": "[PAD]",
|
| 84 |
+
"pad_token_type_id": 0,
|
| 85 |
+
"padding_side": "right",
|
| 86 |
+
"sep_token": "[SEP]",
|
| 87 |
+
"stride": 0,
|
| 88 |
+
"strip_accents": null,
|
| 89 |
+
"tokenize_chinese_chars": true,
|
| 90 |
+
"tokenizer_class": "BertTokenizer",
|
| 91 |
+
"truncation_side": "right",
|
| 92 |
+
"truncation_strategy": "longest_first",
|
| 93 |
+
"unk_token": "[UNK]"
|
| 94 |
+
}
|
trainer_state.json
ADDED
|
@@ -0,0 +1,933 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
{
|
| 2 |
+
"best_metric": null,
|
| 3 |
+
"best_model_checkpoint": null,
|
| 4 |
+
"epoch": 3.0,
|
| 5 |
+
"eval_steps": 100,
|
| 6 |
+
"global_step": 3039,
|
| 7 |
+
"is_hyper_param_search": false,
|
| 8 |
+
"is_local_process_zero": true,
|
| 9 |
+
"is_world_process_zero": true,
|
| 10 |
+
"log_history": [
|
| 11 |
+
{
|
| 12 |
+
"epoch": 0.09871668311944719,
|
| 13 |
+
"grad_norm": 7.595918655395508,
|
| 14 |
+
"learning_rate": 6.578947368421054e-06,
|
| 15 |
+
"loss": 0.4785,
|
| 16 |
+
"step": 100
|
| 17 |
+
},
|
| 18 |
+
{
|
| 19 |
+
"epoch": 0.09871668311944719,
|
| 20 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@1": 0.48153268812956745,
|
| 21 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@10": 0.8239186253209559,
|
| 22 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@3": 0.6804266245309105,
|
| 23 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@5": 0.7476298637171638,
|
| 24 |
+
"eval_custom_dataset_evaluation_cosine_map@100": 0.6014421644194009,
|
| 25 |
+
"eval_custom_dataset_evaluation_cosine_mrr@10": 0.5954963687693909,
|
| 26 |
+
"eval_custom_dataset_evaluation_cosine_ndcg@10": 0.650756003676077,
|
| 27 |
+
"eval_custom_dataset_evaluation_cosine_precision@1": 0.48153268812956745,
|
| 28 |
+
"eval_custom_dataset_evaluation_cosine_precision@10": 0.0823918625320956,
|
| 29 |
+
"eval_custom_dataset_evaluation_cosine_precision@3": 0.22680887484363688,
|
| 30 |
+
"eval_custom_dataset_evaluation_cosine_precision@5": 0.14952597274343274,
|
| 31 |
+
"eval_custom_dataset_evaluation_cosine_recall@1": 0.48153268812956745,
|
| 32 |
+
"eval_custom_dataset_evaluation_cosine_recall@10": 0.8239186253209559,
|
| 33 |
+
"eval_custom_dataset_evaluation_cosine_recall@3": 0.6804266245309105,
|
| 34 |
+
"eval_custom_dataset_evaluation_cosine_recall@5": 0.7476298637171638,
|
| 35 |
+
"eval_loss": 0.4484286308288574,
|
| 36 |
+
"eval_runtime": 204.03,
|
| 37 |
+
"eval_samples_per_second": 9.925,
|
| 38 |
+
"eval_steps_per_second": 0.622,
|
| 39 |
+
"step": 100
|
| 40 |
+
},
|
| 41 |
+
{
|
| 42 |
+
"epoch": 0.19743336623889438,
|
| 43 |
+
"grad_norm": 10.92927074432373,
|
| 44 |
+
"learning_rate": 1.3157894736842108e-05,
|
| 45 |
+
"loss": 0.4112,
|
| 46 |
+
"step": 200
|
| 47 |
+
},
|
| 48 |
+
{
|
| 49 |
+
"epoch": 0.19743336623889438,
|
| 50 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@1": 0.5033083152281256,
|
| 51 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@10": 0.8463855421686747,
|
| 52 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@3": 0.7041279873592732,
|
| 53 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@5": 0.772615050365396,
|
| 54 |
+
"eval_custom_dataset_evaluation_cosine_map@100": 0.624250951720462,
|
| 55 |
+
"eval_custom_dataset_evaluation_cosine_mrr@10": 0.6187061477761295,
|
| 56 |
+
"eval_custom_dataset_evaluation_cosine_ndcg@10": 0.6738741593374042,
|
| 57 |
+
"eval_custom_dataset_evaluation_cosine_precision@1": 0.5033083152281256,
|
| 58 |
+
"eval_custom_dataset_evaluation_cosine_precision@10": 0.08463855421686747,
|
| 59 |
+
"eval_custom_dataset_evaluation_cosine_precision@3": 0.2347093291197577,
|
| 60 |
+
"eval_custom_dataset_evaluation_cosine_precision@5": 0.1545230100730792,
|
| 61 |
+
"eval_custom_dataset_evaluation_cosine_recall@1": 0.5033083152281256,
|
| 62 |
+
"eval_custom_dataset_evaluation_cosine_recall@10": 0.8463855421686747,
|
| 63 |
+
"eval_custom_dataset_evaluation_cosine_recall@3": 0.7041279873592732,
|
| 64 |
+
"eval_custom_dataset_evaluation_cosine_recall@5": 0.772615050365396,
|
| 65 |
+
"eval_loss": 0.3707010746002197,
|
| 66 |
+
"eval_runtime": 203.8165,
|
| 67 |
+
"eval_samples_per_second": 9.935,
|
| 68 |
+
"eval_steps_per_second": 0.623,
|
| 69 |
+
"step": 200
|
| 70 |
+
},
|
| 71 |
+
{
|
| 72 |
+
"epoch": 0.29615004935834155,
|
| 73 |
+
"grad_norm": 33.57826232910156,
|
| 74 |
+
"learning_rate": 1.9736842105263158e-05,
|
| 75 |
+
"loss": 0.2838,
|
| 76 |
+
"step": 300
|
| 77 |
+
},
|
| 78 |
+
{
|
| 79 |
+
"epoch": 0.29615004935834155,
|
| 80 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@1": 0.5243432747382974,
|
| 81 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@10": 0.860655737704918,
|
| 82 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@3": 0.7234841003357693,
|
| 83 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@5": 0.7913292514319573,
|
| 84 |
+
"eval_custom_dataset_evaluation_cosine_map@100": 0.6432678473897245,
|
| 85 |
+
"eval_custom_dataset_evaluation_cosine_mrr@10": 0.6380460561998335,
|
| 86 |
+
"eval_custom_dataset_evaluation_cosine_ndcg@10": 0.6920347683997495,
|
| 87 |
+
"eval_custom_dataset_evaluation_cosine_precision@1": 0.5243432747382974,
|
| 88 |
+
"eval_custom_dataset_evaluation_cosine_precision@10": 0.0860655737704918,
|
| 89 |
+
"eval_custom_dataset_evaluation_cosine_precision@3": 0.24116136677858976,
|
| 90 |
+
"eval_custom_dataset_evaluation_cosine_precision@5": 0.15826585028639148,
|
| 91 |
+
"eval_custom_dataset_evaluation_cosine_recall@1": 0.5243432747382974,
|
| 92 |
+
"eval_custom_dataset_evaluation_cosine_recall@10": 0.860655737704918,
|
| 93 |
+
"eval_custom_dataset_evaluation_cosine_recall@3": 0.7234841003357693,
|
| 94 |
+
"eval_custom_dataset_evaluation_cosine_recall@5": 0.7913292514319573,
|
| 95 |
+
"eval_loss": 0.32815688848495483,
|
| 96 |
+
"eval_runtime": 203.3881,
|
| 97 |
+
"eval_samples_per_second": 9.956,
|
| 98 |
+
"eval_steps_per_second": 0.624,
|
| 99 |
+
"step": 300
|
| 100 |
+
},
|
| 101 |
+
{
|
| 102 |
+
"epoch": 0.39486673247778875,
|
| 103 |
+
"grad_norm": 2.814175605773926,
|
| 104 |
+
"learning_rate": 1.9297989031078612e-05,
|
| 105 |
+
"loss": 0.2422,
|
| 106 |
+
"step": 400
|
| 107 |
+
},
|
| 108 |
+
{
|
| 109 |
+
"epoch": 0.39486673247778875,
|
| 110 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@1": 0.5371321350977681,
|
| 111 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@10": 0.8726051747975508,
|
| 112 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@3": 0.7371123839620778,
|
| 113 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@5": 0.8044143788267826,
|
| 114 |
+
"eval_custom_dataset_evaluation_cosine_map@100": 0.6563831674366017,
|
| 115 |
+
"eval_custom_dataset_evaluation_cosine_mrr@10": 0.6514166541262787,
|
| 116 |
+
"eval_custom_dataset_evaluation_cosine_ndcg@10": 0.7051169138321652,
|
| 117 |
+
"eval_custom_dataset_evaluation_cosine_precision@1": 0.5371321350977681,
|
| 118 |
+
"eval_custom_dataset_evaluation_cosine_precision@10": 0.08726051747975509,
|
| 119 |
+
"eval_custom_dataset_evaluation_cosine_precision@3": 0.24570412798735927,
|
| 120 |
+
"eval_custom_dataset_evaluation_cosine_precision@5": 0.1608828757653565,
|
| 121 |
+
"eval_custom_dataset_evaluation_cosine_recall@1": 0.5371321350977681,
|
| 122 |
+
"eval_custom_dataset_evaluation_cosine_recall@10": 0.8726051747975508,
|
| 123 |
+
"eval_custom_dataset_evaluation_cosine_recall@3": 0.7371123839620778,
|
| 124 |
+
"eval_custom_dataset_evaluation_cosine_recall@5": 0.8044143788267826,
|
| 125 |
+
"eval_loss": 0.28870803117752075,
|
| 126 |
+
"eval_runtime": 203.6125,
|
| 127 |
+
"eval_samples_per_second": 9.945,
|
| 128 |
+
"eval_steps_per_second": 0.624,
|
| 129 |
+
"step": 400
|
| 130 |
+
},
|
| 131 |
+
{
|
| 132 |
+
"epoch": 0.49358341559723595,
|
| 133 |
+
"grad_norm": 7.553986072540283,
|
| 134 |
+
"learning_rate": 1.856672760511883e-05,
|
| 135 |
+
"loss": 0.2369,
|
| 136 |
+
"step": 500
|
| 137 |
+
},
|
| 138 |
+
{
|
| 139 |
+
"epoch": 0.49358341559723595,
|
| 140 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@1": 0.5465139245506616,
|
| 141 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@10": 0.8817894528935414,
|
| 142 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@3": 0.7465929290934229,
|
| 143 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@5": 0.8143393245111594,
|
| 144 |
+
"eval_custom_dataset_evaluation_cosine_map@100": 0.6652980546980072,
|
| 145 |
+
"eval_custom_dataset_evaluation_cosine_mrr@10": 0.6607006284309909,
|
| 146 |
+
"eval_custom_dataset_evaluation_cosine_ndcg@10": 0.714385034123883,
|
| 147 |
+
"eval_custom_dataset_evaluation_cosine_precision@1": 0.5465139245506616,
|
| 148 |
+
"eval_custom_dataset_evaluation_cosine_precision@10": 0.08817894528935415,
|
| 149 |
+
"eval_custom_dataset_evaluation_cosine_precision@3": 0.24886430969780762,
|
| 150 |
+
"eval_custom_dataset_evaluation_cosine_precision@5": 0.16286786490223187,
|
| 151 |
+
"eval_custom_dataset_evaluation_cosine_recall@1": 0.5465139245506616,
|
| 152 |
+
"eval_custom_dataset_evaluation_cosine_recall@10": 0.8817894528935414,
|
| 153 |
+
"eval_custom_dataset_evaluation_cosine_recall@3": 0.7465929290934229,
|
| 154 |
+
"eval_custom_dataset_evaluation_cosine_recall@5": 0.8143393245111594,
|
| 155 |
+
"eval_loss": 0.28374621272087097,
|
| 156 |
+
"eval_runtime": 204.4559,
|
| 157 |
+
"eval_samples_per_second": 9.904,
|
| 158 |
+
"eval_steps_per_second": 0.621,
|
| 159 |
+
"step": 500
|
| 160 |
+
},
|
| 161 |
+
{
|
| 162 |
+
"epoch": 0.5923000987166831,
|
| 163 |
+
"grad_norm": 32.98969268798828,
|
| 164 |
+
"learning_rate": 1.783546617915905e-05,
|
| 165 |
+
"loss": 0.2899,
|
| 166 |
+
"step": 600
|
| 167 |
+
},
|
| 168 |
+
{
|
| 169 |
+
"epoch": 0.5923000987166831,
|
| 170 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@1": 0.5526367766146554,
|
| 171 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@10": 0.8908749753110804,
|
| 172 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@3": 0.7583448548291527,
|
| 173 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@5": 0.8260912502468892,
|
| 174 |
+
"eval_custom_dataset_evaluation_cosine_map@100": 0.6738304576911812,
|
| 175 |
+
"eval_custom_dataset_evaluation_cosine_mrr@10": 0.669296996730104,
|
| 176 |
+
"eval_custom_dataset_evaluation_cosine_ndcg@10": 0.7232271970632966,
|
| 177 |
+
"eval_custom_dataset_evaluation_cosine_precision@1": 0.5526367766146554,
|
| 178 |
+
"eval_custom_dataset_evaluation_cosine_precision@10": 0.08908749753110803,
|
| 179 |
+
"eval_custom_dataset_evaluation_cosine_precision@3": 0.25278161827638423,
|
| 180 |
+
"eval_custom_dataset_evaluation_cosine_precision@5": 0.16521825004937787,
|
| 181 |
+
"eval_custom_dataset_evaluation_cosine_recall@1": 0.5526367766146554,
|
| 182 |
+
"eval_custom_dataset_evaluation_cosine_recall@10": 0.8908749753110804,
|
| 183 |
+
"eval_custom_dataset_evaluation_cosine_recall@3": 0.7583448548291527,
|
| 184 |
+
"eval_custom_dataset_evaluation_cosine_recall@5": 0.8260912502468892,
|
| 185 |
+
"eval_loss": 0.26842400431632996,
|
| 186 |
+
"eval_runtime": 203.2737,
|
| 187 |
+
"eval_samples_per_second": 9.962,
|
| 188 |
+
"eval_steps_per_second": 0.625,
|
| 189 |
+
"step": 600
|
| 190 |
+
},
|
| 191 |
+
{
|
| 192 |
+
"epoch": 0.6910167818361304,
|
| 193 |
+
"grad_norm": 9.886919021606445,
|
| 194 |
+
"learning_rate": 1.710420475319927e-05,
|
| 195 |
+
"loss": 0.1801,
|
| 196 |
+
"step": 700
|
| 197 |
+
},
|
| 198 |
+
{
|
| 199 |
+
"epoch": 0.6910167818361304,
|
| 200 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@1": 0.5653268812956745,
|
| 201 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@10": 0.8955164921983014,
|
| 202 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@3": 0.7669365988544341,
|
| 203 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@5": 0.8332510369346238,
|
| 204 |
+
"eval_custom_dataset_evaluation_cosine_map@100": 0.683737510172223,
|
| 205 |
+
"eval_custom_dataset_evaluation_cosine_mrr@10": 0.6793955094382355,
|
| 206 |
+
"eval_custom_dataset_evaluation_cosine_ndcg@10": 0.7320247334733945,
|
| 207 |
+
"eval_custom_dataset_evaluation_cosine_precision@1": 0.5653268812956745,
|
| 208 |
+
"eval_custom_dataset_evaluation_cosine_precision@10": 0.08955164921983014,
|
| 209 |
+
"eval_custom_dataset_evaluation_cosine_precision@3": 0.255645532951478,
|
| 210 |
+
"eval_custom_dataset_evaluation_cosine_precision@5": 0.16665020738692476,
|
| 211 |
+
"eval_custom_dataset_evaluation_cosine_recall@1": 0.5653268812956745,
|
| 212 |
+
"eval_custom_dataset_evaluation_cosine_recall@10": 0.8955164921983014,
|
| 213 |
+
"eval_custom_dataset_evaluation_cosine_recall@3": 0.7669365988544341,
|
| 214 |
+
"eval_custom_dataset_evaluation_cosine_recall@5": 0.8332510369346238,
|
| 215 |
+
"eval_loss": 0.2664617896080017,
|
| 216 |
+
"eval_runtime": 203.9076,
|
| 217 |
+
"eval_samples_per_second": 9.931,
|
| 218 |
+
"eval_steps_per_second": 0.623,
|
| 219 |
+
"step": 700
|
| 220 |
+
},
|
| 221 |
+
{
|
| 222 |
+
"epoch": 0.7897334649555775,
|
| 223 |
+
"grad_norm": 17.79576873779297,
|
| 224 |
+
"learning_rate": 1.637294332723949e-05,
|
| 225 |
+
"loss": 0.2279,
|
| 226 |
+
"step": 800
|
| 227 |
+
},
|
| 228 |
+
{
|
| 229 |
+
"epoch": 0.7897334649555775,
|
| 230 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@1": 0.5654256369741261,
|
| 231 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@10": 0.8918131542563698,
|
| 232 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@3": 0.7636282836263085,
|
| 233 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@5": 0.8272763183883073,
|
| 234 |
+
"eval_custom_dataset_evaluation_cosine_map@100": 0.6824116708533701,
|
| 235 |
+
"eval_custom_dataset_evaluation_cosine_mrr@10": 0.6777940607081065,
|
| 236 |
+
"eval_custom_dataset_evaluation_cosine_ndcg@10": 0.7298590424609255,
|
| 237 |
+
"eval_custom_dataset_evaluation_cosine_precision@1": 0.5654256369741261,
|
| 238 |
+
"eval_custom_dataset_evaluation_cosine_precision@10": 0.08918131542563698,
|
| 239 |
+
"eval_custom_dataset_evaluation_cosine_precision@3": 0.2545427612087695,
|
| 240 |
+
"eval_custom_dataset_evaluation_cosine_precision@5": 0.16545526367766147,
|
| 241 |
+
"eval_custom_dataset_evaluation_cosine_recall@1": 0.5654256369741261,
|
| 242 |
+
"eval_custom_dataset_evaluation_cosine_recall@10": 0.8918131542563698,
|
| 243 |
+
"eval_custom_dataset_evaluation_cosine_recall@3": 0.7636282836263085,
|
| 244 |
+
"eval_custom_dataset_evaluation_cosine_recall@5": 0.8272763183883073,
|
| 245 |
+
"eval_loss": 0.2617240250110626,
|
| 246 |
+
"eval_runtime": 203.217,
|
| 247 |
+
"eval_samples_per_second": 9.965,
|
| 248 |
+
"eval_steps_per_second": 0.625,
|
| 249 |
+
"step": 800
|
| 250 |
+
},
|
| 251 |
+
{
|
| 252 |
+
"epoch": 0.8884501480750246,
|
| 253 |
+
"grad_norm": 29.348552703857422,
|
| 254 |
+
"learning_rate": 1.564168190127971e-05,
|
| 255 |
+
"loss": 0.2051,
|
| 256 |
+
"step": 900
|
| 257 |
+
},
|
| 258 |
+
{
|
| 259 |
+
"epoch": 0.8884501480750246,
|
| 260 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@1": 0.5677463954177365,
|
| 261 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@10": 0.8971953387319771,
|
| 262 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@3": 0.7670353545328856,
|
| 263 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@5": 0.8318190795970768,
|
| 264 |
+
"eval_custom_dataset_evaluation_cosine_map@100": 0.6851778091536691,
|
| 265 |
+
"eval_custom_dataset_evaluation_cosine_mrr@10": 0.6808611691104925,
|
| 266 |
+
"eval_custom_dataset_evaluation_cosine_ndcg@10": 0.7334481505960582,
|
| 267 |
+
"eval_custom_dataset_evaluation_cosine_precision@1": 0.5677463954177365,
|
| 268 |
+
"eval_custom_dataset_evaluation_cosine_precision@10": 0.08971953387319773,
|
| 269 |
+
"eval_custom_dataset_evaluation_cosine_precision@3": 0.25567845151096186,
|
| 270 |
+
"eval_custom_dataset_evaluation_cosine_precision@5": 0.16636381591941535,
|
| 271 |
+
"eval_custom_dataset_evaluation_cosine_recall@1": 0.5677463954177365,
|
| 272 |
+
"eval_custom_dataset_evaluation_cosine_recall@10": 0.8971953387319771,
|
| 273 |
+
"eval_custom_dataset_evaluation_cosine_recall@3": 0.7670353545328856,
|
| 274 |
+
"eval_custom_dataset_evaluation_cosine_recall@5": 0.8318190795970768,
|
| 275 |
+
"eval_loss": 0.26834186911582947,
|
| 276 |
+
"eval_runtime": 203.4633,
|
| 277 |
+
"eval_samples_per_second": 9.953,
|
| 278 |
+
"eval_steps_per_second": 0.624,
|
| 279 |
+
"step": 900
|
| 280 |
+
},
|
| 281 |
+
{
|
| 282 |
+
"epoch": 0.9871668311944719,
|
| 283 |
+
"grad_norm": 0.5696656703948975,
|
| 284 |
+
"learning_rate": 1.491042047531993e-05,
|
| 285 |
+
"loss": 0.2097,
|
| 286 |
+
"step": 1000
|
| 287 |
+
},
|
| 288 |
+
{
|
| 289 |
+
"epoch": 0.9871668311944719,
|
| 290 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@1": 0.5728323128579893,
|
| 291 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@10": 0.9064783725064192,
|
| 292 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@3": 0.7784910132332609,
|
| 293 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@5": 0.8429290934228718,
|
| 294 |
+
"eval_custom_dataset_evaluation_cosine_map@100": 0.692767963880535,
|
| 295 |
+
"eval_custom_dataset_evaluation_cosine_mrr@10": 0.6886411963231704,
|
| 296 |
+
"eval_custom_dataset_evaluation_cosine_ndcg@10": 0.741697294005231,
|
| 297 |
+
"eval_custom_dataset_evaluation_cosine_precision@1": 0.5728323128579893,
|
| 298 |
+
"eval_custom_dataset_evaluation_cosine_precision@10": 0.09064783725064192,
|
| 299 |
+
"eval_custom_dataset_evaluation_cosine_precision@3": 0.259497004411087,
|
| 300 |
+
"eval_custom_dataset_evaluation_cosine_precision@5": 0.1685858186845744,
|
| 301 |
+
"eval_custom_dataset_evaluation_cosine_recall@1": 0.5728323128579893,
|
| 302 |
+
"eval_custom_dataset_evaluation_cosine_recall@10": 0.9064783725064192,
|
| 303 |
+
"eval_custom_dataset_evaluation_cosine_recall@3": 0.7784910132332609,
|
| 304 |
+
"eval_custom_dataset_evaluation_cosine_recall@5": 0.8429290934228718,
|
| 305 |
+
"eval_loss": 0.2445395439863205,
|
| 306 |
+
"eval_runtime": 203.8284,
|
| 307 |
+
"eval_samples_per_second": 9.935,
|
| 308 |
+
"eval_steps_per_second": 0.623,
|
| 309 |
+
"step": 1000
|
| 310 |
+
},
|
| 311 |
+
{
|
| 312 |
+
"epoch": 1.085883514313919,
|
| 313 |
+
"grad_norm": 5.538768291473389,
|
| 314 |
+
"learning_rate": 1.4179159049360148e-05,
|
| 315 |
+
"loss": 0.1047,
|
| 316 |
+
"step": 1100
|
| 317 |
+
},
|
| 318 |
+
{
|
| 319 |
+
"epoch": 1.085883514313919,
|
| 320 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@1": 0.5813253012048193,
|
| 321 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@10": 0.9092435315030615,
|
| 322 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@3": 0.7825399960497729,
|
| 323 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@5": 0.8449535848311278,
|
| 324 |
+
"eval_custom_dataset_evaluation_cosine_map@100": 0.6984402538800855,
|
| 325 |
+
"eval_custom_dataset_evaluation_cosine_mrr@10": 0.6944231453526992,
|
| 326 |
+
"eval_custom_dataset_evaluation_cosine_ndcg@10": 0.7466897096167746,
|
| 327 |
+
"eval_custom_dataset_evaluation_cosine_precision@1": 0.5813253012048193,
|
| 328 |
+
"eval_custom_dataset_evaluation_cosine_precision@10": 0.09092435315030614,
|
| 329 |
+
"eval_custom_dataset_evaluation_cosine_precision@3": 0.2608466653499243,
|
| 330 |
+
"eval_custom_dataset_evaluation_cosine_precision@5": 0.16899071696622553,
|
| 331 |
+
"eval_custom_dataset_evaluation_cosine_recall@1": 0.5813253012048193,
|
| 332 |
+
"eval_custom_dataset_evaluation_cosine_recall@10": 0.9092435315030615,
|
| 333 |
+
"eval_custom_dataset_evaluation_cosine_recall@3": 0.7825399960497729,
|
| 334 |
+
"eval_custom_dataset_evaluation_cosine_recall@5": 0.8449535848311278,
|
| 335 |
+
"eval_loss": 0.23973241448402405,
|
| 336 |
+
"eval_runtime": 203.3277,
|
| 337 |
+
"eval_samples_per_second": 9.959,
|
| 338 |
+
"eval_steps_per_second": 0.625,
|
| 339 |
+
"step": 1100
|
| 340 |
+
},
|
| 341 |
+
{
|
| 342 |
+
"epoch": 1.1846001974333662,
|
| 343 |
+
"grad_norm": 6.3217902183532715,
|
| 344 |
+
"learning_rate": 1.3447897623400368e-05,
|
| 345 |
+
"loss": 0.0984,
|
| 346 |
+
"step": 1200
|
| 347 |
+
},
|
| 348 |
+
{
|
| 349 |
+
"epoch": 1.1846001974333662,
|
| 350 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@1": 0.5921390479952597,
|
| 351 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@10": 0.9151688722101521,
|
| 352 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@3": 0.7911317400750543,
|
| 353 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@5": 0.8541378629271184,
|
| 354 |
+
"eval_custom_dataset_evaluation_cosine_map@100": 0.7083777420863926,
|
| 355 |
+
"eval_custom_dataset_evaluation_cosine_mrr@10": 0.7045087061752225,
|
| 356 |
+
"eval_custom_dataset_evaluation_cosine_ndcg@10": 0.755835586028989,
|
| 357 |
+
"eval_custom_dataset_evaluation_cosine_precision@1": 0.5921390479952597,
|
| 358 |
+
"eval_custom_dataset_evaluation_cosine_precision@10": 0.09151688722101521,
|
| 359 |
+
"eval_custom_dataset_evaluation_cosine_precision@3": 0.2637105800250181,
|
| 360 |
+
"eval_custom_dataset_evaluation_cosine_precision@5": 0.1708275725854237,
|
| 361 |
+
"eval_custom_dataset_evaluation_cosine_recall@1": 0.5921390479952597,
|
| 362 |
+
"eval_custom_dataset_evaluation_cosine_recall@10": 0.9151688722101521,
|
| 363 |
+
"eval_custom_dataset_evaluation_cosine_recall@3": 0.7911317400750543,
|
| 364 |
+
"eval_custom_dataset_evaluation_cosine_recall@5": 0.8541378629271184,
|
| 365 |
+
"eval_loss": 0.2229250818490982,
|
| 366 |
+
"eval_runtime": 203.6954,
|
| 367 |
+
"eval_samples_per_second": 9.941,
|
| 368 |
+
"eval_steps_per_second": 0.623,
|
| 369 |
+
"step": 1200
|
| 370 |
+
},
|
| 371 |
+
{
|
| 372 |
+
"epoch": 1.2833168805528135,
|
| 373 |
+
"grad_norm": 11.505134582519531,
|
| 374 |
+
"learning_rate": 1.2716636197440586e-05,
|
| 375 |
+
"loss": 0.0498,
|
| 376 |
+
"step": 1300
|
| 377 |
+
},
|
| 378 |
+
{
|
| 379 |
+
"epoch": 1.2833168805528135,
|
| 380 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@1": 0.5782638751728224,
|
| 381 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@10": 0.9055895714003556,
|
| 382 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@3": 0.7789354137862927,
|
| 383 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@5": 0.8386825992494569,
|
| 384 |
+
"eval_custom_dataset_evaluation_cosine_map@100": 0.6954513367155198,
|
| 385 |
+
"eval_custom_dataset_evaluation_cosine_mrr@10": 0.6912109797503966,
|
| 386 |
+
"eval_custom_dataset_evaluation_cosine_ndcg@10": 0.7433337553688117,
|
| 387 |
+
"eval_custom_dataset_evaluation_cosine_precision@1": 0.5782638751728224,
|
| 388 |
+
"eval_custom_dataset_evaluation_cosine_precision@10": 0.09055895714003556,
|
| 389 |
+
"eval_custom_dataset_evaluation_cosine_precision@3": 0.2596451379287642,
|
| 390 |
+
"eval_custom_dataset_evaluation_cosine_precision@5": 0.16773651984989138,
|
| 391 |
+
"eval_custom_dataset_evaluation_cosine_recall@1": 0.5782638751728224,
|
| 392 |
+
"eval_custom_dataset_evaluation_cosine_recall@10": 0.9055895714003556,
|
| 393 |
+
"eval_custom_dataset_evaluation_cosine_recall@3": 0.7789354137862927,
|
| 394 |
+
"eval_custom_dataset_evaluation_cosine_recall@5": 0.8386825992494569,
|
| 395 |
+
"eval_loss": 0.2586788237094879,
|
| 396 |
+
"eval_runtime": 204.0885,
|
| 397 |
+
"eval_samples_per_second": 9.922,
|
| 398 |
+
"eval_steps_per_second": 0.622,
|
| 399 |
+
"step": 1300
|
| 400 |
+
},
|
| 401 |
+
{
|
| 402 |
+
"epoch": 1.3820335636722607,
|
| 403 |
+
"grad_norm": 1.1614787578582764,
|
| 404 |
+
"learning_rate": 1.1985374771480804e-05,
|
| 405 |
+
"loss": 0.0993,
|
| 406 |
+
"step": 1400
|
| 407 |
+
},
|
| 408 |
+
{
|
| 409 |
+
"epoch": 1.3820335636722607,
|
| 410 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@1": 0.59411416156429,
|
| 411 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@10": 0.9151194943709263,
|
| 412 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@3": 0.7925636974126012,
|
| 413 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@5": 0.8543353742840213,
|
| 414 |
+
"eval_custom_dataset_evaluation_cosine_map@100": 0.7096847447019631,
|
| 415 |
+
"eval_custom_dataset_evaluation_cosine_mrr@10": 0.705814299351989,
|
| 416 |
+
"eval_custom_dataset_evaluation_cosine_ndcg@10": 0.7568020206373794,
|
| 417 |
+
"eval_custom_dataset_evaluation_cosine_precision@1": 0.59411416156429,
|
| 418 |
+
"eval_custom_dataset_evaluation_cosine_precision@10": 0.09151194943709264,
|
| 419 |
+
"eval_custom_dataset_evaluation_cosine_precision@3": 0.2641878991375337,
|
| 420 |
+
"eval_custom_dataset_evaluation_cosine_precision@5": 0.17086707485680427,
|
| 421 |
+
"eval_custom_dataset_evaluation_cosine_recall@1": 0.59411416156429,
|
| 422 |
+
"eval_custom_dataset_evaluation_cosine_recall@10": 0.9151194943709263,
|
| 423 |
+
"eval_custom_dataset_evaluation_cosine_recall@3": 0.7925636974126012,
|
| 424 |
+
"eval_custom_dataset_evaluation_cosine_recall@5": 0.8543353742840213,
|
| 425 |
+
"eval_loss": 0.2147156298160553,
|
| 426 |
+
"eval_runtime": 204.4732,
|
| 427 |
+
"eval_samples_per_second": 9.903,
|
| 428 |
+
"eval_steps_per_second": 0.621,
|
| 429 |
+
"step": 1400
|
| 430 |
+
},
|
| 431 |
+
{
|
| 432 |
+
"epoch": 1.4807502467917077,
|
| 433 |
+
"grad_norm": 1.6429851055145264,
|
| 434 |
+
"learning_rate": 1.1254113345521024e-05,
|
| 435 |
+
"loss": 0.0621,
|
| 436 |
+
"step": 1500
|
| 437 |
+
},
|
| 438 |
+
{
|
| 439 |
+
"epoch": 1.4807502467917077,
|
| 440 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@1": 0.5962867864902232,
|
| 441 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@10": 0.9217855026664034,
|
| 442 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@3": 0.7997234841003358,
|
| 443 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@5": 0.860853249061821,
|
| 444 |
+
"eval_custom_dataset_evaluation_cosine_map@100": 0.7136002941229976,
|
| 445 |
+
"eval_custom_dataset_evaluation_cosine_mrr@10": 0.7100783500904636,
|
| 446 |
+
"eval_custom_dataset_evaluation_cosine_ndcg@10": 0.7616828218263099,
|
| 447 |
+
"eval_custom_dataset_evaluation_cosine_precision@1": 0.5962867864902232,
|
| 448 |
+
"eval_custom_dataset_evaluation_cosine_precision@10": 0.09217855026664035,
|
| 449 |
+
"eval_custom_dataset_evaluation_cosine_precision@3": 0.2665744947001119,
|
| 450 |
+
"eval_custom_dataset_evaluation_cosine_precision@5": 0.1721706498123642,
|
| 451 |
+
"eval_custom_dataset_evaluation_cosine_recall@1": 0.5962867864902232,
|
| 452 |
+
"eval_custom_dataset_evaluation_cosine_recall@10": 0.9217855026664034,
|
| 453 |
+
"eval_custom_dataset_evaluation_cosine_recall@3": 0.7997234841003358,
|
| 454 |
+
"eval_custom_dataset_evaluation_cosine_recall@5": 0.860853249061821,
|
| 455 |
+
"eval_loss": 0.20447228848934174,
|
| 456 |
+
"eval_runtime": 204.051,
|
| 457 |
+
"eval_samples_per_second": 9.924,
|
| 458 |
+
"eval_steps_per_second": 0.622,
|
| 459 |
+
"step": 1500
|
| 460 |
+
},
|
| 461 |
+
{
|
| 462 |
+
"epoch": 1.579466929911155,
|
| 463 |
+
"grad_norm": 15.424310684204102,
|
| 464 |
+
"learning_rate": 1.0522851919561243e-05,
|
| 465 |
+
"loss": 0.0922,
|
| 466 |
+
"step": 1600
|
| 467 |
+
},
|
| 468 |
+
{
|
| 469 |
+
"epoch": 1.579466929911155,
|
| 470 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@1": 0.5950029626703536,
|
| 471 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@10": 0.9201560339719533,
|
| 472 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@3": 0.7980446375666601,
|
| 473 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@5": 0.858038712225953,
|
| 474 |
+
"eval_custom_dataset_evaluation_cosine_map@100": 0.7121969229630567,
|
| 475 |
+
"eval_custom_dataset_evaluation_cosine_mrr@10": 0.7085377027234775,
|
| 476 |
+
"eval_custom_dataset_evaluation_cosine_ndcg@10": 0.7601050276866773,
|
| 477 |
+
"eval_custom_dataset_evaluation_cosine_precision@1": 0.5950029626703536,
|
| 478 |
+
"eval_custom_dataset_evaluation_cosine_precision@10": 0.09201560339719535,
|
| 479 |
+
"eval_custom_dataset_evaluation_cosine_precision@3": 0.26601487918888667,
|
| 480 |
+
"eval_custom_dataset_evaluation_cosine_precision@5": 0.17160774244519061,
|
| 481 |
+
"eval_custom_dataset_evaluation_cosine_recall@1": 0.5950029626703536,
|
| 482 |
+
"eval_custom_dataset_evaluation_cosine_recall@10": 0.9201560339719533,
|
| 483 |
+
"eval_custom_dataset_evaluation_cosine_recall@3": 0.7980446375666601,
|
| 484 |
+
"eval_custom_dataset_evaluation_cosine_recall@5": 0.858038712225953,
|
| 485 |
+
"eval_loss": 0.20542284846305847,
|
| 486 |
+
"eval_runtime": 203.1105,
|
| 487 |
+
"eval_samples_per_second": 9.97,
|
| 488 |
+
"eval_steps_per_second": 0.625,
|
| 489 |
+
"step": 1600
|
| 490 |
+
},
|
| 491 |
+
{
|
| 492 |
+
"epoch": 1.678183613030602,
|
| 493 |
+
"grad_norm": 4.0268096923828125,
|
| 494 |
+
"learning_rate": 9.791590493601464e-06,
|
| 495 |
+
"loss": 0.1093,
|
| 496 |
+
"step": 1700
|
| 497 |
+
},
|
| 498 |
+
{
|
| 499 |
+
"epoch": 1.678183613030602,
|
| 500 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@1": 0.6026071499111199,
|
| 501 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@10": 0.9248469286984001,
|
| 502 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@3": 0.8095496741062611,
|
| 503 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@5": 0.8681117914280071,
|
| 504 |
+
"eval_custom_dataset_evaluation_cosine_map@100": 0.7204789219182511,
|
| 505 |
+
"eval_custom_dataset_evaluation_cosine_mrr@10": 0.7169305441908291,
|
| 506 |
+
"eval_custom_dataset_evaluation_cosine_ndcg@10": 0.7677587208908659,
|
| 507 |
+
"eval_custom_dataset_evaluation_cosine_precision@1": 0.6026071499111199,
|
| 508 |
+
"eval_custom_dataset_evaluation_cosine_precision@10": 0.09248469286984001,
|
| 509 |
+
"eval_custom_dataset_evaluation_cosine_precision@3": 0.26984989136875365,
|
| 510 |
+
"eval_custom_dataset_evaluation_cosine_precision@5": 0.1736223582856014,
|
| 511 |
+
"eval_custom_dataset_evaluation_cosine_recall@1": 0.6026071499111199,
|
| 512 |
+
"eval_custom_dataset_evaluation_cosine_recall@10": 0.9248469286984001,
|
| 513 |
+
"eval_custom_dataset_evaluation_cosine_recall@3": 0.8095496741062611,
|
| 514 |
+
"eval_custom_dataset_evaluation_cosine_recall@5": 0.8681117914280071,
|
| 515 |
+
"eval_loss": 0.1992715299129486,
|
| 516 |
+
"eval_runtime": 203.9449,
|
| 517 |
+
"eval_samples_per_second": 9.929,
|
| 518 |
+
"eval_steps_per_second": 0.623,
|
| 519 |
+
"step": 1700
|
| 520 |
+
},
|
| 521 |
+
{
|
| 522 |
+
"epoch": 1.7769002961500493,
|
| 523 |
+
"grad_norm": 0.6978006958961487,
|
| 524 |
+
"learning_rate": 9.060329067641682e-06,
|
| 525 |
+
"loss": 0.0795,
|
| 526 |
+
"step": 1800
|
| 527 |
+
},
|
| 528 |
+
{
|
| 529 |
+
"epoch": 1.7769002961500493,
|
| 530 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@1": 0.605816709460794,
|
| 531 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@10": 0.9286984001580091,
|
| 532 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@3": 0.8117222990321944,
|
| 533 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@5": 0.8722101520837449,
|
| 534 |
+
"eval_custom_dataset_evaluation_cosine_map@100": 0.7237388658743508,
|
| 535 |
+
"eval_custom_dataset_evaluation_cosine_mrr@10": 0.7203004837460861,
|
| 536 |
+
"eval_custom_dataset_evaluation_cosine_ndcg@10": 0.7712328450315743,
|
| 537 |
+
"eval_custom_dataset_evaluation_cosine_precision@1": 0.605816709460794,
|
| 538 |
+
"eval_custom_dataset_evaluation_cosine_precision@10": 0.09286984001580093,
|
| 539 |
+
"eval_custom_dataset_evaluation_cosine_precision@3": 0.2705740996773981,
|
| 540 |
+
"eval_custom_dataset_evaluation_cosine_precision@5": 0.17444203041674897,
|
| 541 |
+
"eval_custom_dataset_evaluation_cosine_recall@1": 0.605816709460794,
|
| 542 |
+
"eval_custom_dataset_evaluation_cosine_recall@10": 0.9286984001580091,
|
| 543 |
+
"eval_custom_dataset_evaluation_cosine_recall@3": 0.8117222990321944,
|
| 544 |
+
"eval_custom_dataset_evaluation_cosine_recall@5": 0.8722101520837449,
|
| 545 |
+
"eval_loss": 0.19426828622817993,
|
| 546 |
+
"eval_runtime": 204.0488,
|
| 547 |
+
"eval_samples_per_second": 9.924,
|
| 548 |
+
"eval_steps_per_second": 0.622,
|
| 549 |
+
"step": 1800
|
| 550 |
+
},
|
| 551 |
+
{
|
| 552 |
+
"epoch": 1.8756169792694966,
|
| 553 |
+
"grad_norm": 2.5955662727355957,
|
| 554 |
+
"learning_rate": 8.329067641681902e-06,
|
| 555 |
+
"loss": 0.1181,
|
| 556 |
+
"step": 1900
|
| 557 |
+
},
|
| 558 |
+
{
|
| 559 |
+
"epoch": 1.8756169792694966,
|
| 560 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@1": 0.6043353742840213,
|
| 561 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@10": 0.9297847126209757,
|
| 562 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@3": 0.8089077621963263,
|
| 563 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@5": 0.8701362828362631,
|
| 564 |
+
"eval_custom_dataset_evaluation_cosine_map@100": 0.7219374022367849,
|
| 565 |
+
"eval_custom_dataset_evaluation_cosine_mrr@10": 0.7185761194661708,
|
| 566 |
+
"eval_custom_dataset_evaluation_cosine_ndcg@10": 0.7700958544922684,
|
| 567 |
+
"eval_custom_dataset_evaluation_cosine_precision@1": 0.6043353742840213,
|
| 568 |
+
"eval_custom_dataset_evaluation_cosine_precision@10": 0.09297847126209759,
|
| 569 |
+
"eval_custom_dataset_evaluation_cosine_precision@3": 0.2696359207321088,
|
| 570 |
+
"eval_custom_dataset_evaluation_cosine_precision@5": 0.17402725656725263,
|
| 571 |
+
"eval_custom_dataset_evaluation_cosine_recall@1": 0.6043353742840213,
|
| 572 |
+
"eval_custom_dataset_evaluation_cosine_recall@10": 0.9297847126209757,
|
| 573 |
+
"eval_custom_dataset_evaluation_cosine_recall@3": 0.8089077621963263,
|
| 574 |
+
"eval_custom_dataset_evaluation_cosine_recall@5": 0.8701362828362631,
|
| 575 |
+
"eval_loss": 0.20659147202968597,
|
| 576 |
+
"eval_runtime": 204.0716,
|
| 577 |
+
"eval_samples_per_second": 9.923,
|
| 578 |
+
"eval_steps_per_second": 0.622,
|
| 579 |
+
"step": 1900
|
| 580 |
+
},
|
| 581 |
+
{
|
| 582 |
+
"epoch": 1.9743336623889438,
|
| 583 |
+
"grad_norm": 0.8803901672363281,
|
| 584 |
+
"learning_rate": 7.597806215722121e-06,
|
| 585 |
+
"loss": 0.0709,
|
| 586 |
+
"step": 2000
|
| 587 |
+
},
|
| 588 |
+
{
|
| 589 |
+
"epoch": 1.9743336623889438,
|
| 590 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@1": 0.603199683981829,
|
| 591 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@10": 0.9302784910132332,
|
| 592 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@3": 0.8102903416946474,
|
| 593 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@5": 0.8703831720323919,
|
| 594 |
+
"eval_custom_dataset_evaluation_cosine_map@100": 0.7214873578820934,
|
| 595 |
+
"eval_custom_dataset_evaluation_cosine_mrr@10": 0.7181931668908422,
|
| 596 |
+
"eval_custom_dataset_evaluation_cosine_ndcg@10": 0.7699451899898953,
|
| 597 |
+
"eval_custom_dataset_evaluation_cosine_precision@1": 0.603199683981829,
|
| 598 |
+
"eval_custom_dataset_evaluation_cosine_precision@10": 0.09302784910132333,
|
| 599 |
+
"eval_custom_dataset_evaluation_cosine_precision@3": 0.27009678056488245,
|
| 600 |
+
"eval_custom_dataset_evaluation_cosine_precision@5": 0.1740766344064784,
|
| 601 |
+
"eval_custom_dataset_evaluation_cosine_recall@1": 0.603199683981829,
|
| 602 |
+
"eval_custom_dataset_evaluation_cosine_recall@10": 0.9302784910132332,
|
| 603 |
+
"eval_custom_dataset_evaluation_cosine_recall@3": 0.8102903416946474,
|
| 604 |
+
"eval_custom_dataset_evaluation_cosine_recall@5": 0.8703831720323919,
|
| 605 |
+
"eval_loss": 0.19996753334999084,
|
| 606 |
+
"eval_runtime": 203.9747,
|
| 607 |
+
"eval_samples_per_second": 9.928,
|
| 608 |
+
"eval_steps_per_second": 0.623,
|
| 609 |
+
"step": 2000
|
| 610 |
+
},
|
| 611 |
+
{
|
| 612 |
+
"epoch": 2.073050345508391,
|
| 613 |
+
"grad_norm": 0.9776083827018738,
|
| 614 |
+
"learning_rate": 6.866544789762341e-06,
|
| 615 |
+
"loss": 0.0423,
|
| 616 |
+
"step": 2100
|
| 617 |
+
},
|
| 618 |
+
{
|
| 619 |
+
"epoch": 2.073050345508391,
|
| 620 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@1": 0.6150503653960103,
|
| 621 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@10": 0.9359075646849694,
|
| 622 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@3": 0.8209065771281848,
|
| 623 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@5": 0.8796168279676081,
|
| 624 |
+
"eval_custom_dataset_evaluation_cosine_map@100": 0.7317976394363255,
|
| 625 |
+
"eval_custom_dataset_evaluation_cosine_mrr@10": 0.728681000348013,
|
| 626 |
+
"eval_custom_dataset_evaluation_cosine_ndcg@10": 0.7793256141306921,
|
| 627 |
+
"eval_custom_dataset_evaluation_cosine_precision@1": 0.6150503653960103,
|
| 628 |
+
"eval_custom_dataset_evaluation_cosine_precision@10": 0.09359075646849695,
|
| 629 |
+
"eval_custom_dataset_evaluation_cosine_precision@3": 0.27363552570939487,
|
| 630 |
+
"eval_custom_dataset_evaluation_cosine_precision@5": 0.17592336559352165,
|
| 631 |
+
"eval_custom_dataset_evaluation_cosine_recall@1": 0.6150503653960103,
|
| 632 |
+
"eval_custom_dataset_evaluation_cosine_recall@10": 0.9359075646849694,
|
| 633 |
+
"eval_custom_dataset_evaluation_cosine_recall@3": 0.8209065771281848,
|
| 634 |
+
"eval_custom_dataset_evaluation_cosine_recall@5": 0.8796168279676081,
|
| 635 |
+
"eval_loss": 0.19277189671993256,
|
| 636 |
+
"eval_runtime": 203.5377,
|
| 637 |
+
"eval_samples_per_second": 9.949,
|
| 638 |
+
"eval_steps_per_second": 0.624,
|
| 639 |
+
"step": 2100
|
| 640 |
+
},
|
| 641 |
+
{
|
| 642 |
+
"epoch": 2.171767028627838,
|
| 643 |
+
"grad_norm": 0.3466501235961914,
|
| 644 |
+
"learning_rate": 6.13528336380256e-06,
|
| 645 |
+
"loss": 0.0365,
|
| 646 |
+
"step": 2200
|
| 647 |
+
},
|
| 648 |
+
{
|
| 649 |
+
"epoch": 2.171767028627838,
|
| 650 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@1": 0.6160379221805253,
|
| 651 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@10": 0.9352162749358088,
|
| 652 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@3": 0.8210547106458621,
|
| 653 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@5": 0.8787280268615445,
|
| 654 |
+
"eval_custom_dataset_evaluation_cosine_map@100": 0.7324401240286031,
|
| 655 |
+
"eval_custom_dataset_evaluation_cosine_mrr@10": 0.7293587895689079,
|
| 656 |
+
"eval_custom_dataset_evaluation_cosine_ndcg@10": 0.7796830803735836,
|
| 657 |
+
"eval_custom_dataset_evaluation_cosine_precision@1": 0.6160379221805253,
|
| 658 |
+
"eval_custom_dataset_evaluation_cosine_precision@10": 0.0935216274935809,
|
| 659 |
+
"eval_custom_dataset_evaluation_cosine_precision@3": 0.2736849035486207,
|
| 660 |
+
"eval_custom_dataset_evaluation_cosine_precision@5": 0.17574560537230893,
|
| 661 |
+
"eval_custom_dataset_evaluation_cosine_recall@1": 0.6160379221805253,
|
| 662 |
+
"eval_custom_dataset_evaluation_cosine_recall@10": 0.9352162749358088,
|
| 663 |
+
"eval_custom_dataset_evaluation_cosine_recall@3": 0.8210547106458621,
|
| 664 |
+
"eval_custom_dataset_evaluation_cosine_recall@5": 0.8787280268615445,
|
| 665 |
+
"eval_loss": 0.2016632854938507,
|
| 666 |
+
"eval_runtime": 203.3562,
|
| 667 |
+
"eval_samples_per_second": 9.958,
|
| 668 |
+
"eval_steps_per_second": 0.625,
|
| 669 |
+
"step": 2200
|
| 670 |
+
},
|
| 671 |
+
{
|
| 672 |
+
"epoch": 2.270483711747285,
|
| 673 |
+
"grad_norm": 11.319628715515137,
|
| 674 |
+
"learning_rate": 5.40402193784278e-06,
|
| 675 |
+
"loss": 0.0488,
|
| 676 |
+
"step": 2300
|
| 677 |
+
},
|
| 678 |
+
{
|
| 679 |
+
"epoch": 2.270483711747285,
|
| 680 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@1": 0.6060635986569227,
|
| 681 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@10": 0.9303772466916848,
|
| 682 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@3": 0.810784120086905,
|
| 683 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@5": 0.8715188623345842,
|
| 684 |
+
"eval_custom_dataset_evaluation_cosine_map@100": 0.7233919610739875,
|
| 685 |
+
"eval_custom_dataset_evaluation_cosine_mrr@10": 0.7200670950782208,
|
| 686 |
+
"eval_custom_dataset_evaluation_cosine_ndcg@10": 0.7713978686997449,
|
| 687 |
+
"eval_custom_dataset_evaluation_cosine_precision@1": 0.6060635986569227,
|
| 688 |
+
"eval_custom_dataset_evaluation_cosine_precision@10": 0.09303772466916849,
|
| 689 |
+
"eval_custom_dataset_evaluation_cosine_precision@3": 0.27026137336230166,
|
| 690 |
+
"eval_custom_dataset_evaluation_cosine_precision@5": 0.17430377246691683,
|
| 691 |
+
"eval_custom_dataset_evaluation_cosine_recall@1": 0.6060635986569227,
|
| 692 |
+
"eval_custom_dataset_evaluation_cosine_recall@10": 0.9303772466916848,
|
| 693 |
+
"eval_custom_dataset_evaluation_cosine_recall@3": 0.810784120086905,
|
| 694 |
+
"eval_custom_dataset_evaluation_cosine_recall@5": 0.8715188623345842,
|
| 695 |
+
"eval_loss": 0.2220190316438675,
|
| 696 |
+
"eval_runtime": 203.7981,
|
| 697 |
+
"eval_samples_per_second": 9.936,
|
| 698 |
+
"eval_steps_per_second": 0.623,
|
| 699 |
+
"step": 2300
|
| 700 |
+
},
|
| 701 |
+
{
|
| 702 |
+
"epoch": 2.3692003948667324,
|
| 703 |
+
"grad_norm": 1.2127763032913208,
|
| 704 |
+
"learning_rate": 4.672760511882998e-06,
|
| 705 |
+
"loss": 0.0405,
|
| 706 |
+
"step": 2400
|
| 707 |
+
},
|
| 708 |
+
{
|
| 709 |
+
"epoch": 2.3692003948667324,
|
| 710 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@1": 0.612482717756271,
|
| 711 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@10": 0.9345249851866483,
|
| 712 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@3": 0.8190302192376062,
|
| 713 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@5": 0.8769010468101915,
|
| 714 |
+
"eval_custom_dataset_evaluation_cosine_map@100": 0.7299302543873705,
|
| 715 |
+
"eval_custom_dataset_evaluation_cosine_mrr@10": 0.7267631415592252,
|
| 716 |
+
"eval_custom_dataset_evaluation_cosine_ndcg@10": 0.7775318729565346,
|
| 717 |
+
"eval_custom_dataset_evaluation_cosine_precision@1": 0.612482717756271,
|
| 718 |
+
"eval_custom_dataset_evaluation_cosine_precision@10": 0.09345249851866484,
|
| 719 |
+
"eval_custom_dataset_evaluation_cosine_precision@3": 0.27301007307920205,
|
| 720 |
+
"eval_custom_dataset_evaluation_cosine_precision@5": 0.17538020936203833,
|
| 721 |
+
"eval_custom_dataset_evaluation_cosine_recall@1": 0.612482717756271,
|
| 722 |
+
"eval_custom_dataset_evaluation_cosine_recall@10": 0.9345249851866483,
|
| 723 |
+
"eval_custom_dataset_evaluation_cosine_recall@3": 0.8190302192376062,
|
| 724 |
+
"eval_custom_dataset_evaluation_cosine_recall@5": 0.8769010468101915,
|
| 725 |
+
"eval_loss": 0.20903073251247406,
|
| 726 |
+
"eval_runtime": 204.2344,
|
| 727 |
+
"eval_samples_per_second": 9.915,
|
| 728 |
+
"eval_steps_per_second": 0.622,
|
| 729 |
+
"step": 2400
|
| 730 |
+
},
|
| 731 |
+
{
|
| 732 |
+
"epoch": 2.4679170779861797,
|
| 733 |
+
"grad_norm": 0.3473336398601532,
|
| 734 |
+
"learning_rate": 3.941499085923218e-06,
|
| 735 |
+
"loss": 0.0327,
|
| 736 |
+
"step": 2500
|
| 737 |
+
},
|
| 738 |
+
{
|
| 739 |
+
"epoch": 2.4679170779861797,
|
| 740 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@1": 0.6181611692672329,
|
| 741 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@10": 0.9379814339324511,
|
| 742 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@3": 0.8215484890381197,
|
| 743 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@5": 0.8832214102310882,
|
| 744 |
+
"eval_custom_dataset_evaluation_cosine_map@100": 0.7347609073841157,
|
| 745 |
+
"eval_custom_dataset_evaluation_cosine_mrr@10": 0.7317605707764854,
|
| 746 |
+
"eval_custom_dataset_evaluation_cosine_ndcg@10": 0.7821769875234544,
|
| 747 |
+
"eval_custom_dataset_evaluation_cosine_precision@1": 0.6181611692672329,
|
| 748 |
+
"eval_custom_dataset_evaluation_cosine_precision@10": 0.09379814339324512,
|
| 749 |
+
"eval_custom_dataset_evaluation_cosine_precision@3": 0.27384949634603983,
|
| 750 |
+
"eval_custom_dataset_evaluation_cosine_precision@5": 0.17664428204621765,
|
| 751 |
+
"eval_custom_dataset_evaluation_cosine_recall@1": 0.6181611692672329,
|
| 752 |
+
"eval_custom_dataset_evaluation_cosine_recall@10": 0.9379814339324511,
|
| 753 |
+
"eval_custom_dataset_evaluation_cosine_recall@3": 0.8215484890381197,
|
| 754 |
+
"eval_custom_dataset_evaluation_cosine_recall@5": 0.8832214102310882,
|
| 755 |
+
"eval_loss": 0.1959671527147293,
|
| 756 |
+
"eval_runtime": 204.2804,
|
| 757 |
+
"eval_samples_per_second": 9.913,
|
| 758 |
+
"eval_steps_per_second": 0.622,
|
| 759 |
+
"step": 2500
|
| 760 |
+
},
|
| 761 |
+
{
|
| 762 |
+
"epoch": 2.566633761105627,
|
| 763 |
+
"grad_norm": 3.084174871444702,
|
| 764 |
+
"learning_rate": 3.210237659963437e-06,
|
| 765 |
+
"loss": 0.0369,
|
| 766 |
+
"step": 2600
|
| 767 |
+
},
|
| 768 |
+
{
|
| 769 |
+
"epoch": 2.566633761105627,
|
| 770 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@1": 0.6188524590163934,
|
| 771 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@10": 0.9379814339324511,
|
| 772 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@3": 0.8248568042662453,
|
| 773 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@5": 0.882678253999605,
|
| 774 |
+
"eval_custom_dataset_evaluation_cosine_map@100": 0.7355447502017791,
|
| 775 |
+
"eval_custom_dataset_evaluation_cosine_mrr@10": 0.7324816047954649,
|
| 776 |
+
"eval_custom_dataset_evaluation_cosine_ndcg@10": 0.7827478877040044,
|
| 777 |
+
"eval_custom_dataset_evaluation_cosine_precision@1": 0.6188524590163934,
|
| 778 |
+
"eval_custom_dataset_evaluation_cosine_precision@10": 0.09379814339324513,
|
| 779 |
+
"eval_custom_dataset_evaluation_cosine_precision@3": 0.2749522680887484,
|
| 780 |
+
"eval_custom_dataset_evaluation_cosine_precision@5": 0.17653565079992103,
|
| 781 |
+
"eval_custom_dataset_evaluation_cosine_recall@1": 0.6188524590163934,
|
| 782 |
+
"eval_custom_dataset_evaluation_cosine_recall@10": 0.9379814339324511,
|
| 783 |
+
"eval_custom_dataset_evaluation_cosine_recall@3": 0.8248568042662453,
|
| 784 |
+
"eval_custom_dataset_evaluation_cosine_recall@5": 0.882678253999605,
|
| 785 |
+
"eval_loss": 0.19852839410305023,
|
| 786 |
+
"eval_runtime": 203.3999,
|
| 787 |
+
"eval_samples_per_second": 9.956,
|
| 788 |
+
"eval_steps_per_second": 0.624,
|
| 789 |
+
"step": 2600
|
| 790 |
+
},
|
| 791 |
+
{
|
| 792 |
+
"epoch": 2.665350444225074,
|
| 793 |
+
"grad_norm": 0.2841149568557739,
|
| 794 |
+
"learning_rate": 2.4789762340036565e-06,
|
| 795 |
+
"loss": 0.0493,
|
| 796 |
+
"step": 2700
|
| 797 |
+
},
|
| 798 |
+
{
|
| 799 |
+
"epoch": 2.665350444225074,
|
| 800 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@1": 0.6227039304760024,
|
| 801 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@10": 0.9392652577523207,
|
| 802 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@3": 0.8246099150701165,
|
| 803 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@5": 0.8839126999802489,
|
| 804 |
+
"eval_custom_dataset_evaluation_cosine_map@100": 0.7377982498848669,
|
| 805 |
+
"eval_custom_dataset_evaluation_cosine_mrr@10": 0.7347973078888687,
|
| 806 |
+
"eval_custom_dataset_evaluation_cosine_ndcg@10": 0.7847760881684369,
|
| 807 |
+
"eval_custom_dataset_evaluation_cosine_precision@1": 0.6227039304760024,
|
| 808 |
+
"eval_custom_dataset_evaluation_cosine_precision@10": 0.0939265257752321,
|
| 809 |
+
"eval_custom_dataset_evaluation_cosine_precision@3": 0.2748699716900388,
|
| 810 |
+
"eval_custom_dataset_evaluation_cosine_precision@5": 0.1767825399960498,
|
| 811 |
+
"eval_custom_dataset_evaluation_cosine_recall@1": 0.6227039304760024,
|
| 812 |
+
"eval_custom_dataset_evaluation_cosine_recall@10": 0.9392652577523207,
|
| 813 |
+
"eval_custom_dataset_evaluation_cosine_recall@3": 0.8246099150701165,
|
| 814 |
+
"eval_custom_dataset_evaluation_cosine_recall@5": 0.8839126999802489,
|
| 815 |
+
"eval_loss": 0.1986970454454422,
|
| 816 |
+
"eval_runtime": 203.1067,
|
| 817 |
+
"eval_samples_per_second": 9.97,
|
| 818 |
+
"eval_steps_per_second": 0.625,
|
| 819 |
+
"step": 2700
|
| 820 |
+
},
|
| 821 |
+
{
|
| 822 |
+
"epoch": 2.7640671273445214,
|
| 823 |
+
"grad_norm": 35.21987533569336,
|
| 824 |
+
"learning_rate": 1.7477148080438758e-06,
|
| 825 |
+
"loss": 0.0466,
|
| 826 |
+
"step": 2800
|
| 827 |
+
},
|
| 828 |
+
{
|
| 829 |
+
"epoch": 2.7640671273445214,
|
| 830 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@1": 0.6232964645467114,
|
| 831 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@10": 0.9393640134307722,
|
| 832 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@3": 0.8262887616037922,
|
| 833 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@5": 0.8854434129962473,
|
| 834 |
+
"eval_custom_dataset_evaluation_cosine_map@100": 0.7388327302504635,
|
| 835 |
+
"eval_custom_dataset_evaluation_cosine_mrr@10": 0.7358363978944812,
|
| 836 |
+
"eval_custom_dataset_evaluation_cosine_ndcg@10": 0.7856277834747031,
|
| 837 |
+
"eval_custom_dataset_evaluation_cosine_precision@1": 0.6232964645467114,
|
| 838 |
+
"eval_custom_dataset_evaluation_cosine_precision@10": 0.09393640134307724,
|
| 839 |
+
"eval_custom_dataset_evaluation_cosine_precision@3": 0.2754295872012641,
|
| 840 |
+
"eval_custom_dataset_evaluation_cosine_precision@5": 0.17708868259924945,
|
| 841 |
+
"eval_custom_dataset_evaluation_cosine_recall@1": 0.6232964645467114,
|
| 842 |
+
"eval_custom_dataset_evaluation_cosine_recall@10": 0.9393640134307722,
|
| 843 |
+
"eval_custom_dataset_evaluation_cosine_recall@3": 0.8262887616037922,
|
| 844 |
+
"eval_custom_dataset_evaluation_cosine_recall@5": 0.8854434129962473,
|
| 845 |
+
"eval_loss": 0.20075508952140808,
|
| 846 |
+
"eval_runtime": 203.5383,
|
| 847 |
+
"eval_samples_per_second": 9.949,
|
| 848 |
+
"eval_steps_per_second": 0.624,
|
| 849 |
+
"step": 2800
|
| 850 |
+
},
|
| 851 |
+
{
|
| 852 |
+
"epoch": 2.8627838104639682,
|
| 853 |
+
"grad_norm": 1.2376320362091064,
|
| 854 |
+
"learning_rate": 1.0164533820840951e-06,
|
| 855 |
+
"loss": 0.03,
|
| 856 |
+
"step": 2900
|
| 857 |
+
},
|
| 858 |
+
{
|
| 859 |
+
"epoch": 2.8627838104639682,
|
| 860 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@1": 0.6220620185660676,
|
| 861 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@10": 0.9396109026269011,
|
| 862 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@3": 0.8248568042662453,
|
| 863 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@5": 0.8844558562117322,
|
| 864 |
+
"eval_custom_dataset_evaluation_cosine_map@100": 0.7376002793094979,
|
| 865 |
+
"eval_custom_dataset_evaluation_cosine_mrr@10": 0.7346429237637674,
|
| 866 |
+
"eval_custom_dataset_evaluation_cosine_ndcg@10": 0.7847496074277119,
|
| 867 |
+
"eval_custom_dataset_evaluation_cosine_precision@1": 0.6220620185660676,
|
| 868 |
+
"eval_custom_dataset_evaluation_cosine_precision@10": 0.09396109026269013,
|
| 869 |
+
"eval_custom_dataset_evaluation_cosine_precision@3": 0.2749522680887484,
|
| 870 |
+
"eval_custom_dataset_evaluation_cosine_precision@5": 0.17689117124234646,
|
| 871 |
+
"eval_custom_dataset_evaluation_cosine_recall@1": 0.6220620185660676,
|
| 872 |
+
"eval_custom_dataset_evaluation_cosine_recall@10": 0.9396109026269011,
|
| 873 |
+
"eval_custom_dataset_evaluation_cosine_recall@3": 0.8248568042662453,
|
| 874 |
+
"eval_custom_dataset_evaluation_cosine_recall@5": 0.8844558562117322,
|
| 875 |
+
"eval_loss": 0.2035462111234665,
|
| 876 |
+
"eval_runtime": 202.781,
|
| 877 |
+
"eval_samples_per_second": 9.986,
|
| 878 |
+
"eval_steps_per_second": 0.626,
|
| 879 |
+
"step": 2900
|
| 880 |
+
},
|
| 881 |
+
{
|
| 882 |
+
"epoch": 2.9615004935834155,
|
| 883 |
+
"grad_norm": 0.5317863821983337,
|
| 884 |
+
"learning_rate": 2.8519195612431445e-07,
|
| 885 |
+
"loss": 0.0633,
|
| 886 |
+
"step": 3000
|
| 887 |
+
},
|
| 888 |
+
{
|
| 889 |
+
"epoch": 2.9615004935834155,
|
| 890 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@1": 0.621963262887616,
|
| 891 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@10": 0.9401046810191586,
|
| 892 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@3": 0.8262393837645665,
|
| 893 |
+
"eval_custom_dataset_evaluation_cosine_accuracy@5": 0.8843077226940549,
|
| 894 |
+
"eval_custom_dataset_evaluation_cosine_map@100": 0.7376242387041089,
|
| 895 |
+
"eval_custom_dataset_evaluation_cosine_mrr@10": 0.7346985522104195,
|
| 896 |
+
"eval_custom_dataset_evaluation_cosine_ndcg@10": 0.7849111131501391,
|
| 897 |
+
"eval_custom_dataset_evaluation_cosine_precision@1": 0.621963262887616,
|
| 898 |
+
"eval_custom_dataset_evaluation_cosine_precision@10": 0.09401046810191586,
|
| 899 |
+
"eval_custom_dataset_evaluation_cosine_precision@3": 0.2754131279215221,
|
| 900 |
+
"eval_custom_dataset_evaluation_cosine_precision@5": 0.17686154453881098,
|
| 901 |
+
"eval_custom_dataset_evaluation_cosine_recall@1": 0.621963262887616,
|
| 902 |
+
"eval_custom_dataset_evaluation_cosine_recall@10": 0.9401046810191586,
|
| 903 |
+
"eval_custom_dataset_evaluation_cosine_recall@3": 0.8262393837645665,
|
| 904 |
+
"eval_custom_dataset_evaluation_cosine_recall@5": 0.8843077226940549,
|
| 905 |
+
"eval_loss": 0.20363624393939972,
|
| 906 |
+
"eval_runtime": 203.946,
|
| 907 |
+
"eval_samples_per_second": 9.929,
|
| 908 |
+
"eval_steps_per_second": 0.623,
|
| 909 |
+
"step": 3000
|
| 910 |
+
}
|
| 911 |
+
],
|
| 912 |
+
"logging_steps": 100,
|
| 913 |
+
"max_steps": 3039,
|
| 914 |
+
"num_input_tokens_seen": 0,
|
| 915 |
+
"num_train_epochs": 3,
|
| 916 |
+
"save_steps": 500,
|
| 917 |
+
"stateful_callbacks": {
|
| 918 |
+
"TrainerControl": {
|
| 919 |
+
"args": {
|
| 920 |
+
"should_epoch_stop": false,
|
| 921 |
+
"should_evaluate": false,
|
| 922 |
+
"should_log": false,
|
| 923 |
+
"should_save": true,
|
| 924 |
+
"should_training_stop": true
|
| 925 |
+
},
|
| 926 |
+
"attributes": {}
|
| 927 |
+
}
|
| 928 |
+
},
|
| 929 |
+
"total_flos": 0.0,
|
| 930 |
+
"train_batch_size": 16,
|
| 931 |
+
"trial_name": null,
|
| 932 |
+
"trial_params": null
|
| 933 |
+
}
|
training_args.bin
ADDED
|
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
version https://git-lfs.github.com/spec/v1
|
| 2 |
+
oid sha256:a94c44eb80a75a6bf64112fe418a0d995105175028bb9a26b141abd8ec356d2e
|
| 3 |
+
size 5560
|
vocab.txt
ADDED
|
The diff for this file is too large to render.
See raw diff
|
|
|