mohamed2811 commited on
Commit
5db55c7
·
verified ·
1 Parent(s): 9de7faf

Upload 16 files

Browse files
1_Pooling/config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "word_embedding_dimension": 768,
3
+ "pooling_mode_cls_token": false,
4
+ "pooling_mode_mean_tokens": true,
5
+ "pooling_mode_max_tokens": false,
6
+ "pooling_mode_mean_sqrt_len_tokens": false,
7
+ "pooling_mode_weightedmean_tokens": false,
8
+ "pooling_mode_lasttoken": false,
9
+ "include_prompt": true
10
+ }
README.md ADDED
@@ -0,0 +1,659 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ tags:
3
+ - sentence-transformers
4
+ - sentence-similarity
5
+ - feature-extraction
6
+ - generated_from_trainer
7
+ - dataset_size:16201
8
+ - loss:MatryoshkaLoss
9
+ - loss:MultipleNegativesRankingLoss
10
+ base_model: Omartificial-Intelligence-Space/Arabic-Triplet-Matryoshka-V2
11
+ widget:
12
+ - source_sentence: ما هو الحكم الشرعي لرهن ملك الغير في العلاقة بين المتعاقدين وفقًا
13
+ للرأي السائد في الفقه المصري؟
14
+ sentences:
15
+ - أعمال تجارية وكذلك عمليات إعادة البيع أو التأجير ثانية تعتبر بدورها أعمالاً تجارية
16
+ أ شروط إعتبار الشراء أو الاستئجار بقصد البيع أو التأجير عملا تجارياً على أي حال،
17
+ وبصرف النظر عن الملاحظتين السابقتين فإنه يشترط لإعتبار الشراء أو الإستئجار بقصد
18
+ البيع أو التأجير عملا تجارياً ثلاثة شروط الأول أن يكون الحصول على الشئ قد تم بطريق
19
+ الشراء أو الإستئجار والثاني أن يقع الشراء أو الإستئجار على منقول ن أما الشرط الثالث
20
+ والأخير فهو قصد إعادة البيع أو التأجير الحصول على ربح الشرط الأول أن يكون هناك
21
+ شراء أو إستئجار لم توضح الفقرات أ،ب من المادة الرابعة من قانون التجارة الجديد
22
+ المقصود بالشراء الذي
23
+ - فإن حق الراهن لا يترتب على العقار إلا من الوقت الذي يصبح فيه هذا العقار مملوكًا
24
+ للراهن وندرس فيما يلي حكم رهن ملك الغير فيما بين المتعاقدين ثم في مواجهة المالك
25
+ الحقيقي المطلب الأول حكم رهن ملك الغير في العلاقة بين المتعاقدين ثار خلاف في الفقه
26
+ المصري حول حكم رهن ملك الغير، فمنهم من يعتبره باطلاً بطلانًا نسبيًا، وذلك أسوة
27
+ بما يقرره القانون بصدد بيع ملك الغير فحيث تتحد العلة في اتساق التشريع يقتضي وحدة
28
+ الحكم وملكية العقار شرط لصحة العقد ومن الفقه من ذهب إلى أن رهن ملك الغير يعتبر
29
+ باطلاً بطلانًا مطلقًا تأسيسًا على أن فاقد الشيء لا يعطيه، وغير المالك لا يمكنه
30
+ ترتيب رهن العقار فيكون محل
31
+ - ويملك في سبيل تفنيد أدلة الاتهام أن يأتي بأدلة غير مشروعة وهو ما لا يملكه الاتهام
32
+ الذي يتقيد بالأدلة المشروعة في أعماله فضلاً عما يلتزم به الاتهام من موضوعية في
33
+ آرائه وتصرفاته وما لا يلتزم به الدفاع، فالاتهام ليس عدواً للدفاع بل يجب أن يشارك
34
+ معه أثناء المحاكمة من أجل إثبات الحقيقة لضمان فاعلية العدالة وقد كرس المشرع الدستوري
35
+ هذا المبدأ بما نصت عليه المادة ١٩٦ من دستور ٢٠١٤ من أن المتهم برئ حتى تثبت إدانته
36
+ في محاكمة قانونية عادلة، تكفل له فيها ضمانات الدفاع عن نفسه المطلب الخامس تدوين
37
+ الاجراءات أولًا أهمية المبدأ واساسه القانوني يعد تدوين إجراءات المحاكمة مبدأ مكملاً
38
+ لمبدأ الشفوية، ولا
39
+ - source_sentence: ما هي التغييرات التي طرأت على المادة 80 من قانون الشركات فيما يتعلق
40
+ بدعوة مجلس الإدارة للاجتماع؟
41
+ sentences:
42
+ - عند دراستنا لخصائص الموازنة العامة ولقد ترتب على مبدأ تدخلية الدولة زيادة النفقات
43
+ العامة للدولة وذلك على عكس ما يحدث فى ظل سيادة مبدأ الدولة الحارسة وعلى عكس ما
44
+ سبق، فإن سيادة المذهب الاشتراكى أو الايديولوجية الشمولية فى مجتمع ما من شأنه أن
45
+ يزيد من حجم النفقات العامة بصورة كبيرة جدا ويرجع ذلك إلى أن الدولة تحمل على عاتقها
46
+ فى ظل هذه الايديولوجية رقم الصفحه 23 القيام بكافة الأنشطة الاقتصادية والاجتماعية
47
+ والثقافية وتقوم بإنتاج الجزء الأكبر من الناتج القومى الإجمالى، بينما يتهمش دور
48
+ الفرد أو القطاع الخاص بصورة عامة فى ظل المجتمع الاشتراكى وفى الواقع، فإن العالم
49
+ قد شهد تحولا فكريا واقتصاديا
50
+ - سنوات بدلاً من اثنتين ومثال النوع الثاني القانون الصادر بمنع صناعة من الصناعات
51
+ أو عمل من الأعمال دون أن يكون لصدور هذا القانون مبرر من الصحة العامة أو الآداب
52
+ ٢ نظرية الإثراء بلا سبب ذهب العميد هوريو إلى تقرير مسئولية الدولة عن القوانين
53
+ في بعض الأحوال على أساس فكرة الإثراء بلا سبب فإذا صدر قانون باحتكار صناعة من الصناعات
54
+ لحساب الدولة، وترتب على ذلك إغلاق المصانع التي كانت تمارس تلك الصناعة، جاز لأصحاب
55
+ هذه المصانع المطالبة بالتعويض لأن الدولة حينئذ تكون قد أثرت على حساب الغير بدون
56
+ سبب ونظرية الإثراء بلا سبب نظرية معروفة في القانون المدني، وتقوم على أن كل من
57
+ أثرى على حساب الغير دون سبب قانوني يلتزم
58
+ - ثمانين في المائة في عضوية مجالس إدارة الجمعيات التعاونية الزراعية والجمعيات التعاونية
59
+ الصناعية رقم الصفحه 121 كانت المَادَّة 80 من قَانُون الشَّرِكَات قبل تعديلها بموجب
60
+ القَانُون 4 لِسَنَةِ 1792018 تقصر حق الدعوة لاجتماع المَجْلِس على الرئيس أو بناء
61
+ على طلب مقدم من ثلث الأعضاء أو كلما دعت الحاجة لذلك ووفقًا للنص الحالي، يكون اجتماع
62
+ المَجْلِس وفقًا لما يلي يجتمع مَجْلِس الإِدَارَة بدعوة من رئيسه أو من أغلبية أعضائه
63
+ في حالة خلو منصب الرئيس بمعنى آخر أضحت الدعوة من الأغلبية فقط عند خلو منصب الرئيس
64
+ أجاز المُشَرِّع للمرة الأولي لثلث أعضاء المَجْلِس أن يتقدموا بطلب کتابي لرئیس
65
+ المَجْلِس لعقد اجتماع
66
+ - source_sentence: ما هو دور وزير العدل في الإشراف على المحاكم؟
67
+ sentences:
68
+ - لم يخطئ في قصده، بل أخطأ في فعله ٤ والقتل الجاري مجرى الخطأ هو القتل الواقع ممن
69
+ لا قصد له، وذلك كنائم ينقلب على مورثه فيقتله، أو يسقط من مكان مرتفع عليه فيموت
70
+ ٩٨ رقم الصفحه 94 والنوع الأول يستوجب القصاص، وأما الثاني فالواجب فيه دية مغلظة
71
+ مع الكفارة، والأخيران الواجب فيهما الكفارة مع الدية، والقاتل في الأنواع الأربعة
72
+ قد باشر القتل بنفسه أما القتل الذي لا يستوجب القصاص ولا الكفارة فلا يكون مانعاً
73
+ من الميراث، ويشمل ذلك عندهم ما يأتي ١ القتل بحق كقتل الشخص مورثه بحكم وظيفته قصاصاً
74
+ إذا قتل غيره عدواناً، أو حداً كقتل المرتد عن الإسلام، أو دفاعاً علن النفس إذا
75
+ تعين القتل طريقاً
76
+ - والأجور والعقارات وعلى العكس من ذلك، فإن الضريبة غير المباشرة هى التى تنصب على
77
+ وعاء مادى غير مستقر ولا يتمتع بالثبات أو الاستمرارية فالضرائب غير المباشرة تفرض
78
+ على وقائع أو أعمال عرضية مؤقتة مثل الاستهلاك والتداول والاستعمال والإنتاج٣٤ وفى
79
+ الواقع فإنه على الرغم من قدرة هذا المعيار على التمييز أحيانا بين الضرائب المباشرة
80
+ وغير المباشرة إلا أنه يتسم بالغموض وعدم الدقة فى أحيان أخرى فالضريبة على التركات
81
+ والتى تفرض على رأس المال هى ضريبة مباشرة ولكنه يمكن اعتبارها ضريبة غير مباشرة
82
+ وفقا لمعيار استقرار وثبات المادة الخاضعة للضريبة باعتبار أنها تفرض عند انتقال
83
+ الثروة من المتوفى إلى الورثة وهى واقعة عرضية
84
+ - فإن هذا الدور يظل مع ذلك دورًا مشاركاً وليس أصيلاً فالقرارات التي تصدرها السلطة
85
+ التنفيذية في خصوص هذه الشئون تعتمد في وجه أو في آخر على موافقة الهيئات القضائية
86
+ أو بالأقل استطلاع رأيها وفي هذا الإطار يتحدد مضمون نص المادة ٩٣ من قانون السلط��
87
+ القضائية والذي يقضي بأن لوزير العدل حق الإشراف الإداري على المحاكم، ولرئيس كل
88
+ محكمة وللجمعية العامة حق الإشراف على القضاة التابعين لها ١ فالمقصود بالإشراف في
89
+ هذا المقام هو مجرد الإشراف الإداري، وهو لا يتجسد في غالب الحالات في قرارات إلا
90
+ بعد موافقة الجهات القضائية المختصة أو بالأقل التعرف على رأيها ويجد هذا الدور أساسه
91
+ في سندين فمن ناحية
92
+ - source_sentence: ما هو موقف المحكمة الدستورية العليا من فصل ملكية العين عن ملكية
93
+ الرقبة بشكل دائم؟
94
+ sentences:
95
+ - الحبوب لأصحاب المطاحن الذين يقومون بطحنها لحسابهم وبيعها دقيقا بالسعر الجبري فإذا
96
+ انتهت عمليتهم بربح أو خسارة فإنهم يتحملون نتيجتها الطعن رقم 56 لسنة 35 ق جلسة
97
+ 196924 س 20 ع 1 ص248 على أنه يبقى التأكيد على أن القيود التي تفرض على الملكية
98
+ ، استنادا إلى مبررات الوظيفة الاجتماعية للملكية ينبغي أن تكون مؤقتة وعارضة 34
99
+ وان بقاء هذه القيود بما يستغرق حياة طرفي العلاقة العقدية أو أحدهما ، يعني أنها
100
+ قيود مؤبدة وان في ذلك أهدار لحق الملكية ومساس بجوهر الملكية وسلطات المالك وأن
101
+ فصل ملكية العين عن ملكية الرقبة فصلا دائما ومؤبدا يهدر بالضرورة حق الملكية ، كما
102
+ أكدت على ذلك المحكمة الدستورية العليا في العديد من
103
+ - الجامعات، والمعاهد، والسكك الحديدية، والمطابع الأميرية إلخ إلا أن المشرع المصرى
104
+ بالرغم من ذلك فإنه لم يأخذ بفكرة استقلال الميزانيات المستقلة على إطلاقها، وإنما
105
+ وجب عرض تلك الميزانيات على السلطة التشريعية لمناقشتها واعتمادها ثم فى وقت لاحق
106
+ عدل المشرع المصرى الأخذ بنظام الميزانيات المستقلة وأدمجها فى الميزانية العامة
107
+ للدولة وذلك بموجب صدور القرار الجمهورى رقم ١٢٨٨ لسنة ١٩٦٣ ثم عاد المشرع المصرى
108
+ إلى الأخذ بنظام الميزانيات المستقلة وذلك فى قانون الموازنة العامة رقم ٥٣ لسنة
109
+ ١٩٧٣ والمعدل بالقانون رقم ١١ لسنة ١٩٧٩ حيث نصت المادة الثالثة بالفقرة الثانية
110
+ على أن الموازنة العامة للدولة
111
+ - هذه الوصية وهم أهل لتلك الإجازة، أما إذا لم يكن هناك وارث فلا تنفذ الوصية بما
112
+ زاد على الثلث ولقد اتجه قانون الوصية في مصر إلى الأخذ بمذهب الحنفية والحنابلة،
113
+ وجاء النص على ذلك في الفقرة الثانية من المادة ٣٧ من هذا القانون حيث جاء فيها تنفذ
114
+ وصية من لا دين عليه ولا وارث له بكل ماله أو بعضه من غير توقف على إجازة الخزانة
115
+ العامة وجاء في المادة الرابعة من قانون المواريث إذا لم توجد ورثة قضى من التركة
116
+ بالترتيب الآتي أولاً استحقاق من أقر له الميت بنسب على غيره ثانياً ما أوصى به فيما
117
+ زاد على الحد الذي تنفذ فيه الوصية فإذا لم يوجد أحد من هؤلاء آلت التركة أو ما بقى
118
+ منها إلى الخزانة العامة وإنما
119
+ - source_sentence: ما هي الوسائل الحسية التي يمكن استخدامها في عملية المعاينة؟
120
+ sentences:
121
+ - الفصل في المنازعات فقد كان من اختصاص الوزير قانوناً ، وهو ما يعبر عنه بنظرية الوزير
122
+ القاضي، أو القضاء المحجوز وظل الحال هكذا حتى قيام الجمهورية الثالثة وصدور قانون
123
+ ٢٤ مايو ١٨٧٢ والذي منح مجلس الدولة سلطة الفصل في المنازعات الإدارية رقم الصفحه
124
+ 33 بصفة نهائية أي سلطة إصدار أحكام نهائية دون تدخل من جانب رئيس الدولة أو الوزير
125
+ المختص، فأصبح بذلك محكمة بالمعنى الصحيح ولهذا يطلق على هذه المرحلة بمرحلة القضاء
126
+ البات أو القضاء المفوض كما نص هذا القانون على إنشاء محكمة للفصل في حالات تنازع
127
+ الاختصاص بين المحاكم الإدارية والمحاكم العادية أطلق عليه أسم محكمة التنازع وهكذا
128
+ نستطيع القول إن صدور
129
+ - إشكالاً وجب عليه وقف التنفيذ وتحديد جلسة لنظره أمام قاضي التنفيذ، وإذا ذيل الحكم
130
+ بالصيغة التنفيذية وتبين للمحضر أنه غير مشمول بالنفاذ المعجل بأمر المحكمة ولم تتوافر
131
+ الشروط اللازمة لاعتباره نافذاً بقوة القانون بخلوه من البيان الذي يفيد صدوره في
132
+ مادة تجارية أو مستعجلة ، تعين عليه أن يمتنع عن تنفيذه أو بوقف تنفيذه ، أنور طلبه
133
+ ، مرجع سابق ، ص 284 201 تحكم بالنفاذ المعجل ؛ فسلطتها في ذلك جوازية808 ، ويطلب
134
+ هذا النفاذ أمام أول درجة فإذا انتهت الخصومة أمامها دون طلبه تكون هذه المحكمة قد
135
+ استنفدت ولايتها ، ولا يجوز العودة إليها مرة ثانية ، كما لا يجوز طلبه أمام الاستئناف
136
+ لأن أحكام
137
+ - جدية الطلب أو اقتنعت بجدوى الانتقال للمعاينة فى إثبات الحقيقة، ولها أن ترفض طلبهم
138
+ هذا على أن تسبب رفضها حتى لا يعتور حكمها القصور وإذا كان طلب إجراء المعاينة لا
139
+ يتجه إلى نفى الفعل المسند للمتهم ولا إلى إثبات استحالة حصوله، ٦٣ وتتم المعاينة
140
+ بأى حاسة من الحواس التى تتسق مع الواقعة محل المعاينة، فقد تتمثل المعاينة فى المشاهدة
141
+ فتعتمد على البصر أو تتمثل فى اللمس أو فى السمع أو فى الشم أو فى التذوق وقد تنصب
142
+ المعاينة على شخص من الأشخاص، كمعاينة جسم المجنى عليه للتأكد من وقوع إكراه عليه
143
+ أثناء ارتكاب المتهم لجريمته، كما قد تنصب المعاينة على مكان معين كمعاينة مكان القذف
144
+ أو السب للتأكد
145
+ pipeline_tag: sentence-similarity
146
+ library_name: sentence-transformers
147
+ metrics:
148
+ - cosine_accuracy@1
149
+ - cosine_accuracy@3
150
+ - cosine_accuracy@5
151
+ - cosine_accuracy@10
152
+ - cosine_precision@1
153
+ - cosine_precision@3
154
+ - cosine_precision@5
155
+ - cosine_precision@10
156
+ - cosine_recall@1
157
+ - cosine_recall@3
158
+ - cosine_recall@5
159
+ - cosine_recall@10
160
+ - cosine_ndcg@10
161
+ - cosine_mrr@10
162
+ - cosine_map@100
163
+ model-index:
164
+ - name: SentenceTransformer based on Omartificial-Intelligence-Space/Arabic-Triplet-Matryoshka-V2
165
+ results:
166
+ - task:
167
+ type: information-retrieval
168
+ name: Information Retrieval
169
+ dataset:
170
+ name: custom dataset evaluation
171
+ type: custom_dataset_evaluation
172
+ metrics:
173
+ - type: cosine_accuracy@1
174
+ value: 0.621963262887616
175
+ name: Cosine Accuracy@1
176
+ - type: cosine_accuracy@3
177
+ value: 0.8262393837645665
178
+ name: Cosine Accuracy@3
179
+ - type: cosine_accuracy@5
180
+ value: 0.8843077226940549
181
+ name: Cosine Accuracy@5
182
+ - type: cosine_accuracy@10
183
+ value: 0.9401046810191586
184
+ name: Cosine Accuracy@10
185
+ - type: cosine_precision@1
186
+ value: 0.621963262887616
187
+ name: Cosine Precision@1
188
+ - type: cosine_precision@3
189
+ value: 0.2754131279215221
190
+ name: Cosine Precision@3
191
+ - type: cosine_precision@5
192
+ value: 0.17686154453881098
193
+ name: Cosine Precision@5
194
+ - type: cosine_precision@10
195
+ value: 0.09401046810191586
196
+ name: Cosine Precision@10
197
+ - type: cosine_recall@1
198
+ value: 0.621963262887616
199
+ name: Cosine Recall@1
200
+ - type: cosine_recall@3
201
+ value: 0.8262393837645665
202
+ name: Cosine Recall@3
203
+ - type: cosine_recall@5
204
+ value: 0.8843077226940549
205
+ name: Cosine Recall@5
206
+ - type: cosine_recall@10
207
+ value: 0.9401046810191586
208
+ name: Cosine Recall@10
209
+ - type: cosine_ndcg@10
210
+ value: 0.7849111131501391
211
+ name: Cosine Ndcg@10
212
+ - type: cosine_mrr@10
213
+ value: 0.7346985522104195
214
+ name: Cosine Mrr@10
215
+ - type: cosine_map@100
216
+ value: 0.7376242387041089
217
+ name: Cosine Map@100
218
+ ---
219
+
220
+ # SentenceTransformer based on Omartificial-Intelligence-Space/Arabic-Triplet-Matryoshka-V2
221
+
222
+ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [Omartificial-Intelligence-Space/Arabic-Triplet-Matryoshka-V2](https://huggingface.co/Omartificial-Intelligence-Space/Arabic-Triplet-Matryoshka-V2). It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
223
+
224
+ ## Model Details
225
+
226
+ ### Model Description
227
+ - **Model Type:** Sentence Transformer
228
+ - **Base model:** [Omartificial-Intelligence-Space/Arabic-Triplet-Matryoshka-V2](https://huggingface.co/Omartificial-Intelligence-Space/Arabic-Triplet-Matryoshka-V2) <!-- at revision ed357f222f0b6ea6670d2c9b5a1cb93950d34200 -->
229
+ - **Maximum Sequence Length:** 512 tokens
230
+ - **Output Dimensionality:** 768 dimensions
231
+ - **Similarity Function:** Cosine Similarity
232
+ <!-- - **Training Dataset:** Unknown -->
233
+ <!-- - **Language:** Unknown -->
234
+ <!-- - **License:** Unknown -->
235
+
236
+ ### Model Sources
237
+
238
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
239
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
240
+ - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
241
+
242
+ ### Full Model Architecture
243
+
244
+ ```
245
+ SentenceTransformer(
246
+ (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: BertModel
247
+ (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
248
+ )
249
+ ```
250
+
251
+ ## Usage
252
+
253
+ ### Direct Usage (Sentence Transformers)
254
+
255
+ First install the Sentence Transformers library:
256
+
257
+ ```bash
258
+ pip install -U sentence-transformers
259
+ ```
260
+
261
+ Then you can load this model and run inference.
262
+ ```python
263
+ from sentence_transformers import SentenceTransformer
264
+
265
+ # Download from the 🤗 Hub
266
+ model = SentenceTransformer("sentence_transformers_model_id")
267
+ # Run inference
268
+ sentences = [
269
+ 'ما هي الوسائل الحسية التي يمكن استخدامها في عملية المعاينة؟',
270
+ 'جدية الطلب أو اقتنعت بجدوى الانتقال للمعاينة فى إثبات الحقيقة، ولها أن ترفض طلبهم هذا على أن تسبب رفضها حتى لا يعتور حكمها القصور وإذا كان طلب إجراء المعاينة لا يتجه إلى نفى الفعل المسند للمتهم ولا إلى إثبات استحالة حصوله، ٦٣ وتتم المعاينة بأى حاسة من الحواس التى تتسق مع الواقعة محل المعاينة، فقد تتمثل المعاينة فى المشاهدة فتعتمد على البصر أو تتمثل فى اللمس أو فى السمع أو فى الشم أو فى التذوق وقد تنصب المعاينة على شخص من الأشخاص، كمعاينة جسم المجنى عليه للتأكد من وقوع إكراه عليه أثناء ارتكاب المتهم لجريمته، كما قد تنصب المعاينة على مكان معين كمعاينة مكان القذف أو السب للتأكد',
271
+ 'إشكالاً وجب عليه وقف التنفيذ وتحديد جلسة لنظره أمام قاضي التنفيذ، وإذا ذيل الحكم بالصيغة التنفيذية وتبين للمحضر أنه غير مشمول بالنفاذ المعجل بأمر المحكمة ولم تتوافر الشروط اللازمة لاعتباره نافذاً بقوة القانون بخلوه من البيان الذي يفيد صدوره في مادة تجارية أو مستعجلة ، تعين عليه أن يمتنع عن تنفيذه أو بوقف تنفيذه ، أنور طلبه ، مرجع سابق ، ص 284 201 تحكم بالنفاذ المعجل ؛ فسلطتها في ذلك جوازية808 ، ويطلب هذا النفاذ أمام أول درجة فإذا انتهت الخصومة أمامها دون طلبه تكون هذه المحكمة قد استنفدت ولايتها ، ولا يجوز العودة إليها مرة ثانية ، كما لا يجوز طلبه أمام الاستئناف لأن أحكام',
272
+ ]
273
+ embeddings = model.encode(sentences)
274
+ print(embeddings.shape)
275
+ # [3, 768]
276
+
277
+ # Get the similarity scores for the embeddings
278
+ similarities = model.similarity(embeddings, embeddings)
279
+ print(similarities.shape)
280
+ # [3, 3]
281
+ ```
282
+
283
+ <!--
284
+ ### Direct Usage (Transformers)
285
+
286
+ <details><summary>Click to see the direct usage in Transformers</summary>
287
+
288
+ </details>
289
+ -->
290
+
291
+ <!--
292
+ ### Downstream Usage (Sentence Transformers)
293
+
294
+ You can finetune this model on your own dataset.
295
+
296
+ <details><summary>Click to expand</summary>
297
+
298
+ </details>
299
+ -->
300
+
301
+ <!--
302
+ ### Out-of-Scope Use
303
+
304
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
305
+ -->
306
+
307
+ ## Evaluation
308
+
309
+ ### Metrics
310
+
311
+ #### Information Retrieval
312
+
313
+ * Dataset: `custom_dataset_evaluation`
314
+ * Evaluated with [<code>InformationRetrievalEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.InformationRetrievalEvaluator)
315
+
316
+ | Metric | Value |
317
+ |:--------------------|:-----------|
318
+ | cosine_accuracy@1 | 0.622 |
319
+ | cosine_accuracy@3 | 0.8262 |
320
+ | cosine_accuracy@5 | 0.8843 |
321
+ | cosine_accuracy@10 | 0.9401 |
322
+ | cosine_precision@1 | 0.622 |
323
+ | cosine_precision@3 | 0.2754 |
324
+ | cosine_precision@5 | 0.1769 |
325
+ | cosine_precision@10 | 0.094 |
326
+ | cosine_recall@1 | 0.622 |
327
+ | cosine_recall@3 | 0.8262 |
328
+ | cosine_recall@5 | 0.8843 |
329
+ | cosine_recall@10 | 0.9401 |
330
+ | **cosine_ndcg@10** | **0.7849** |
331
+ | cosine_mrr@10 | 0.7347 |
332
+ | cosine_map@100 | 0.7376 |
333
+
334
+ <!--
335
+ ## Bias, Risks and Limitations
336
+
337
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
338
+ -->
339
+
340
+ <!--
341
+ ### Recommendations
342
+
343
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
344
+ -->
345
+
346
+ ## Training Details
347
+
348
+ ### Training Dataset
349
+
350
+ #### Unnamed Dataset
351
+
352
+ * Size: 16,201 training samples
353
+ * Columns: <code>question</code> and <code>context</code>
354
+ * Approximate statistics based on the first 1000 samples:
355
+ | | question | context |
356
+ |:--------|:---------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
357
+ | type | string | string |
358
+ | details | <ul><li>min: 7 tokens</li><li>mean: 16.2 tokens</li><li>max: 46 tokens</li></ul> | <ul><li>min: 49 tokens</li><li>mean: 125.02 tokens</li><li>max: 191 tokens</li></ul> |
359
+ * Samples:
360
+ | question | context |
361
+ |:-------------------------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
362
+ | <code>ما هي الدعوى التي رفعها المعلن إلي الطالب وما هي مطالبته؟</code> | <code>الحد المقرر قانونا باعتبارها مؤجرة خاليه فأقام المعلن اليه الدعوى رقم سنة مستعجل الجيزة بطلب طرد الطالب زاعما فيها انه استأجر شقة النزاع مفروشة ولم يشر فيها الى انها مكتب لفرع شركة تجارية كما ورد بعقد الإيجار، وقدم في ملف تلك الدعوى عقد الإيجار المؤرخ وقدم كذلك قائمة بمنقولات زعم انها ملحقة لذلك العقد، وزورها على الطالب صلبا وتوقيعا ولما كان تقديم ورقة في الدعوى ليس في استطاعة من احتج عليه بها أن يطعن عليها بالتزوير، كما إذا قدمت في دعوى مستعجلة، فانه يجوز له أن يرفع دعوى تزوير أصلية فقد قضت محكمة النقض بأنه إذا لم يكن لمن احتج عليه بالورقة أن يسلك سبيل الادعاء</code> |
363
+ | <code>ما هو الأثر القانوني لصدور حكم بعدم الدستورية على القانون أو المعاهدة الدولية؟</code> | <code>بعدم الدستورية، أو من التاريخ الذى يحدده المجلس؛ فهو أى القانون المقضى بعدم دستوريته يتوقف من هذه اللحظة عن أن يشكل جزءاً من الكيان أو النظام القانونى بالمجتمع هذا من ناحية ومن ناحية أخرى، فإنه يتضح من النص سالف الذكر، أن إلغاء القانون أو المع��هدة الدولية بمقتضى الحكم بعدم الدستورية لا يسرى بأثر رجعى، وإنما بأثر فورى من تاريخ صدوره ، وهو ما يتعارض فى حقيقة الأمر مع ما ينبغى أن يكون الأصل فى هذا الشأن وهو الأثر الرجعى، ذلك أن إبطال نص لعدم الدستورية ليس صفة عارضة تلحقه، ولا هو بعنصر جديد يضاف إليه، وإنما هو كاشف لحالته التى كان عليها ابتداء عند صدوره أو إقراره ،</code> |
364
+ | <code>ما هي الشروط والإجراءات المطلوبة لإنشاء منشآت على الشواطئ البحرية في جمهورية مصر العربية؟</code> | <code>وحظر القرار ضمن مواده الترخيص بإقامة أي منشآت علي الشواطئ البحرية لجمهورية مصر العربية لمسافة 200 متر إلي الداخل من خط الشاطئ، أو إقامة هذه المنشآت إلا بعد موافقة الهيئة المصرية العامة لحماية الشواطئ وجهاز شئون البيئة ويتبع في شأن الترخيص بإقامة تلك المنشآت بوجه خاص، أن يقدم الطلب كتابة إلي الجهة المانحة للترخيص، موضحاً فيه نوعية المنشأة داخل مناطق الحظر علي أن يرفق بالطلب دراسة متكاملة عن تقويم التأثير البيئي للمشروع أو الأعمال المستجدة المطلوب تنفيذها، بما في ذلك تأثيرها علي الاتزان البيئي للمنطقة الساحلية وعلي خط الشاطئ، وعلي عدد من العناصر أهمها النحر والإرساب والتيارات الساحلية والتلوث الناجم</code> |
365
+ * Loss: [<code>MatryoshkaLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#matryoshkaloss) with these parameters:
366
+ ```json
367
+ {
368
+ "loss": "MultipleNegativesRankingLoss",
369
+ "matryoshka_dims": [
370
+ 768,
371
+ 512,
372
+ 256,
373
+ 128,
374
+ 64
375
+ ],
376
+ "matryoshka_weights": [
377
+ 1,
378
+ 1,
379
+ 1,
380
+ 1,
381
+ 1
382
+ ],
383
+ "n_dims_per_step": -1
384
+ }
385
+ ```
386
+
387
+ ### Evaluation Dataset
388
+
389
+ #### Unnamed Dataset
390
+
391
+ * Size: 2,025 evaluation samples
392
+ * Columns: <code>question</code> and <code>context</code>
393
+ * Approximate statistics based on the first 1000 samples:
394
+ | | question | context |
395
+ |:--------|:----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
396
+ | type | string | string |
397
+ | details | <ul><li>min: 8 tokens</li><li>mean: 16.24 tokens</li><li>max: 38 tokens</li></ul> | <ul><li>min: 76 tokens</li><li>mean: 125.61 tokens</li><li>max: 186 tokens</li></ul> |
398
+ * Samples:
399
+ | question | context |
400
+ |:--------------------------------------------------------------------------------------------------------------------------------|:--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
401
+ | <code>ما هي نسبة الأغلبية المطلوبة في الحالات التي تترتب عليها حقوق إضافية في التصويت أو توزيعات الأرباح أو عند التصفية؟</code> | <code>بأغلبية لا تقل عن ثلاثة أرباع رأس المال، أو بأغلبية أكبر في الحالات الآتية 1 إذا ترتبت على الاتفاق حُقُوق إضافية في التصويت أو توزيعات الأرباح أو عند التصفية 2 إذا كان الاتفاق ينطبق عليه ضوابط عقود المعاوضة 3 إذا كان العقد يضع ضوابط أو قيودًا على التعامل على الأَسْهُم أو على إدارة الشَّرِكَة 246 علی عکس المُشَرِّعِ الجزائري الذي نص في المَادَّة 715 المکرر علی أن المُسَاهِم إذا لم يسدد قيمة الأَسْهُم فهو لم يشارك في تكوين رَأسمَال الشَّرِكَة وبالتالي ليس له الحق في المشاركة فِي الجَمْعِيَّةِ العَامَّة أي إن المُسَاهِم يوقف حقه في التصويت كإجراء عقابي؛ وذلك لعدم تحرير الحصة</code> |
402
+ | <code>ما هو المظهر الخارجي للقرار الإداري وما هي آثار عدم اتباع الشكل المحدد قانوناً؟</code> | <code>القرار المظهر الخارجي الذي تبدو أو تتجسد فيه إرادة الإدارة أو المظهر الذي يتضمن ما أفصحت به الإدارة عن إرادتها وترتيباً علي ذلك إذا لم يكن المشرع قد ألزم الإدارة بضرورة إفراغ إرادتها في شكل معين فإنه يكون لها وهذا هو الأصل مطلق الحرية في كيفية التعبير عن هذه الإرادة ١ أما إذا نص القانون علي ضرورة إتباع شكل معين كأن يتطلب مثلاً أن يأخذ القرار شكلاً مكتوبا ففي هذه الحالة يتحتم علي رجل الإدارة ضرورة الالتزام بذلك وإلا كان قراره معيباً باطلاً وكان بالتالي جديراً بالإلغاء وإذا كان الأصل أن الإدارة ليست ملزمة بتسبيب قراراتها أي بذكر أسباب قراراتها إذ يفترض دائماً أن هذه القرارات</code> |
403
+ | <code>ما هي الميزات التي يتمتع بها صاحب الحق العيني التبعي في القانون الكويتي؟</code> | <code>أو الإجرائية في التنفيذ، وصاحب الحق العيني التبعي يتمتع بميزتي التتبع والتقدم أو الأولوية 205 نقض مدني 9 يناير 1939 مجموعة عمر 2 158 ، مشار إليه في فتحي والي ، التنفيذ الجبري في القانون الكويتي ، ص 87 هامش 5 206 استئناف مختلف 5 فبراير 1929 بيلتان 41 198 ، مشار إليه في فتحي والي ، مرجع سابق، ص 87 ، هامش 6 207 أحمد هندي وسيد أحمد محمود وعبدالستار الملا، التنفيذ الجبري في القانون الكويتي، قواعده وإجراءاته، الجزء الأول 2000 ، ص 418 بند 85 208 فتحي والي ، التنفيذ الجبري الكويتي ، ص 87 فنسان وبريفوليه ، طرق التنفيذ وإجراءات التوزيع ، ط 15 ، داللوز 1984 ، ص 57 ، بند 70 209 وجدي راغب ، النظرية العامة للتنفيذ القضائي ، ص 264 ، محمد عبدالخالق عمر ، مبادئ التنفيذ ، ص 189 210</code> |
404
+ * Loss: [<code>MatryoshkaLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#matryoshkaloss) with these parameters:
405
+ ```json
406
+ {
407
+ "loss": "MultipleNegativesRankingLoss",
408
+ "matryoshka_dims": [
409
+ 768,
410
+ 512,
411
+ 256,
412
+ 128,
413
+ 64
414
+ ],
415
+ "matryoshka_weights": [
416
+ 1,
417
+ 1,
418
+ 1,
419
+ 1,
420
+ 1
421
+ ],
422
+ "n_dims_per_step": -1
423
+ }
424
+ ```
425
+
426
+ ### Training Hyperparameters
427
+ #### Non-Default Hyperparameters
428
+
429
+ - `eval_strategy`: steps
430
+ - `per_device_train_batch_size`: 16
431
+ - `per_device_eval_batch_size`: 16
432
+ - `learning_rate`: 2e-05
433
+ - `warmup_ratio`: 0.1
434
+ - `batch_sampler`: no_duplicates
435
+
436
+ #### All Hyperparameters
437
+ <details><summary>Click to expand</summary>
438
+
439
+ - `overwrite_output_dir`: False
440
+ - `do_predict`: False
441
+ - `eval_strategy`: steps
442
+ - `prediction_loss_only`: True
443
+ - `per_device_train_batch_size`: 16
444
+ - `per_device_eval_batch_size`: 16
445
+ - `per_gpu_train_batch_size`: None
446
+ - `per_gpu_eval_batch_size`: None
447
+ - `gradient_accumulation_steps`: 1
448
+ - `eval_accumulation_steps`: None
449
+ - `torch_empty_cache_steps`: None
450
+ - `learning_rate`: 2e-05
451
+ - `weight_decay`: 0.0
452
+ - `adam_beta1`: 0.9
453
+ - `adam_beta2`: 0.999
454
+ - `adam_epsilon`: 1e-08
455
+ - `max_grad_norm`: 1.0
456
+ - `num_train_epochs`: 3
457
+ - `max_steps`: -1
458
+ - `lr_scheduler_type`: linear
459
+ - `lr_scheduler_kwargs`: {}
460
+ - `warmup_ratio`: 0.1
461
+ - `warmup_steps`: 0
462
+ - `log_level`: passive
463
+ - `log_level_replica`: warning
464
+ - `log_on_each_node`: True
465
+ - `logging_nan_inf_filter`: True
466
+ - `save_safetensors`: True
467
+ - `save_on_each_node`: False
468
+ - `save_only_model`: False
469
+ - `restore_callback_states_from_checkpoint`: False
470
+ - `no_cuda`: False
471
+ - `use_cpu`: False
472
+ - `use_mps_device`: False
473
+ - `seed`: 42
474
+ - `data_seed`: None
475
+ - `jit_mode_eval`: False
476
+ - `use_ipex`: False
477
+ - `bf16`: False
478
+ - `fp16`: False
479
+ - `fp16_opt_level`: O1
480
+ - `half_precision_backend`: auto
481
+ - `bf16_full_eval`: False
482
+ - `fp16_full_eval`: False
483
+ - `tf32`: None
484
+ - `local_rank`: 0
485
+ - `ddp_backend`: None
486
+ - `tpu_num_cores`: None
487
+ - `tpu_metrics_debug`: False
488
+ - `debug`: []
489
+ - `dataloader_drop_last`: False
490
+ - `dataloader_num_workers`: 0
491
+ - `dataloader_prefetch_factor`: None
492
+ - `past_index`: -1
493
+ - `disable_tqdm`: False
494
+ - `remove_unused_columns`: True
495
+ - `label_names`: None
496
+ - `load_best_model_at_end`: False
497
+ - `ignore_data_skip`: False
498
+ - `fsdp`: []
499
+ - `fsdp_min_num_params`: 0
500
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
501
+ - `fsdp_transformer_layer_cls_to_wrap`: None
502
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
503
+ - `deepspeed`: None
504
+ - `label_smoothing_factor`: 0.0
505
+ - `optim`: adamw_torch
506
+ - `optim_args`: None
507
+ - `adafactor`: False
508
+ - `group_by_length`: False
509
+ - `length_column_name`: length
510
+ - `ddp_find_unused_parameters`: None
511
+ - `ddp_bucket_cap_mb`: None
512
+ - `ddp_broadcast_buffers`: False
513
+ - `dataloader_pin_memory`: True
514
+ - `dataloader_persistent_workers`: False
515
+ - `skip_memory_metrics`: True
516
+ - `use_legacy_prediction_loop`: False
517
+ - `push_to_hub`: False
518
+ - `resume_from_checkpoint`: None
519
+ - `hub_model_id`: None
520
+ - `hub_strategy`: every_save
521
+ - `hub_private_repo`: None
522
+ - `hub_always_push`: False
523
+ - `gradient_checkpointing`: False
524
+ - `gradient_checkpointing_kwargs`: None
525
+ - `include_inputs_for_metrics`: False
526
+ - `include_for_metrics`: []
527
+ - `eval_do_concat_batches`: True
528
+ - `fp16_backend`: auto
529
+ - `push_to_hub_model_id`: None
530
+ - `push_to_hub_organization`: None
531
+ - `mp_parameters`:
532
+ - `auto_find_batch_size`: False
533
+ - `full_determinism`: False
534
+ - `torchdynamo`: None
535
+ - `ray_scope`: last
536
+ - `ddp_timeout`: 1800
537
+ - `torch_compile`: False
538
+ - `torch_compile_backend`: None
539
+ - `torch_compile_mode`: None
540
+ - `dispatch_batches`: None
541
+ - `split_batches`: None
542
+ - `include_tokens_per_second`: False
543
+ - `include_num_input_tokens_seen`: False
544
+ - `neftune_noise_alpha`: None
545
+ - `optim_target_modules`: None
546
+ - `batch_eval_metrics`: False
547
+ - `eval_on_start`: False
548
+ - `use_liger_kernel`: False
549
+ - `eval_use_gather_object`: False
550
+ - `average_tokens_across_devices`: False
551
+ - `prompts`: None
552
+ - `batch_sampler`: no_duplicates
553
+ - `multi_dataset_batch_sampler`: proportional
554
+
555
+ </details>
556
+
557
+ ### Training Logs
558
+ | Epoch | Step | Training Loss | Validation Loss | custom_dataset_evaluation_cosine_ndcg@10 |
559
+ |:------:|:----:|:-------------:|:---------------:|:----------------------------------------:|
560
+ | -1 | -1 | - | - | 0.6198 |
561
+ | 0.0987 | 100 | 0.4785 | 0.4484 | 0.6508 |
562
+ | 0.1974 | 200 | 0.4112 | 0.3707 | 0.6739 |
563
+ | 0.2962 | 300 | 0.2838 | 0.3282 | 0.6920 |
564
+ | 0.3949 | 400 | 0.2422 | 0.2887 | 0.7051 |
565
+ | 0.4936 | 500 | 0.2369 | 0.2837 | 0.7144 |
566
+ | 0.5923 | 600 | 0.2899 | 0.2684 | 0.7232 |
567
+ | 0.6910 | 700 | 0.1801 | 0.2665 | 0.7320 |
568
+ | 0.7897 | 800 | 0.2279 | 0.2617 | 0.7299 |
569
+ | 0.8885 | 900 | 0.2051 | 0.2683 | 0.7334 |
570
+ | 0.9872 | 1000 | 0.2097 | 0.2445 | 0.7417 |
571
+ | 1.0859 | 1100 | 0.1047 | 0.2397 | 0.7467 |
572
+ | 1.1846 | 1200 | 0.0984 | 0.2229 | 0.7558 |
573
+ | 1.2833 | 1300 | 0.0498 | 0.2587 | 0.7433 |
574
+ | 1.3820 | 1400 | 0.0993 | 0.2147 | 0.7568 |
575
+ | 1.4808 | 1500 | 0.0621 | 0.2045 | 0.7617 |
576
+ | 1.5795 | 1600 | 0.0922 | 0.2054 | 0.7601 |
577
+ | 1.6782 | 1700 | 0.1093 | 0.1993 | 0.7678 |
578
+ | 1.7769 | 1800 | 0.0795 | 0.1943 | 0.7712 |
579
+ | 1.8756 | 1900 | 0.1181 | 0.2066 | 0.7701 |
580
+ | 1.9743 | 2000 | 0.0709 | 0.2000 | 0.7699 |
581
+ | 2.0731 | 2100 | 0.0423 | 0.1928 | 0.7793 |
582
+ | 2.1718 | 2200 | 0.0365 | 0.2017 | 0.7797 |
583
+ | 2.2705 | 2300 | 0.0488 | 0.2220 | 0.7714 |
584
+ | 2.3692 | 2400 | 0.0405 | 0.2090 | 0.7775 |
585
+ | 2.4679 | 2500 | 0.0327 | 0.1960 | 0.7822 |
586
+ | 2.5666 | 2600 | 0.0369 | 0.1985 | 0.7827 |
587
+ | 2.6654 | 2700 | 0.0493 | 0.1987 | 0.7848 |
588
+ | 2.7641 | 2800 | 0.0466 | 0.2008 | 0.7856 |
589
+ | 2.8628 | 2900 | 0.03 | 0.2035 | 0.7847 |
590
+ | 2.9615 | 3000 | 0.0633 | 0.2036 | 0.7849 |
591
+
592
+
593
+ ### Framework Versions
594
+ - Python: 3.11.11
595
+ - Sentence Transformers: 3.4.1
596
+ - Transformers: 4.48.3
597
+ - PyTorch: 2.5.1+cu124
598
+ - Accelerate: 1.3.0
599
+ - Datasets: 3.3.0
600
+ - Tokenizers: 0.21.0
601
+
602
+ ## Citation
603
+
604
+ ### BibTeX
605
+
606
+ #### Sentence Transformers
607
+ ```bibtex
608
+ @inproceedings{reimers-2019-sentence-bert,
609
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
610
+ author = "Reimers, Nils and Gurevych, Iryna",
611
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
612
+ month = "11",
613
+ year = "2019",
614
+ publisher = "Association for Computational Linguistics",
615
+ url = "https://arxiv.org/abs/1908.10084",
616
+ }
617
+ ```
618
+
619
+ #### MatryoshkaLoss
620
+ ```bibtex
621
+ @misc{kusupati2024matryoshka,
622
+ title={Matryoshka Representation Learning},
623
+ author={Aditya Kusupati and Gantavya Bhatt and Aniket Rege and Matthew Wallingford and Aditya Sinha and Vivek Ramanujan and William Howard-Snyder and Kaifeng Chen and Sham Kakade and Prateek Jain and Ali Farhadi},
624
+ year={2024},
625
+ eprint={2205.13147},
626
+ archivePrefix={arXiv},
627
+ primaryClass={cs.LG}
628
+ }
629
+ ```
630
+
631
+ #### MultipleNegativesRankingLoss
632
+ ```bibtex
633
+ @misc{henderson2017efficient,
634
+ title={Efficient Natural Language Response Suggestion for Smart Reply},
635
+ author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
636
+ year={2017},
637
+ eprint={1705.00652},
638
+ archivePrefix={arXiv},
639
+ primaryClass={cs.CL}
640
+ }
641
+ ```
642
+
643
+ <!--
644
+ ## Glossary
645
+
646
+ *Clearly define terms in order to be accessible across audiences.*
647
+ -->
648
+
649
+ <!--
650
+ ## Model Card Authors
651
+
652
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
653
+ -->
654
+
655
+ <!--
656
+ ## Model Card Contact
657
+
658
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
659
+ -->
config.json ADDED
@@ -0,0 +1,25 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "_name_or_path": "Omartificial-Intelligence-Space/Arabic-Triplet-Matryoshka-V2",
3
+ "architectures": [
4
+ "BertModel"
5
+ ],
6
+ "attention_probs_dropout_prob": 0.1,
7
+ "classifier_dropout": null,
8
+ "hidden_act": "gelu",
9
+ "hidden_dropout_prob": 0.1,
10
+ "hidden_size": 768,
11
+ "initializer_range": 0.02,
12
+ "intermediate_size": 3072,
13
+ "layer_norm_eps": 1e-12,
14
+ "max_position_embeddings": 512,
15
+ "model_type": "bert",
16
+ "num_attention_heads": 12,
17
+ "num_hidden_layers": 12,
18
+ "pad_token_id": 0,
19
+ "position_embedding_type": "absolute",
20
+ "torch_dtype": "float32",
21
+ "transformers_version": "4.48.3",
22
+ "type_vocab_size": 2,
23
+ "use_cache": true,
24
+ "vocab_size": 64000
25
+ }
config_sentence_transformers.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "__version__": {
3
+ "sentence_transformers": "3.4.1",
4
+ "transformers": "4.48.3",
5
+ "pytorch": "2.5.1+cu124"
6
+ },
7
+ "prompts": {},
8
+ "default_prompt_name": null,
9
+ "similarity_fn_name": "cosine"
10
+ }
model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:1d3cb7fbea2b8516ed27c3727e81e5635a0885cff8660dd4ea3c2bf1fed3d7c3
3
+ size 540795752
modules.json ADDED
@@ -0,0 +1,14 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "",
6
+ "type": "sentence_transformers.models.Transformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_Pooling",
12
+ "type": "sentence_transformers.models.Pooling"
13
+ }
14
+ ]
optimizer.pt ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:31928a059b5d3b0110bb75c7a76e9722bb115c2d252e29ff75599855ff1497d2
3
+ size 1076986810
rng_state.pth ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:2954a4ece94a8e003c67b5e30b040e264e73a9861675e465f19102d5479446ab
3
+ size 14244
scheduler.pt ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:d2da84600df310c80e3ddbaf08c14bbafd7477428303afb008dbfa763b281711
3
+ size 1064
sentence_bert_config.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "max_seq_length": 512,
3
+ "do_lower_case": false
4
+ }
special_tokens_map.json ADDED
@@ -0,0 +1,37 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "cls_token": {
3
+ "content": "[CLS]",
4
+ "lstrip": false,
5
+ "normalized": false,
6
+ "rstrip": false,
7
+ "single_word": false
8
+ },
9
+ "mask_token": {
10
+ "content": "[MASK]",
11
+ "lstrip": false,
12
+ "normalized": false,
13
+ "rstrip": false,
14
+ "single_word": false
15
+ },
16
+ "pad_token": {
17
+ "content": "[PAD]",
18
+ "lstrip": false,
19
+ "normalized": false,
20
+ "rstrip": false,
21
+ "single_word": false
22
+ },
23
+ "sep_token": {
24
+ "content": "[SEP]",
25
+ "lstrip": false,
26
+ "normalized": false,
27
+ "rstrip": false,
28
+ "single_word": false
29
+ },
30
+ "unk_token": {
31
+ "content": "[UNK]",
32
+ "lstrip": false,
33
+ "normalized": false,
34
+ "rstrip": false,
35
+ "single_word": false
36
+ }
37
+ }
tokenizer.json ADDED
The diff for this file is too large to render. See raw diff
 
tokenizer_config.json ADDED
@@ -0,0 +1,94 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "added_tokens_decoder": {
3
+ "0": {
4
+ "content": "[PAD]",
5
+ "lstrip": false,
6
+ "normalized": false,
7
+ "rstrip": false,
8
+ "single_word": false,
9
+ "special": true
10
+ },
11
+ "1": {
12
+ "content": "[UNK]",
13
+ "lstrip": false,
14
+ "normalized": false,
15
+ "rstrip": false,
16
+ "single_word": false,
17
+ "special": true
18
+ },
19
+ "2": {
20
+ "content": "[CLS]",
21
+ "lstrip": false,
22
+ "normalized": false,
23
+ "rstrip": false,
24
+ "single_word": false,
25
+ "special": true
26
+ },
27
+ "3": {
28
+ "content": "[SEP]",
29
+ "lstrip": false,
30
+ "normalized": false,
31
+ "rstrip": false,
32
+ "single_word": false,
33
+ "special": true
34
+ },
35
+ "4": {
36
+ "content": "[MASK]",
37
+ "lstrip": false,
38
+ "normalized": false,
39
+ "rstrip": false,
40
+ "single_word": false,
41
+ "special": true
42
+ },
43
+ "5": {
44
+ "content": "[رابط]",
45
+ "lstrip": false,
46
+ "normalized": true,
47
+ "rstrip": false,
48
+ "single_word": true,
49
+ "special": true
50
+ },
51
+ "6": {
52
+ "content": "[بريد]",
53
+ "lstrip": false,
54
+ "normalized": true,
55
+ "rstrip": false,
56
+ "single_word": true,
57
+ "special": true
58
+ },
59
+ "7": {
60
+ "content": "[مستخدم]",
61
+ "lstrip": false,
62
+ "normalized": true,
63
+ "rstrip": false,
64
+ "single_word": true,
65
+ "special": true
66
+ }
67
+ },
68
+ "clean_up_tokenization_spaces": true,
69
+ "cls_token": "[CLS]",
70
+ "do_basic_tokenize": true,
71
+ "do_lower_case": false,
72
+ "extra_special_tokens": {},
73
+ "mask_token": "[MASK]",
74
+ "max_len": 512,
75
+ "max_length": 512,
76
+ "model_max_length": 512,
77
+ "never_split": [
78
+ "[بريد]",
79
+ "[مستخدم]",
80
+ "[رابط]"
81
+ ],
82
+ "pad_to_multiple_of": null,
83
+ "pad_token": "[PAD]",
84
+ "pad_token_type_id": 0,
85
+ "padding_side": "right",
86
+ "sep_token": "[SEP]",
87
+ "stride": 0,
88
+ "strip_accents": null,
89
+ "tokenize_chinese_chars": true,
90
+ "tokenizer_class": "BertTokenizer",
91
+ "truncation_side": "right",
92
+ "truncation_strategy": "longest_first",
93
+ "unk_token": "[UNK]"
94
+ }
trainer_state.json ADDED
@@ -0,0 +1,933 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "best_metric": null,
3
+ "best_model_checkpoint": null,
4
+ "epoch": 3.0,
5
+ "eval_steps": 100,
6
+ "global_step": 3039,
7
+ "is_hyper_param_search": false,
8
+ "is_local_process_zero": true,
9
+ "is_world_process_zero": true,
10
+ "log_history": [
11
+ {
12
+ "epoch": 0.09871668311944719,
13
+ "grad_norm": 7.595918655395508,
14
+ "learning_rate": 6.578947368421054e-06,
15
+ "loss": 0.4785,
16
+ "step": 100
17
+ },
18
+ {
19
+ "epoch": 0.09871668311944719,
20
+ "eval_custom_dataset_evaluation_cosine_accuracy@1": 0.48153268812956745,
21
+ "eval_custom_dataset_evaluation_cosine_accuracy@10": 0.8239186253209559,
22
+ "eval_custom_dataset_evaluation_cosine_accuracy@3": 0.6804266245309105,
23
+ "eval_custom_dataset_evaluation_cosine_accuracy@5": 0.7476298637171638,
24
+ "eval_custom_dataset_evaluation_cosine_map@100": 0.6014421644194009,
25
+ "eval_custom_dataset_evaluation_cosine_mrr@10": 0.5954963687693909,
26
+ "eval_custom_dataset_evaluation_cosine_ndcg@10": 0.650756003676077,
27
+ "eval_custom_dataset_evaluation_cosine_precision@1": 0.48153268812956745,
28
+ "eval_custom_dataset_evaluation_cosine_precision@10": 0.0823918625320956,
29
+ "eval_custom_dataset_evaluation_cosine_precision@3": 0.22680887484363688,
30
+ "eval_custom_dataset_evaluation_cosine_precision@5": 0.14952597274343274,
31
+ "eval_custom_dataset_evaluation_cosine_recall@1": 0.48153268812956745,
32
+ "eval_custom_dataset_evaluation_cosine_recall@10": 0.8239186253209559,
33
+ "eval_custom_dataset_evaluation_cosine_recall@3": 0.6804266245309105,
34
+ "eval_custom_dataset_evaluation_cosine_recall@5": 0.7476298637171638,
35
+ "eval_loss": 0.4484286308288574,
36
+ "eval_runtime": 204.03,
37
+ "eval_samples_per_second": 9.925,
38
+ "eval_steps_per_second": 0.622,
39
+ "step": 100
40
+ },
41
+ {
42
+ "epoch": 0.19743336623889438,
43
+ "grad_norm": 10.92927074432373,
44
+ "learning_rate": 1.3157894736842108e-05,
45
+ "loss": 0.4112,
46
+ "step": 200
47
+ },
48
+ {
49
+ "epoch": 0.19743336623889438,
50
+ "eval_custom_dataset_evaluation_cosine_accuracy@1": 0.5033083152281256,
51
+ "eval_custom_dataset_evaluation_cosine_accuracy@10": 0.8463855421686747,
52
+ "eval_custom_dataset_evaluation_cosine_accuracy@3": 0.7041279873592732,
53
+ "eval_custom_dataset_evaluation_cosine_accuracy@5": 0.772615050365396,
54
+ "eval_custom_dataset_evaluation_cosine_map@100": 0.624250951720462,
55
+ "eval_custom_dataset_evaluation_cosine_mrr@10": 0.6187061477761295,
56
+ "eval_custom_dataset_evaluation_cosine_ndcg@10": 0.6738741593374042,
57
+ "eval_custom_dataset_evaluation_cosine_precision@1": 0.5033083152281256,
58
+ "eval_custom_dataset_evaluation_cosine_precision@10": 0.08463855421686747,
59
+ "eval_custom_dataset_evaluation_cosine_precision@3": 0.2347093291197577,
60
+ "eval_custom_dataset_evaluation_cosine_precision@5": 0.1545230100730792,
61
+ "eval_custom_dataset_evaluation_cosine_recall@1": 0.5033083152281256,
62
+ "eval_custom_dataset_evaluation_cosine_recall@10": 0.8463855421686747,
63
+ "eval_custom_dataset_evaluation_cosine_recall@3": 0.7041279873592732,
64
+ "eval_custom_dataset_evaluation_cosine_recall@5": 0.772615050365396,
65
+ "eval_loss": 0.3707010746002197,
66
+ "eval_runtime": 203.8165,
67
+ "eval_samples_per_second": 9.935,
68
+ "eval_steps_per_second": 0.623,
69
+ "step": 200
70
+ },
71
+ {
72
+ "epoch": 0.29615004935834155,
73
+ "grad_norm": 33.57826232910156,
74
+ "learning_rate": 1.9736842105263158e-05,
75
+ "loss": 0.2838,
76
+ "step": 300
77
+ },
78
+ {
79
+ "epoch": 0.29615004935834155,
80
+ "eval_custom_dataset_evaluation_cosine_accuracy@1": 0.5243432747382974,
81
+ "eval_custom_dataset_evaluation_cosine_accuracy@10": 0.860655737704918,
82
+ "eval_custom_dataset_evaluation_cosine_accuracy@3": 0.7234841003357693,
83
+ "eval_custom_dataset_evaluation_cosine_accuracy@5": 0.7913292514319573,
84
+ "eval_custom_dataset_evaluation_cosine_map@100": 0.6432678473897245,
85
+ "eval_custom_dataset_evaluation_cosine_mrr@10": 0.6380460561998335,
86
+ "eval_custom_dataset_evaluation_cosine_ndcg@10": 0.6920347683997495,
87
+ "eval_custom_dataset_evaluation_cosine_precision@1": 0.5243432747382974,
88
+ "eval_custom_dataset_evaluation_cosine_precision@10": 0.0860655737704918,
89
+ "eval_custom_dataset_evaluation_cosine_precision@3": 0.24116136677858976,
90
+ "eval_custom_dataset_evaluation_cosine_precision@5": 0.15826585028639148,
91
+ "eval_custom_dataset_evaluation_cosine_recall@1": 0.5243432747382974,
92
+ "eval_custom_dataset_evaluation_cosine_recall@10": 0.860655737704918,
93
+ "eval_custom_dataset_evaluation_cosine_recall@3": 0.7234841003357693,
94
+ "eval_custom_dataset_evaluation_cosine_recall@5": 0.7913292514319573,
95
+ "eval_loss": 0.32815688848495483,
96
+ "eval_runtime": 203.3881,
97
+ "eval_samples_per_second": 9.956,
98
+ "eval_steps_per_second": 0.624,
99
+ "step": 300
100
+ },
101
+ {
102
+ "epoch": 0.39486673247778875,
103
+ "grad_norm": 2.814175605773926,
104
+ "learning_rate": 1.9297989031078612e-05,
105
+ "loss": 0.2422,
106
+ "step": 400
107
+ },
108
+ {
109
+ "epoch": 0.39486673247778875,
110
+ "eval_custom_dataset_evaluation_cosine_accuracy@1": 0.5371321350977681,
111
+ "eval_custom_dataset_evaluation_cosine_accuracy@10": 0.8726051747975508,
112
+ "eval_custom_dataset_evaluation_cosine_accuracy@3": 0.7371123839620778,
113
+ "eval_custom_dataset_evaluation_cosine_accuracy@5": 0.8044143788267826,
114
+ "eval_custom_dataset_evaluation_cosine_map@100": 0.6563831674366017,
115
+ "eval_custom_dataset_evaluation_cosine_mrr@10": 0.6514166541262787,
116
+ "eval_custom_dataset_evaluation_cosine_ndcg@10": 0.7051169138321652,
117
+ "eval_custom_dataset_evaluation_cosine_precision@1": 0.5371321350977681,
118
+ "eval_custom_dataset_evaluation_cosine_precision@10": 0.08726051747975509,
119
+ "eval_custom_dataset_evaluation_cosine_precision@3": 0.24570412798735927,
120
+ "eval_custom_dataset_evaluation_cosine_precision@5": 0.1608828757653565,
121
+ "eval_custom_dataset_evaluation_cosine_recall@1": 0.5371321350977681,
122
+ "eval_custom_dataset_evaluation_cosine_recall@10": 0.8726051747975508,
123
+ "eval_custom_dataset_evaluation_cosine_recall@3": 0.7371123839620778,
124
+ "eval_custom_dataset_evaluation_cosine_recall@5": 0.8044143788267826,
125
+ "eval_loss": 0.28870803117752075,
126
+ "eval_runtime": 203.6125,
127
+ "eval_samples_per_second": 9.945,
128
+ "eval_steps_per_second": 0.624,
129
+ "step": 400
130
+ },
131
+ {
132
+ "epoch": 0.49358341559723595,
133
+ "grad_norm": 7.553986072540283,
134
+ "learning_rate": 1.856672760511883e-05,
135
+ "loss": 0.2369,
136
+ "step": 500
137
+ },
138
+ {
139
+ "epoch": 0.49358341559723595,
140
+ "eval_custom_dataset_evaluation_cosine_accuracy@1": 0.5465139245506616,
141
+ "eval_custom_dataset_evaluation_cosine_accuracy@10": 0.8817894528935414,
142
+ "eval_custom_dataset_evaluation_cosine_accuracy@3": 0.7465929290934229,
143
+ "eval_custom_dataset_evaluation_cosine_accuracy@5": 0.8143393245111594,
144
+ "eval_custom_dataset_evaluation_cosine_map@100": 0.6652980546980072,
145
+ "eval_custom_dataset_evaluation_cosine_mrr@10": 0.6607006284309909,
146
+ "eval_custom_dataset_evaluation_cosine_ndcg@10": 0.714385034123883,
147
+ "eval_custom_dataset_evaluation_cosine_precision@1": 0.5465139245506616,
148
+ "eval_custom_dataset_evaluation_cosine_precision@10": 0.08817894528935415,
149
+ "eval_custom_dataset_evaluation_cosine_precision@3": 0.24886430969780762,
150
+ "eval_custom_dataset_evaluation_cosine_precision@5": 0.16286786490223187,
151
+ "eval_custom_dataset_evaluation_cosine_recall@1": 0.5465139245506616,
152
+ "eval_custom_dataset_evaluation_cosine_recall@10": 0.8817894528935414,
153
+ "eval_custom_dataset_evaluation_cosine_recall@3": 0.7465929290934229,
154
+ "eval_custom_dataset_evaluation_cosine_recall@5": 0.8143393245111594,
155
+ "eval_loss": 0.28374621272087097,
156
+ "eval_runtime": 204.4559,
157
+ "eval_samples_per_second": 9.904,
158
+ "eval_steps_per_second": 0.621,
159
+ "step": 500
160
+ },
161
+ {
162
+ "epoch": 0.5923000987166831,
163
+ "grad_norm": 32.98969268798828,
164
+ "learning_rate": 1.783546617915905e-05,
165
+ "loss": 0.2899,
166
+ "step": 600
167
+ },
168
+ {
169
+ "epoch": 0.5923000987166831,
170
+ "eval_custom_dataset_evaluation_cosine_accuracy@1": 0.5526367766146554,
171
+ "eval_custom_dataset_evaluation_cosine_accuracy@10": 0.8908749753110804,
172
+ "eval_custom_dataset_evaluation_cosine_accuracy@3": 0.7583448548291527,
173
+ "eval_custom_dataset_evaluation_cosine_accuracy@5": 0.8260912502468892,
174
+ "eval_custom_dataset_evaluation_cosine_map@100": 0.6738304576911812,
175
+ "eval_custom_dataset_evaluation_cosine_mrr@10": 0.669296996730104,
176
+ "eval_custom_dataset_evaluation_cosine_ndcg@10": 0.7232271970632966,
177
+ "eval_custom_dataset_evaluation_cosine_precision@1": 0.5526367766146554,
178
+ "eval_custom_dataset_evaluation_cosine_precision@10": 0.08908749753110803,
179
+ "eval_custom_dataset_evaluation_cosine_precision@3": 0.25278161827638423,
180
+ "eval_custom_dataset_evaluation_cosine_precision@5": 0.16521825004937787,
181
+ "eval_custom_dataset_evaluation_cosine_recall@1": 0.5526367766146554,
182
+ "eval_custom_dataset_evaluation_cosine_recall@10": 0.8908749753110804,
183
+ "eval_custom_dataset_evaluation_cosine_recall@3": 0.7583448548291527,
184
+ "eval_custom_dataset_evaluation_cosine_recall@5": 0.8260912502468892,
185
+ "eval_loss": 0.26842400431632996,
186
+ "eval_runtime": 203.2737,
187
+ "eval_samples_per_second": 9.962,
188
+ "eval_steps_per_second": 0.625,
189
+ "step": 600
190
+ },
191
+ {
192
+ "epoch": 0.6910167818361304,
193
+ "grad_norm": 9.886919021606445,
194
+ "learning_rate": 1.710420475319927e-05,
195
+ "loss": 0.1801,
196
+ "step": 700
197
+ },
198
+ {
199
+ "epoch": 0.6910167818361304,
200
+ "eval_custom_dataset_evaluation_cosine_accuracy@1": 0.5653268812956745,
201
+ "eval_custom_dataset_evaluation_cosine_accuracy@10": 0.8955164921983014,
202
+ "eval_custom_dataset_evaluation_cosine_accuracy@3": 0.7669365988544341,
203
+ "eval_custom_dataset_evaluation_cosine_accuracy@5": 0.8332510369346238,
204
+ "eval_custom_dataset_evaluation_cosine_map@100": 0.683737510172223,
205
+ "eval_custom_dataset_evaluation_cosine_mrr@10": 0.6793955094382355,
206
+ "eval_custom_dataset_evaluation_cosine_ndcg@10": 0.7320247334733945,
207
+ "eval_custom_dataset_evaluation_cosine_precision@1": 0.5653268812956745,
208
+ "eval_custom_dataset_evaluation_cosine_precision@10": 0.08955164921983014,
209
+ "eval_custom_dataset_evaluation_cosine_precision@3": 0.255645532951478,
210
+ "eval_custom_dataset_evaluation_cosine_precision@5": 0.16665020738692476,
211
+ "eval_custom_dataset_evaluation_cosine_recall@1": 0.5653268812956745,
212
+ "eval_custom_dataset_evaluation_cosine_recall@10": 0.8955164921983014,
213
+ "eval_custom_dataset_evaluation_cosine_recall@3": 0.7669365988544341,
214
+ "eval_custom_dataset_evaluation_cosine_recall@5": 0.8332510369346238,
215
+ "eval_loss": 0.2664617896080017,
216
+ "eval_runtime": 203.9076,
217
+ "eval_samples_per_second": 9.931,
218
+ "eval_steps_per_second": 0.623,
219
+ "step": 700
220
+ },
221
+ {
222
+ "epoch": 0.7897334649555775,
223
+ "grad_norm": 17.79576873779297,
224
+ "learning_rate": 1.637294332723949e-05,
225
+ "loss": 0.2279,
226
+ "step": 800
227
+ },
228
+ {
229
+ "epoch": 0.7897334649555775,
230
+ "eval_custom_dataset_evaluation_cosine_accuracy@1": 0.5654256369741261,
231
+ "eval_custom_dataset_evaluation_cosine_accuracy@10": 0.8918131542563698,
232
+ "eval_custom_dataset_evaluation_cosine_accuracy@3": 0.7636282836263085,
233
+ "eval_custom_dataset_evaluation_cosine_accuracy@5": 0.8272763183883073,
234
+ "eval_custom_dataset_evaluation_cosine_map@100": 0.6824116708533701,
235
+ "eval_custom_dataset_evaluation_cosine_mrr@10": 0.6777940607081065,
236
+ "eval_custom_dataset_evaluation_cosine_ndcg@10": 0.7298590424609255,
237
+ "eval_custom_dataset_evaluation_cosine_precision@1": 0.5654256369741261,
238
+ "eval_custom_dataset_evaluation_cosine_precision@10": 0.08918131542563698,
239
+ "eval_custom_dataset_evaluation_cosine_precision@3": 0.2545427612087695,
240
+ "eval_custom_dataset_evaluation_cosine_precision@5": 0.16545526367766147,
241
+ "eval_custom_dataset_evaluation_cosine_recall@1": 0.5654256369741261,
242
+ "eval_custom_dataset_evaluation_cosine_recall@10": 0.8918131542563698,
243
+ "eval_custom_dataset_evaluation_cosine_recall@3": 0.7636282836263085,
244
+ "eval_custom_dataset_evaluation_cosine_recall@5": 0.8272763183883073,
245
+ "eval_loss": 0.2617240250110626,
246
+ "eval_runtime": 203.217,
247
+ "eval_samples_per_second": 9.965,
248
+ "eval_steps_per_second": 0.625,
249
+ "step": 800
250
+ },
251
+ {
252
+ "epoch": 0.8884501480750246,
253
+ "grad_norm": 29.348552703857422,
254
+ "learning_rate": 1.564168190127971e-05,
255
+ "loss": 0.2051,
256
+ "step": 900
257
+ },
258
+ {
259
+ "epoch": 0.8884501480750246,
260
+ "eval_custom_dataset_evaluation_cosine_accuracy@1": 0.5677463954177365,
261
+ "eval_custom_dataset_evaluation_cosine_accuracy@10": 0.8971953387319771,
262
+ "eval_custom_dataset_evaluation_cosine_accuracy@3": 0.7670353545328856,
263
+ "eval_custom_dataset_evaluation_cosine_accuracy@5": 0.8318190795970768,
264
+ "eval_custom_dataset_evaluation_cosine_map@100": 0.6851778091536691,
265
+ "eval_custom_dataset_evaluation_cosine_mrr@10": 0.6808611691104925,
266
+ "eval_custom_dataset_evaluation_cosine_ndcg@10": 0.7334481505960582,
267
+ "eval_custom_dataset_evaluation_cosine_precision@1": 0.5677463954177365,
268
+ "eval_custom_dataset_evaluation_cosine_precision@10": 0.08971953387319773,
269
+ "eval_custom_dataset_evaluation_cosine_precision@3": 0.25567845151096186,
270
+ "eval_custom_dataset_evaluation_cosine_precision@5": 0.16636381591941535,
271
+ "eval_custom_dataset_evaluation_cosine_recall@1": 0.5677463954177365,
272
+ "eval_custom_dataset_evaluation_cosine_recall@10": 0.8971953387319771,
273
+ "eval_custom_dataset_evaluation_cosine_recall@3": 0.7670353545328856,
274
+ "eval_custom_dataset_evaluation_cosine_recall@5": 0.8318190795970768,
275
+ "eval_loss": 0.26834186911582947,
276
+ "eval_runtime": 203.4633,
277
+ "eval_samples_per_second": 9.953,
278
+ "eval_steps_per_second": 0.624,
279
+ "step": 900
280
+ },
281
+ {
282
+ "epoch": 0.9871668311944719,
283
+ "grad_norm": 0.5696656703948975,
284
+ "learning_rate": 1.491042047531993e-05,
285
+ "loss": 0.2097,
286
+ "step": 1000
287
+ },
288
+ {
289
+ "epoch": 0.9871668311944719,
290
+ "eval_custom_dataset_evaluation_cosine_accuracy@1": 0.5728323128579893,
291
+ "eval_custom_dataset_evaluation_cosine_accuracy@10": 0.9064783725064192,
292
+ "eval_custom_dataset_evaluation_cosine_accuracy@3": 0.7784910132332609,
293
+ "eval_custom_dataset_evaluation_cosine_accuracy@5": 0.8429290934228718,
294
+ "eval_custom_dataset_evaluation_cosine_map@100": 0.692767963880535,
295
+ "eval_custom_dataset_evaluation_cosine_mrr@10": 0.6886411963231704,
296
+ "eval_custom_dataset_evaluation_cosine_ndcg@10": 0.741697294005231,
297
+ "eval_custom_dataset_evaluation_cosine_precision@1": 0.5728323128579893,
298
+ "eval_custom_dataset_evaluation_cosine_precision@10": 0.09064783725064192,
299
+ "eval_custom_dataset_evaluation_cosine_precision@3": 0.259497004411087,
300
+ "eval_custom_dataset_evaluation_cosine_precision@5": 0.1685858186845744,
301
+ "eval_custom_dataset_evaluation_cosine_recall@1": 0.5728323128579893,
302
+ "eval_custom_dataset_evaluation_cosine_recall@10": 0.9064783725064192,
303
+ "eval_custom_dataset_evaluation_cosine_recall@3": 0.7784910132332609,
304
+ "eval_custom_dataset_evaluation_cosine_recall@5": 0.8429290934228718,
305
+ "eval_loss": 0.2445395439863205,
306
+ "eval_runtime": 203.8284,
307
+ "eval_samples_per_second": 9.935,
308
+ "eval_steps_per_second": 0.623,
309
+ "step": 1000
310
+ },
311
+ {
312
+ "epoch": 1.085883514313919,
313
+ "grad_norm": 5.538768291473389,
314
+ "learning_rate": 1.4179159049360148e-05,
315
+ "loss": 0.1047,
316
+ "step": 1100
317
+ },
318
+ {
319
+ "epoch": 1.085883514313919,
320
+ "eval_custom_dataset_evaluation_cosine_accuracy@1": 0.5813253012048193,
321
+ "eval_custom_dataset_evaluation_cosine_accuracy@10": 0.9092435315030615,
322
+ "eval_custom_dataset_evaluation_cosine_accuracy@3": 0.7825399960497729,
323
+ "eval_custom_dataset_evaluation_cosine_accuracy@5": 0.8449535848311278,
324
+ "eval_custom_dataset_evaluation_cosine_map@100": 0.6984402538800855,
325
+ "eval_custom_dataset_evaluation_cosine_mrr@10": 0.6944231453526992,
326
+ "eval_custom_dataset_evaluation_cosine_ndcg@10": 0.7466897096167746,
327
+ "eval_custom_dataset_evaluation_cosine_precision@1": 0.5813253012048193,
328
+ "eval_custom_dataset_evaluation_cosine_precision@10": 0.09092435315030614,
329
+ "eval_custom_dataset_evaluation_cosine_precision@3": 0.2608466653499243,
330
+ "eval_custom_dataset_evaluation_cosine_precision@5": 0.16899071696622553,
331
+ "eval_custom_dataset_evaluation_cosine_recall@1": 0.5813253012048193,
332
+ "eval_custom_dataset_evaluation_cosine_recall@10": 0.9092435315030615,
333
+ "eval_custom_dataset_evaluation_cosine_recall@3": 0.7825399960497729,
334
+ "eval_custom_dataset_evaluation_cosine_recall@5": 0.8449535848311278,
335
+ "eval_loss": 0.23973241448402405,
336
+ "eval_runtime": 203.3277,
337
+ "eval_samples_per_second": 9.959,
338
+ "eval_steps_per_second": 0.625,
339
+ "step": 1100
340
+ },
341
+ {
342
+ "epoch": 1.1846001974333662,
343
+ "grad_norm": 6.3217902183532715,
344
+ "learning_rate": 1.3447897623400368e-05,
345
+ "loss": 0.0984,
346
+ "step": 1200
347
+ },
348
+ {
349
+ "epoch": 1.1846001974333662,
350
+ "eval_custom_dataset_evaluation_cosine_accuracy@1": 0.5921390479952597,
351
+ "eval_custom_dataset_evaluation_cosine_accuracy@10": 0.9151688722101521,
352
+ "eval_custom_dataset_evaluation_cosine_accuracy@3": 0.7911317400750543,
353
+ "eval_custom_dataset_evaluation_cosine_accuracy@5": 0.8541378629271184,
354
+ "eval_custom_dataset_evaluation_cosine_map@100": 0.7083777420863926,
355
+ "eval_custom_dataset_evaluation_cosine_mrr@10": 0.7045087061752225,
356
+ "eval_custom_dataset_evaluation_cosine_ndcg@10": 0.755835586028989,
357
+ "eval_custom_dataset_evaluation_cosine_precision@1": 0.5921390479952597,
358
+ "eval_custom_dataset_evaluation_cosine_precision@10": 0.09151688722101521,
359
+ "eval_custom_dataset_evaluation_cosine_precision@3": 0.2637105800250181,
360
+ "eval_custom_dataset_evaluation_cosine_precision@5": 0.1708275725854237,
361
+ "eval_custom_dataset_evaluation_cosine_recall@1": 0.5921390479952597,
362
+ "eval_custom_dataset_evaluation_cosine_recall@10": 0.9151688722101521,
363
+ "eval_custom_dataset_evaluation_cosine_recall@3": 0.7911317400750543,
364
+ "eval_custom_dataset_evaluation_cosine_recall@5": 0.8541378629271184,
365
+ "eval_loss": 0.2229250818490982,
366
+ "eval_runtime": 203.6954,
367
+ "eval_samples_per_second": 9.941,
368
+ "eval_steps_per_second": 0.623,
369
+ "step": 1200
370
+ },
371
+ {
372
+ "epoch": 1.2833168805528135,
373
+ "grad_norm": 11.505134582519531,
374
+ "learning_rate": 1.2716636197440586e-05,
375
+ "loss": 0.0498,
376
+ "step": 1300
377
+ },
378
+ {
379
+ "epoch": 1.2833168805528135,
380
+ "eval_custom_dataset_evaluation_cosine_accuracy@1": 0.5782638751728224,
381
+ "eval_custom_dataset_evaluation_cosine_accuracy@10": 0.9055895714003556,
382
+ "eval_custom_dataset_evaluation_cosine_accuracy@3": 0.7789354137862927,
383
+ "eval_custom_dataset_evaluation_cosine_accuracy@5": 0.8386825992494569,
384
+ "eval_custom_dataset_evaluation_cosine_map@100": 0.6954513367155198,
385
+ "eval_custom_dataset_evaluation_cosine_mrr@10": 0.6912109797503966,
386
+ "eval_custom_dataset_evaluation_cosine_ndcg@10": 0.7433337553688117,
387
+ "eval_custom_dataset_evaluation_cosine_precision@1": 0.5782638751728224,
388
+ "eval_custom_dataset_evaluation_cosine_precision@10": 0.09055895714003556,
389
+ "eval_custom_dataset_evaluation_cosine_precision@3": 0.2596451379287642,
390
+ "eval_custom_dataset_evaluation_cosine_precision@5": 0.16773651984989138,
391
+ "eval_custom_dataset_evaluation_cosine_recall@1": 0.5782638751728224,
392
+ "eval_custom_dataset_evaluation_cosine_recall@10": 0.9055895714003556,
393
+ "eval_custom_dataset_evaluation_cosine_recall@3": 0.7789354137862927,
394
+ "eval_custom_dataset_evaluation_cosine_recall@5": 0.8386825992494569,
395
+ "eval_loss": 0.2586788237094879,
396
+ "eval_runtime": 204.0885,
397
+ "eval_samples_per_second": 9.922,
398
+ "eval_steps_per_second": 0.622,
399
+ "step": 1300
400
+ },
401
+ {
402
+ "epoch": 1.3820335636722607,
403
+ "grad_norm": 1.1614787578582764,
404
+ "learning_rate": 1.1985374771480804e-05,
405
+ "loss": 0.0993,
406
+ "step": 1400
407
+ },
408
+ {
409
+ "epoch": 1.3820335636722607,
410
+ "eval_custom_dataset_evaluation_cosine_accuracy@1": 0.59411416156429,
411
+ "eval_custom_dataset_evaluation_cosine_accuracy@10": 0.9151194943709263,
412
+ "eval_custom_dataset_evaluation_cosine_accuracy@3": 0.7925636974126012,
413
+ "eval_custom_dataset_evaluation_cosine_accuracy@5": 0.8543353742840213,
414
+ "eval_custom_dataset_evaluation_cosine_map@100": 0.7096847447019631,
415
+ "eval_custom_dataset_evaluation_cosine_mrr@10": 0.705814299351989,
416
+ "eval_custom_dataset_evaluation_cosine_ndcg@10": 0.7568020206373794,
417
+ "eval_custom_dataset_evaluation_cosine_precision@1": 0.59411416156429,
418
+ "eval_custom_dataset_evaluation_cosine_precision@10": 0.09151194943709264,
419
+ "eval_custom_dataset_evaluation_cosine_precision@3": 0.2641878991375337,
420
+ "eval_custom_dataset_evaluation_cosine_precision@5": 0.17086707485680427,
421
+ "eval_custom_dataset_evaluation_cosine_recall@1": 0.59411416156429,
422
+ "eval_custom_dataset_evaluation_cosine_recall@10": 0.9151194943709263,
423
+ "eval_custom_dataset_evaluation_cosine_recall@3": 0.7925636974126012,
424
+ "eval_custom_dataset_evaluation_cosine_recall@5": 0.8543353742840213,
425
+ "eval_loss": 0.2147156298160553,
426
+ "eval_runtime": 204.4732,
427
+ "eval_samples_per_second": 9.903,
428
+ "eval_steps_per_second": 0.621,
429
+ "step": 1400
430
+ },
431
+ {
432
+ "epoch": 1.4807502467917077,
433
+ "grad_norm": 1.6429851055145264,
434
+ "learning_rate": 1.1254113345521024e-05,
435
+ "loss": 0.0621,
436
+ "step": 1500
437
+ },
438
+ {
439
+ "epoch": 1.4807502467917077,
440
+ "eval_custom_dataset_evaluation_cosine_accuracy@1": 0.5962867864902232,
441
+ "eval_custom_dataset_evaluation_cosine_accuracy@10": 0.9217855026664034,
442
+ "eval_custom_dataset_evaluation_cosine_accuracy@3": 0.7997234841003358,
443
+ "eval_custom_dataset_evaluation_cosine_accuracy@5": 0.860853249061821,
444
+ "eval_custom_dataset_evaluation_cosine_map@100": 0.7136002941229976,
445
+ "eval_custom_dataset_evaluation_cosine_mrr@10": 0.7100783500904636,
446
+ "eval_custom_dataset_evaluation_cosine_ndcg@10": 0.7616828218263099,
447
+ "eval_custom_dataset_evaluation_cosine_precision@1": 0.5962867864902232,
448
+ "eval_custom_dataset_evaluation_cosine_precision@10": 0.09217855026664035,
449
+ "eval_custom_dataset_evaluation_cosine_precision@3": 0.2665744947001119,
450
+ "eval_custom_dataset_evaluation_cosine_precision@5": 0.1721706498123642,
451
+ "eval_custom_dataset_evaluation_cosine_recall@1": 0.5962867864902232,
452
+ "eval_custom_dataset_evaluation_cosine_recall@10": 0.9217855026664034,
453
+ "eval_custom_dataset_evaluation_cosine_recall@3": 0.7997234841003358,
454
+ "eval_custom_dataset_evaluation_cosine_recall@5": 0.860853249061821,
455
+ "eval_loss": 0.20447228848934174,
456
+ "eval_runtime": 204.051,
457
+ "eval_samples_per_second": 9.924,
458
+ "eval_steps_per_second": 0.622,
459
+ "step": 1500
460
+ },
461
+ {
462
+ "epoch": 1.579466929911155,
463
+ "grad_norm": 15.424310684204102,
464
+ "learning_rate": 1.0522851919561243e-05,
465
+ "loss": 0.0922,
466
+ "step": 1600
467
+ },
468
+ {
469
+ "epoch": 1.579466929911155,
470
+ "eval_custom_dataset_evaluation_cosine_accuracy@1": 0.5950029626703536,
471
+ "eval_custom_dataset_evaluation_cosine_accuracy@10": 0.9201560339719533,
472
+ "eval_custom_dataset_evaluation_cosine_accuracy@3": 0.7980446375666601,
473
+ "eval_custom_dataset_evaluation_cosine_accuracy@5": 0.858038712225953,
474
+ "eval_custom_dataset_evaluation_cosine_map@100": 0.7121969229630567,
475
+ "eval_custom_dataset_evaluation_cosine_mrr@10": 0.7085377027234775,
476
+ "eval_custom_dataset_evaluation_cosine_ndcg@10": 0.7601050276866773,
477
+ "eval_custom_dataset_evaluation_cosine_precision@1": 0.5950029626703536,
478
+ "eval_custom_dataset_evaluation_cosine_precision@10": 0.09201560339719535,
479
+ "eval_custom_dataset_evaluation_cosine_precision@3": 0.26601487918888667,
480
+ "eval_custom_dataset_evaluation_cosine_precision@5": 0.17160774244519061,
481
+ "eval_custom_dataset_evaluation_cosine_recall@1": 0.5950029626703536,
482
+ "eval_custom_dataset_evaluation_cosine_recall@10": 0.9201560339719533,
483
+ "eval_custom_dataset_evaluation_cosine_recall@3": 0.7980446375666601,
484
+ "eval_custom_dataset_evaluation_cosine_recall@5": 0.858038712225953,
485
+ "eval_loss": 0.20542284846305847,
486
+ "eval_runtime": 203.1105,
487
+ "eval_samples_per_second": 9.97,
488
+ "eval_steps_per_second": 0.625,
489
+ "step": 1600
490
+ },
491
+ {
492
+ "epoch": 1.678183613030602,
493
+ "grad_norm": 4.0268096923828125,
494
+ "learning_rate": 9.791590493601464e-06,
495
+ "loss": 0.1093,
496
+ "step": 1700
497
+ },
498
+ {
499
+ "epoch": 1.678183613030602,
500
+ "eval_custom_dataset_evaluation_cosine_accuracy@1": 0.6026071499111199,
501
+ "eval_custom_dataset_evaluation_cosine_accuracy@10": 0.9248469286984001,
502
+ "eval_custom_dataset_evaluation_cosine_accuracy@3": 0.8095496741062611,
503
+ "eval_custom_dataset_evaluation_cosine_accuracy@5": 0.8681117914280071,
504
+ "eval_custom_dataset_evaluation_cosine_map@100": 0.7204789219182511,
505
+ "eval_custom_dataset_evaluation_cosine_mrr@10": 0.7169305441908291,
506
+ "eval_custom_dataset_evaluation_cosine_ndcg@10": 0.7677587208908659,
507
+ "eval_custom_dataset_evaluation_cosine_precision@1": 0.6026071499111199,
508
+ "eval_custom_dataset_evaluation_cosine_precision@10": 0.09248469286984001,
509
+ "eval_custom_dataset_evaluation_cosine_precision@3": 0.26984989136875365,
510
+ "eval_custom_dataset_evaluation_cosine_precision@5": 0.1736223582856014,
511
+ "eval_custom_dataset_evaluation_cosine_recall@1": 0.6026071499111199,
512
+ "eval_custom_dataset_evaluation_cosine_recall@10": 0.9248469286984001,
513
+ "eval_custom_dataset_evaluation_cosine_recall@3": 0.8095496741062611,
514
+ "eval_custom_dataset_evaluation_cosine_recall@5": 0.8681117914280071,
515
+ "eval_loss": 0.1992715299129486,
516
+ "eval_runtime": 203.9449,
517
+ "eval_samples_per_second": 9.929,
518
+ "eval_steps_per_second": 0.623,
519
+ "step": 1700
520
+ },
521
+ {
522
+ "epoch": 1.7769002961500493,
523
+ "grad_norm": 0.6978006958961487,
524
+ "learning_rate": 9.060329067641682e-06,
525
+ "loss": 0.0795,
526
+ "step": 1800
527
+ },
528
+ {
529
+ "epoch": 1.7769002961500493,
530
+ "eval_custom_dataset_evaluation_cosine_accuracy@1": 0.605816709460794,
531
+ "eval_custom_dataset_evaluation_cosine_accuracy@10": 0.9286984001580091,
532
+ "eval_custom_dataset_evaluation_cosine_accuracy@3": 0.8117222990321944,
533
+ "eval_custom_dataset_evaluation_cosine_accuracy@5": 0.8722101520837449,
534
+ "eval_custom_dataset_evaluation_cosine_map@100": 0.7237388658743508,
535
+ "eval_custom_dataset_evaluation_cosine_mrr@10": 0.7203004837460861,
536
+ "eval_custom_dataset_evaluation_cosine_ndcg@10": 0.7712328450315743,
537
+ "eval_custom_dataset_evaluation_cosine_precision@1": 0.605816709460794,
538
+ "eval_custom_dataset_evaluation_cosine_precision@10": 0.09286984001580093,
539
+ "eval_custom_dataset_evaluation_cosine_precision@3": 0.2705740996773981,
540
+ "eval_custom_dataset_evaluation_cosine_precision@5": 0.17444203041674897,
541
+ "eval_custom_dataset_evaluation_cosine_recall@1": 0.605816709460794,
542
+ "eval_custom_dataset_evaluation_cosine_recall@10": 0.9286984001580091,
543
+ "eval_custom_dataset_evaluation_cosine_recall@3": 0.8117222990321944,
544
+ "eval_custom_dataset_evaluation_cosine_recall@5": 0.8722101520837449,
545
+ "eval_loss": 0.19426828622817993,
546
+ "eval_runtime": 204.0488,
547
+ "eval_samples_per_second": 9.924,
548
+ "eval_steps_per_second": 0.622,
549
+ "step": 1800
550
+ },
551
+ {
552
+ "epoch": 1.8756169792694966,
553
+ "grad_norm": 2.5955662727355957,
554
+ "learning_rate": 8.329067641681902e-06,
555
+ "loss": 0.1181,
556
+ "step": 1900
557
+ },
558
+ {
559
+ "epoch": 1.8756169792694966,
560
+ "eval_custom_dataset_evaluation_cosine_accuracy@1": 0.6043353742840213,
561
+ "eval_custom_dataset_evaluation_cosine_accuracy@10": 0.9297847126209757,
562
+ "eval_custom_dataset_evaluation_cosine_accuracy@3": 0.8089077621963263,
563
+ "eval_custom_dataset_evaluation_cosine_accuracy@5": 0.8701362828362631,
564
+ "eval_custom_dataset_evaluation_cosine_map@100": 0.7219374022367849,
565
+ "eval_custom_dataset_evaluation_cosine_mrr@10": 0.7185761194661708,
566
+ "eval_custom_dataset_evaluation_cosine_ndcg@10": 0.7700958544922684,
567
+ "eval_custom_dataset_evaluation_cosine_precision@1": 0.6043353742840213,
568
+ "eval_custom_dataset_evaluation_cosine_precision@10": 0.09297847126209759,
569
+ "eval_custom_dataset_evaluation_cosine_precision@3": 0.2696359207321088,
570
+ "eval_custom_dataset_evaluation_cosine_precision@5": 0.17402725656725263,
571
+ "eval_custom_dataset_evaluation_cosine_recall@1": 0.6043353742840213,
572
+ "eval_custom_dataset_evaluation_cosine_recall@10": 0.9297847126209757,
573
+ "eval_custom_dataset_evaluation_cosine_recall@3": 0.8089077621963263,
574
+ "eval_custom_dataset_evaluation_cosine_recall@5": 0.8701362828362631,
575
+ "eval_loss": 0.20659147202968597,
576
+ "eval_runtime": 204.0716,
577
+ "eval_samples_per_second": 9.923,
578
+ "eval_steps_per_second": 0.622,
579
+ "step": 1900
580
+ },
581
+ {
582
+ "epoch": 1.9743336623889438,
583
+ "grad_norm": 0.8803901672363281,
584
+ "learning_rate": 7.597806215722121e-06,
585
+ "loss": 0.0709,
586
+ "step": 2000
587
+ },
588
+ {
589
+ "epoch": 1.9743336623889438,
590
+ "eval_custom_dataset_evaluation_cosine_accuracy@1": 0.603199683981829,
591
+ "eval_custom_dataset_evaluation_cosine_accuracy@10": 0.9302784910132332,
592
+ "eval_custom_dataset_evaluation_cosine_accuracy@3": 0.8102903416946474,
593
+ "eval_custom_dataset_evaluation_cosine_accuracy@5": 0.8703831720323919,
594
+ "eval_custom_dataset_evaluation_cosine_map@100": 0.7214873578820934,
595
+ "eval_custom_dataset_evaluation_cosine_mrr@10": 0.7181931668908422,
596
+ "eval_custom_dataset_evaluation_cosine_ndcg@10": 0.7699451899898953,
597
+ "eval_custom_dataset_evaluation_cosine_precision@1": 0.603199683981829,
598
+ "eval_custom_dataset_evaluation_cosine_precision@10": 0.09302784910132333,
599
+ "eval_custom_dataset_evaluation_cosine_precision@3": 0.27009678056488245,
600
+ "eval_custom_dataset_evaluation_cosine_precision@5": 0.1740766344064784,
601
+ "eval_custom_dataset_evaluation_cosine_recall@1": 0.603199683981829,
602
+ "eval_custom_dataset_evaluation_cosine_recall@10": 0.9302784910132332,
603
+ "eval_custom_dataset_evaluation_cosine_recall@3": 0.8102903416946474,
604
+ "eval_custom_dataset_evaluation_cosine_recall@5": 0.8703831720323919,
605
+ "eval_loss": 0.19996753334999084,
606
+ "eval_runtime": 203.9747,
607
+ "eval_samples_per_second": 9.928,
608
+ "eval_steps_per_second": 0.623,
609
+ "step": 2000
610
+ },
611
+ {
612
+ "epoch": 2.073050345508391,
613
+ "grad_norm": 0.9776083827018738,
614
+ "learning_rate": 6.866544789762341e-06,
615
+ "loss": 0.0423,
616
+ "step": 2100
617
+ },
618
+ {
619
+ "epoch": 2.073050345508391,
620
+ "eval_custom_dataset_evaluation_cosine_accuracy@1": 0.6150503653960103,
621
+ "eval_custom_dataset_evaluation_cosine_accuracy@10": 0.9359075646849694,
622
+ "eval_custom_dataset_evaluation_cosine_accuracy@3": 0.8209065771281848,
623
+ "eval_custom_dataset_evaluation_cosine_accuracy@5": 0.8796168279676081,
624
+ "eval_custom_dataset_evaluation_cosine_map@100": 0.7317976394363255,
625
+ "eval_custom_dataset_evaluation_cosine_mrr@10": 0.728681000348013,
626
+ "eval_custom_dataset_evaluation_cosine_ndcg@10": 0.7793256141306921,
627
+ "eval_custom_dataset_evaluation_cosine_precision@1": 0.6150503653960103,
628
+ "eval_custom_dataset_evaluation_cosine_precision@10": 0.09359075646849695,
629
+ "eval_custom_dataset_evaluation_cosine_precision@3": 0.27363552570939487,
630
+ "eval_custom_dataset_evaluation_cosine_precision@5": 0.17592336559352165,
631
+ "eval_custom_dataset_evaluation_cosine_recall@1": 0.6150503653960103,
632
+ "eval_custom_dataset_evaluation_cosine_recall@10": 0.9359075646849694,
633
+ "eval_custom_dataset_evaluation_cosine_recall@3": 0.8209065771281848,
634
+ "eval_custom_dataset_evaluation_cosine_recall@5": 0.8796168279676081,
635
+ "eval_loss": 0.19277189671993256,
636
+ "eval_runtime": 203.5377,
637
+ "eval_samples_per_second": 9.949,
638
+ "eval_steps_per_second": 0.624,
639
+ "step": 2100
640
+ },
641
+ {
642
+ "epoch": 2.171767028627838,
643
+ "grad_norm": 0.3466501235961914,
644
+ "learning_rate": 6.13528336380256e-06,
645
+ "loss": 0.0365,
646
+ "step": 2200
647
+ },
648
+ {
649
+ "epoch": 2.171767028627838,
650
+ "eval_custom_dataset_evaluation_cosine_accuracy@1": 0.6160379221805253,
651
+ "eval_custom_dataset_evaluation_cosine_accuracy@10": 0.9352162749358088,
652
+ "eval_custom_dataset_evaluation_cosine_accuracy@3": 0.8210547106458621,
653
+ "eval_custom_dataset_evaluation_cosine_accuracy@5": 0.8787280268615445,
654
+ "eval_custom_dataset_evaluation_cosine_map@100": 0.7324401240286031,
655
+ "eval_custom_dataset_evaluation_cosine_mrr@10": 0.7293587895689079,
656
+ "eval_custom_dataset_evaluation_cosine_ndcg@10": 0.7796830803735836,
657
+ "eval_custom_dataset_evaluation_cosine_precision@1": 0.6160379221805253,
658
+ "eval_custom_dataset_evaluation_cosine_precision@10": 0.0935216274935809,
659
+ "eval_custom_dataset_evaluation_cosine_precision@3": 0.2736849035486207,
660
+ "eval_custom_dataset_evaluation_cosine_precision@5": 0.17574560537230893,
661
+ "eval_custom_dataset_evaluation_cosine_recall@1": 0.6160379221805253,
662
+ "eval_custom_dataset_evaluation_cosine_recall@10": 0.9352162749358088,
663
+ "eval_custom_dataset_evaluation_cosine_recall@3": 0.8210547106458621,
664
+ "eval_custom_dataset_evaluation_cosine_recall@5": 0.8787280268615445,
665
+ "eval_loss": 0.2016632854938507,
666
+ "eval_runtime": 203.3562,
667
+ "eval_samples_per_second": 9.958,
668
+ "eval_steps_per_second": 0.625,
669
+ "step": 2200
670
+ },
671
+ {
672
+ "epoch": 2.270483711747285,
673
+ "grad_norm": 11.319628715515137,
674
+ "learning_rate": 5.40402193784278e-06,
675
+ "loss": 0.0488,
676
+ "step": 2300
677
+ },
678
+ {
679
+ "epoch": 2.270483711747285,
680
+ "eval_custom_dataset_evaluation_cosine_accuracy@1": 0.6060635986569227,
681
+ "eval_custom_dataset_evaluation_cosine_accuracy@10": 0.9303772466916848,
682
+ "eval_custom_dataset_evaluation_cosine_accuracy@3": 0.810784120086905,
683
+ "eval_custom_dataset_evaluation_cosine_accuracy@5": 0.8715188623345842,
684
+ "eval_custom_dataset_evaluation_cosine_map@100": 0.7233919610739875,
685
+ "eval_custom_dataset_evaluation_cosine_mrr@10": 0.7200670950782208,
686
+ "eval_custom_dataset_evaluation_cosine_ndcg@10": 0.7713978686997449,
687
+ "eval_custom_dataset_evaluation_cosine_precision@1": 0.6060635986569227,
688
+ "eval_custom_dataset_evaluation_cosine_precision@10": 0.09303772466916849,
689
+ "eval_custom_dataset_evaluation_cosine_precision@3": 0.27026137336230166,
690
+ "eval_custom_dataset_evaluation_cosine_precision@5": 0.17430377246691683,
691
+ "eval_custom_dataset_evaluation_cosine_recall@1": 0.6060635986569227,
692
+ "eval_custom_dataset_evaluation_cosine_recall@10": 0.9303772466916848,
693
+ "eval_custom_dataset_evaluation_cosine_recall@3": 0.810784120086905,
694
+ "eval_custom_dataset_evaluation_cosine_recall@5": 0.8715188623345842,
695
+ "eval_loss": 0.2220190316438675,
696
+ "eval_runtime": 203.7981,
697
+ "eval_samples_per_second": 9.936,
698
+ "eval_steps_per_second": 0.623,
699
+ "step": 2300
700
+ },
701
+ {
702
+ "epoch": 2.3692003948667324,
703
+ "grad_norm": 1.2127763032913208,
704
+ "learning_rate": 4.672760511882998e-06,
705
+ "loss": 0.0405,
706
+ "step": 2400
707
+ },
708
+ {
709
+ "epoch": 2.3692003948667324,
710
+ "eval_custom_dataset_evaluation_cosine_accuracy@1": 0.612482717756271,
711
+ "eval_custom_dataset_evaluation_cosine_accuracy@10": 0.9345249851866483,
712
+ "eval_custom_dataset_evaluation_cosine_accuracy@3": 0.8190302192376062,
713
+ "eval_custom_dataset_evaluation_cosine_accuracy@5": 0.8769010468101915,
714
+ "eval_custom_dataset_evaluation_cosine_map@100": 0.7299302543873705,
715
+ "eval_custom_dataset_evaluation_cosine_mrr@10": 0.7267631415592252,
716
+ "eval_custom_dataset_evaluation_cosine_ndcg@10": 0.7775318729565346,
717
+ "eval_custom_dataset_evaluation_cosine_precision@1": 0.612482717756271,
718
+ "eval_custom_dataset_evaluation_cosine_precision@10": 0.09345249851866484,
719
+ "eval_custom_dataset_evaluation_cosine_precision@3": 0.27301007307920205,
720
+ "eval_custom_dataset_evaluation_cosine_precision@5": 0.17538020936203833,
721
+ "eval_custom_dataset_evaluation_cosine_recall@1": 0.612482717756271,
722
+ "eval_custom_dataset_evaluation_cosine_recall@10": 0.9345249851866483,
723
+ "eval_custom_dataset_evaluation_cosine_recall@3": 0.8190302192376062,
724
+ "eval_custom_dataset_evaluation_cosine_recall@5": 0.8769010468101915,
725
+ "eval_loss": 0.20903073251247406,
726
+ "eval_runtime": 204.2344,
727
+ "eval_samples_per_second": 9.915,
728
+ "eval_steps_per_second": 0.622,
729
+ "step": 2400
730
+ },
731
+ {
732
+ "epoch": 2.4679170779861797,
733
+ "grad_norm": 0.3473336398601532,
734
+ "learning_rate": 3.941499085923218e-06,
735
+ "loss": 0.0327,
736
+ "step": 2500
737
+ },
738
+ {
739
+ "epoch": 2.4679170779861797,
740
+ "eval_custom_dataset_evaluation_cosine_accuracy@1": 0.6181611692672329,
741
+ "eval_custom_dataset_evaluation_cosine_accuracy@10": 0.9379814339324511,
742
+ "eval_custom_dataset_evaluation_cosine_accuracy@3": 0.8215484890381197,
743
+ "eval_custom_dataset_evaluation_cosine_accuracy@5": 0.8832214102310882,
744
+ "eval_custom_dataset_evaluation_cosine_map@100": 0.7347609073841157,
745
+ "eval_custom_dataset_evaluation_cosine_mrr@10": 0.7317605707764854,
746
+ "eval_custom_dataset_evaluation_cosine_ndcg@10": 0.7821769875234544,
747
+ "eval_custom_dataset_evaluation_cosine_precision@1": 0.6181611692672329,
748
+ "eval_custom_dataset_evaluation_cosine_precision@10": 0.09379814339324512,
749
+ "eval_custom_dataset_evaluation_cosine_precision@3": 0.27384949634603983,
750
+ "eval_custom_dataset_evaluation_cosine_precision@5": 0.17664428204621765,
751
+ "eval_custom_dataset_evaluation_cosine_recall@1": 0.6181611692672329,
752
+ "eval_custom_dataset_evaluation_cosine_recall@10": 0.9379814339324511,
753
+ "eval_custom_dataset_evaluation_cosine_recall@3": 0.8215484890381197,
754
+ "eval_custom_dataset_evaluation_cosine_recall@5": 0.8832214102310882,
755
+ "eval_loss": 0.1959671527147293,
756
+ "eval_runtime": 204.2804,
757
+ "eval_samples_per_second": 9.913,
758
+ "eval_steps_per_second": 0.622,
759
+ "step": 2500
760
+ },
761
+ {
762
+ "epoch": 2.566633761105627,
763
+ "grad_norm": 3.084174871444702,
764
+ "learning_rate": 3.210237659963437e-06,
765
+ "loss": 0.0369,
766
+ "step": 2600
767
+ },
768
+ {
769
+ "epoch": 2.566633761105627,
770
+ "eval_custom_dataset_evaluation_cosine_accuracy@1": 0.6188524590163934,
771
+ "eval_custom_dataset_evaluation_cosine_accuracy@10": 0.9379814339324511,
772
+ "eval_custom_dataset_evaluation_cosine_accuracy@3": 0.8248568042662453,
773
+ "eval_custom_dataset_evaluation_cosine_accuracy@5": 0.882678253999605,
774
+ "eval_custom_dataset_evaluation_cosine_map@100": 0.7355447502017791,
775
+ "eval_custom_dataset_evaluation_cosine_mrr@10": 0.7324816047954649,
776
+ "eval_custom_dataset_evaluation_cosine_ndcg@10": 0.7827478877040044,
777
+ "eval_custom_dataset_evaluation_cosine_precision@1": 0.6188524590163934,
778
+ "eval_custom_dataset_evaluation_cosine_precision@10": 0.09379814339324513,
779
+ "eval_custom_dataset_evaluation_cosine_precision@3": 0.2749522680887484,
780
+ "eval_custom_dataset_evaluation_cosine_precision@5": 0.17653565079992103,
781
+ "eval_custom_dataset_evaluation_cosine_recall@1": 0.6188524590163934,
782
+ "eval_custom_dataset_evaluation_cosine_recall@10": 0.9379814339324511,
783
+ "eval_custom_dataset_evaluation_cosine_recall@3": 0.8248568042662453,
784
+ "eval_custom_dataset_evaluation_cosine_recall@5": 0.882678253999605,
785
+ "eval_loss": 0.19852839410305023,
786
+ "eval_runtime": 203.3999,
787
+ "eval_samples_per_second": 9.956,
788
+ "eval_steps_per_second": 0.624,
789
+ "step": 2600
790
+ },
791
+ {
792
+ "epoch": 2.665350444225074,
793
+ "grad_norm": 0.2841149568557739,
794
+ "learning_rate": 2.4789762340036565e-06,
795
+ "loss": 0.0493,
796
+ "step": 2700
797
+ },
798
+ {
799
+ "epoch": 2.665350444225074,
800
+ "eval_custom_dataset_evaluation_cosine_accuracy@1": 0.6227039304760024,
801
+ "eval_custom_dataset_evaluation_cosine_accuracy@10": 0.9392652577523207,
802
+ "eval_custom_dataset_evaluation_cosine_accuracy@3": 0.8246099150701165,
803
+ "eval_custom_dataset_evaluation_cosine_accuracy@5": 0.8839126999802489,
804
+ "eval_custom_dataset_evaluation_cosine_map@100": 0.7377982498848669,
805
+ "eval_custom_dataset_evaluation_cosine_mrr@10": 0.7347973078888687,
806
+ "eval_custom_dataset_evaluation_cosine_ndcg@10": 0.7847760881684369,
807
+ "eval_custom_dataset_evaluation_cosine_precision@1": 0.6227039304760024,
808
+ "eval_custom_dataset_evaluation_cosine_precision@10": 0.0939265257752321,
809
+ "eval_custom_dataset_evaluation_cosine_precision@3": 0.2748699716900388,
810
+ "eval_custom_dataset_evaluation_cosine_precision@5": 0.1767825399960498,
811
+ "eval_custom_dataset_evaluation_cosine_recall@1": 0.6227039304760024,
812
+ "eval_custom_dataset_evaluation_cosine_recall@10": 0.9392652577523207,
813
+ "eval_custom_dataset_evaluation_cosine_recall@3": 0.8246099150701165,
814
+ "eval_custom_dataset_evaluation_cosine_recall@5": 0.8839126999802489,
815
+ "eval_loss": 0.1986970454454422,
816
+ "eval_runtime": 203.1067,
817
+ "eval_samples_per_second": 9.97,
818
+ "eval_steps_per_second": 0.625,
819
+ "step": 2700
820
+ },
821
+ {
822
+ "epoch": 2.7640671273445214,
823
+ "grad_norm": 35.21987533569336,
824
+ "learning_rate": 1.7477148080438758e-06,
825
+ "loss": 0.0466,
826
+ "step": 2800
827
+ },
828
+ {
829
+ "epoch": 2.7640671273445214,
830
+ "eval_custom_dataset_evaluation_cosine_accuracy@1": 0.6232964645467114,
831
+ "eval_custom_dataset_evaluation_cosine_accuracy@10": 0.9393640134307722,
832
+ "eval_custom_dataset_evaluation_cosine_accuracy@3": 0.8262887616037922,
833
+ "eval_custom_dataset_evaluation_cosine_accuracy@5": 0.8854434129962473,
834
+ "eval_custom_dataset_evaluation_cosine_map@100": 0.7388327302504635,
835
+ "eval_custom_dataset_evaluation_cosine_mrr@10": 0.7358363978944812,
836
+ "eval_custom_dataset_evaluation_cosine_ndcg@10": 0.7856277834747031,
837
+ "eval_custom_dataset_evaluation_cosine_precision@1": 0.6232964645467114,
838
+ "eval_custom_dataset_evaluation_cosine_precision@10": 0.09393640134307724,
839
+ "eval_custom_dataset_evaluation_cosine_precision@3": 0.2754295872012641,
840
+ "eval_custom_dataset_evaluation_cosine_precision@5": 0.17708868259924945,
841
+ "eval_custom_dataset_evaluation_cosine_recall@1": 0.6232964645467114,
842
+ "eval_custom_dataset_evaluation_cosine_recall@10": 0.9393640134307722,
843
+ "eval_custom_dataset_evaluation_cosine_recall@3": 0.8262887616037922,
844
+ "eval_custom_dataset_evaluation_cosine_recall@5": 0.8854434129962473,
845
+ "eval_loss": 0.20075508952140808,
846
+ "eval_runtime": 203.5383,
847
+ "eval_samples_per_second": 9.949,
848
+ "eval_steps_per_second": 0.624,
849
+ "step": 2800
850
+ },
851
+ {
852
+ "epoch": 2.8627838104639682,
853
+ "grad_norm": 1.2376320362091064,
854
+ "learning_rate": 1.0164533820840951e-06,
855
+ "loss": 0.03,
856
+ "step": 2900
857
+ },
858
+ {
859
+ "epoch": 2.8627838104639682,
860
+ "eval_custom_dataset_evaluation_cosine_accuracy@1": 0.6220620185660676,
861
+ "eval_custom_dataset_evaluation_cosine_accuracy@10": 0.9396109026269011,
862
+ "eval_custom_dataset_evaluation_cosine_accuracy@3": 0.8248568042662453,
863
+ "eval_custom_dataset_evaluation_cosine_accuracy@5": 0.8844558562117322,
864
+ "eval_custom_dataset_evaluation_cosine_map@100": 0.7376002793094979,
865
+ "eval_custom_dataset_evaluation_cosine_mrr@10": 0.7346429237637674,
866
+ "eval_custom_dataset_evaluation_cosine_ndcg@10": 0.7847496074277119,
867
+ "eval_custom_dataset_evaluation_cosine_precision@1": 0.6220620185660676,
868
+ "eval_custom_dataset_evaluation_cosine_precision@10": 0.09396109026269013,
869
+ "eval_custom_dataset_evaluation_cosine_precision@3": 0.2749522680887484,
870
+ "eval_custom_dataset_evaluation_cosine_precision@5": 0.17689117124234646,
871
+ "eval_custom_dataset_evaluation_cosine_recall@1": 0.6220620185660676,
872
+ "eval_custom_dataset_evaluation_cosine_recall@10": 0.9396109026269011,
873
+ "eval_custom_dataset_evaluation_cosine_recall@3": 0.8248568042662453,
874
+ "eval_custom_dataset_evaluation_cosine_recall@5": 0.8844558562117322,
875
+ "eval_loss": 0.2035462111234665,
876
+ "eval_runtime": 202.781,
877
+ "eval_samples_per_second": 9.986,
878
+ "eval_steps_per_second": 0.626,
879
+ "step": 2900
880
+ },
881
+ {
882
+ "epoch": 2.9615004935834155,
883
+ "grad_norm": 0.5317863821983337,
884
+ "learning_rate": 2.8519195612431445e-07,
885
+ "loss": 0.0633,
886
+ "step": 3000
887
+ },
888
+ {
889
+ "epoch": 2.9615004935834155,
890
+ "eval_custom_dataset_evaluation_cosine_accuracy@1": 0.621963262887616,
891
+ "eval_custom_dataset_evaluation_cosine_accuracy@10": 0.9401046810191586,
892
+ "eval_custom_dataset_evaluation_cosine_accuracy@3": 0.8262393837645665,
893
+ "eval_custom_dataset_evaluation_cosine_accuracy@5": 0.8843077226940549,
894
+ "eval_custom_dataset_evaluation_cosine_map@100": 0.7376242387041089,
895
+ "eval_custom_dataset_evaluation_cosine_mrr@10": 0.7346985522104195,
896
+ "eval_custom_dataset_evaluation_cosine_ndcg@10": 0.7849111131501391,
897
+ "eval_custom_dataset_evaluation_cosine_precision@1": 0.621963262887616,
898
+ "eval_custom_dataset_evaluation_cosine_precision@10": 0.09401046810191586,
899
+ "eval_custom_dataset_evaluation_cosine_precision@3": 0.2754131279215221,
900
+ "eval_custom_dataset_evaluation_cosine_precision@5": 0.17686154453881098,
901
+ "eval_custom_dataset_evaluation_cosine_recall@1": 0.621963262887616,
902
+ "eval_custom_dataset_evaluation_cosine_recall@10": 0.9401046810191586,
903
+ "eval_custom_dataset_evaluation_cosine_recall@3": 0.8262393837645665,
904
+ "eval_custom_dataset_evaluation_cosine_recall@5": 0.8843077226940549,
905
+ "eval_loss": 0.20363624393939972,
906
+ "eval_runtime": 203.946,
907
+ "eval_samples_per_second": 9.929,
908
+ "eval_steps_per_second": 0.623,
909
+ "step": 3000
910
+ }
911
+ ],
912
+ "logging_steps": 100,
913
+ "max_steps": 3039,
914
+ "num_input_tokens_seen": 0,
915
+ "num_train_epochs": 3,
916
+ "save_steps": 500,
917
+ "stateful_callbacks": {
918
+ "TrainerControl": {
919
+ "args": {
920
+ "should_epoch_stop": false,
921
+ "should_evaluate": false,
922
+ "should_log": false,
923
+ "should_save": true,
924
+ "should_training_stop": true
925
+ },
926
+ "attributes": {}
927
+ }
928
+ },
929
+ "total_flos": 0.0,
930
+ "train_batch_size": 16,
931
+ "trial_name": null,
932
+ "trial_params": null
933
+ }
training_args.bin ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:a94c44eb80a75a6bf64112fe418a0d995105175028bb9a26b141abd8ec356d2e
3
+ size 5560
vocab.txt ADDED
The diff for this file is too large to render. See raw diff