SON, SEONG HO's picture

SON, SEONG HO

geronest

·

AI & ML interests

None yet

Recent Activity

updated a dataset 13 days ago

SWE-Router/swebench-verified-gemini-3-pro-preview

published a dataset 13 days ago

SWE-Router/swebench-verified-gemini-3-pro-preview

commentedon a paper about 1 month ago

Multi-Task GRPO: Reliable LLM Reasoning Across Tasks

View all activity

Organizations

updated a dataset 13 days ago

SWE-Router/swebench-verified-gemini-3-pro-preview

Viewer • Updated 13 days ago • 500 • 10

published a dataset 13 days ago

SWE-Router/swebench-verified-gemini-3-pro-preview

Viewer • Updated 13 days ago • 500 • 10

commented a paper about 1 month ago

Multi-Task GRPO: Reliable LLM Reasoning Across Tasks

Paper • 2602.05547 • Published Feb 5 • 12 •

upvoted a paper about 1 month ago

Multi-Task GRPO: Reliable LLM Reasoning Across Tasks

Paper • 2602.05547 • Published Feb 5 • 12

updated a model about 2 months ago

Meta-Okapi/ca_bloom7b1_adaptdpo_tdata100_lora_2msteps_200steps_batch20_gradacc2_200steps

published a model about 2 months ago

Meta-Okapi/ca_bloom7b1_adaptdpo_tdata100_lora_2msteps_200steps_batch20_gradacc2_200steps

updated a model about 2 months ago

Meta-Okapi/ro_bloom7b1_adaptdpo_tdata100_lora_2msteps_200steps_batch20_gradacc2_200steps

published a model about 2 months ago

Meta-Okapi/ro_bloom7b1_adaptdpo_tdata100_lora_2msteps_200steps_batch20_gradacc2_200steps

updated a model about 2 months ago

Meta-Okapi/fr_bloom7b1_adaptdpo_tdata100_lora_2msteps_200steps_batch20_gradacc2_200steps

published a model about 2 months ago

Meta-Okapi/fr_bloom7b1_adaptdpo_tdata100_lora_2msteps_200steps_batch20_gradacc2_200steps

updated a model about 2 months ago

Meta-Okapi/ro_dpo_lora_nosft1_tdata100all_200steps_batch10_gradacc4_200steps

published a model about 2 months ago

Meta-Okapi/ro_dpo_lora_nosft1_tdata100all_200steps_batch10_gradacc4_200steps

updated a model about 2 months ago

Meta-Okapi/ca_dpo_lora_nosft1_tdata100all_200steps_batch10_gradacc4_200steps

published a model about 2 months ago

Meta-Okapi/ca_dpo_lora_nosft1_tdata100all_200steps_batch10_gradacc4_200steps

updated a model about 2 months ago

Meta-Okapi/fr_dpo_lora_nosft1_tdata100all_200steps_batch10_gradacc4_200steps

published a model about 2 months ago

Meta-Okapi/fr_dpo_lora_nosft1_tdata100all_200steps_batch10_gradacc4_200steps

updated a model about 2 months ago

Meta-Okapi/ca_dpo_lora_nosft1_tdata40000all_2000steps_batch20_gradacc2_2000steps

published a model about 2 months ago

Meta-Okapi/ca_dpo_lora_nosft1_tdata40000all_2000steps_batch20_gradacc2_2000steps

updated a model about 2 months ago

Meta-Okapi/ro_dpo_lora_nosft1_tdata40000all_2000steps_batch20_gradacc2_2000steps

published a model about 2 months ago

Meta-Okapi/ro_dpo_lora_nosft1_tdata40000all_2000steps_batch20_gradacc2_2000steps