BGE-M3

نموذج تضمين متعدد اللغات للاسترجاع الدلالي في أنظمة RAG العربية والثنائية.

ما هو النموذج

`BAAI/bge-m3` نموذج Embedding متعدد اللغات من BAAI، مناسب لبناء تمثيل متجه للنصوص العربية والإنجليزية.

ماذا يفعل

  • تحويل النصوص إلى متجهات دلالية.
  • تحسين الاسترجاع في البحث الدلالي وRAG.
  • يدعم أحجام بيانات كبيرة بكفاءة جيدة.

مقارنة سريعة

  • ليس نموذج محادثة؛ يستخدم قبل نموذج التوليد.
  • يكمل `BGE Reranker` للحصول على ترتيب نتائج أدق.

أفضل استخدام على DCP

  • فهرسة الوثائق العربية.
  • استرجاع مقاطع مرجعية قبل الإجابة.

متطلبات العتاد

  • الحد الأدنى العملي: `8 GB VRAM`.
  • GPU مناسب: `RTX 3090` أو `RTX 4090`.

التشغيل على DCP

  • قالب موصى به: `arabic-embeddings`
  • معرف النموذج:
BAAI/bge-m3
  • مثال طلب API:
{
  "job_type": "vllm_serve",
  "params": {
    "model": "BAAI/bge-m3",
    "mode": "embedding"
  }
}

الترخيص والاستخدام التجاري

  • الترخيص: `MIT`.
  • الاستخدام التجاري: مسموح ضمن شروط MIT.