BGE-M3
نموذج تضمين متعدد اللغات للاسترجاع الدلالي في أنظمة RAG العربية والثنائية.
ما هو النموذج
`BAAI/bge-m3` نموذج Embedding متعدد اللغات من BAAI، مناسب لبناء تمثيل متجه للنصوص العربية والإنجليزية.
ماذا يفعل
- تحويل النصوص إلى متجهات دلالية.
- تحسين الاسترجاع في البحث الدلالي وRAG.
- يدعم أحجام بيانات كبيرة بكفاءة جيدة.
مقارنة سريعة
- ليس نموذج محادثة؛ يستخدم قبل نموذج التوليد.
- يكمل `BGE Reranker` للحصول على ترتيب نتائج أدق.
أفضل استخدام على DCP
- فهرسة الوثائق العربية.
- استرجاع مقاطع مرجعية قبل الإجابة.
متطلبات العتاد
- الحد الأدنى العملي: `8 GB VRAM`.
- GPU مناسب: `RTX 3090` أو `RTX 4090`.
التشغيل على DCP
- قالب موصى به: `arabic-embeddings`
- معرف النموذج:
BAAI/bge-m3- مثال طلب API:
{
"job_type": "vllm_serve",
"params": {
"model": "BAAI/bge-m3",
"mode": "embedding"
}
}الترخيص والاستخدام التجاري
- الترخيص: `MIT`.
- الاستخدام التجاري: مسموح ضمن شروط MIT.