aiNarabic 💭
aiNarabic 💭
February 16, 2025 at 08:25 PM
أقوى محرك استدلال مفتوح المصدر (SGLang) 🤯🚀 إذا كنت تبحث عن أداء استثنائي في تشغيل النماذج اللغوية والبصرية الضخمة .. (SGLang هو الحل) !!! محرك استدلال مفتوح المصدر يوفر سرعة أعلى بـ 2-5 مرات من الحلول المنافسة، وهو أول من طبق التنبؤ متعدد الرموز (MTP) لـ DeepSeek R1 لتسريع الأداء بنسبة 1.76x. 👀 جولة في أهم ميزات وإسهامات SGLang الصناعية د 👇 ✴️ أداء متقدم في سيناريوهات المحادثة وRAG حيث يعتمد على RadixAttention ويعيد استخدام أجزاء النص المشترك، وبالتالي تعزيز الإنتاجية بمقدار 5x. ✴️ تسريع إخراج البيانات المهيكلة (JSON/XML) بمقدار 3.1x عبر تجاوز العناصر المحددة مسبقًا، كما يحقق أداء اسرع بـ 10x مع xgrammar في فك ترميز الـ JSON بفضل الـ Compressed Finite State Machine. ✴️ إدارة محسنة لوحدة المعالجة المركزية لتجنب الاختناقات على مستوى الجهاز المستضيف. ✴️ أداء عبقري:     ⚡ 5000 رمز/ثانية لـ Llama3-8B على A100     🔥 10,000 رمز/ثانية لـ Llama3-70B على 8xH100 ✴️ يستخدم في الإنتاج من قبل عمالقة التكنولوجيا مثل Meituan وByteDance وxAI وCursor و Stanford وLinkedin .. الخ. ✴️ متوافق مع @OpenAI ويدعم NVIDIA وAMD مع تكامل كامل مع تقنيات التكميم (FP8/INT4/AWQ/GPTQ). ✴️ تعالج Bytedance حوالي 70% من أنظمة NLP الداخلية باستخدام SGLang (معالجة 5 بيتابايت من البيانات يوميًا). ✴️ خفض تكاليف تشغيل Grok من xAI بنسبة 37% عبر إعادة استخدام ذاكرة KV وتحسين الجدولة (يتيح 23 مليون محادثة يوميًا). ✴️ الأسرع في تشغيل DeepSeek R1 بفضل تقنية Multi-Token Prediction (MTP). ✴️ دعم موسع للنماذج مثل: Llama وMistral وGemma وQwen وDeepSeek وPhi وGranite وLLaVA. ـــــــــ رابط الـ GitHub 🔗 https://lnkd.in/eCkkbTPQ رابط الـ documentation 🔗 https://docs.sglang.ai/ #الذكاء_الاصطناعي_بالعربي #ainarabic #mohd_n@SS
❤️ 1

Comments