اخر الاخبار

جوجل تطلق نماذج Gemma 4 بتقنية QAT: ثورة في كفاءة الذكاء الاصطناعي على الأجهزة المحمولة

 

جوجل تطلق نماذج Gemma 4 بتقنية QAT


أعلنت شركة جوجل رسمياً عن إتاحة نماذج Gemma 4 المفتوحة المصدر للتحميل، مدعومة بتقنية "التدريب المدرك للكمية" (Quantization-Aware Training - QAT). تهدف هذه الخطوة الاستراتيجية إلى تقليص حجم النماذج وبصمتها في الذاكرة بشكل كبير، مما يمهد الطريق لتشغيل ذكاء اصطناعي عالي الجودة مباشرة على الهواتف الذكية وأجهزة الكمبيوتر المحمولة دون الاعتماد على السحابة.


الابتكار التقني: QAT بدلاً من PTQ تعتمد معظم النماذج المخففة عادةً على تقنية "الكمية بعد التدريب" (Post-Training Quantization - PTQ)، والتي تقوم بضغط النموذج بعد اكتمال بنائه، مما قد يؤدي غالباً إلى تراجع في دقة الأداء. أما في نماذج Gemma 4 الجديدة، فقد دمجت جوجل عملية "الكمية" داخل مرحلة التدريب نفسها (QAT).


  • الحفاظ على الجودة: تضمن تقنية QAT احتفاظ النماذج بجودة قريبة جداً من تنسيق (bfloat16) الأصلي رغم ضغطها.


  • السرعة والكفاءة: تساهم هذه التقنية في تسريع عملية فك التشفير (Decode Speed) وتقليل استهلاك موارد النظام.


مخطط ضغط مخصص للأجهزة المحمولة كشفت جوجل أن النماذج المضغوطة تعمل بكفاءة استثنائية على الهواتف بفضل "مخطط كمية محمول" (Mobile-Quantization Schema) مخصص، يتضمن:


  • استخدام إعدادات مسبقة الحساب لتحسين الأداء.
  • تطبيق ضغط بمعدل 2-بت (2-bit compression) في أجزاء محددة من النموذج.
  • تقنيات متطورة لضغط قائمة المفردات (Vocabulary) والذاكرة قصيرة المدى.


أحجام النماذج ومتطلبات الذاكرة تتوفر نماذج Gemma 4 المحسنة بتقنية QAT بخمسة أحجام مختلفة لتناسب مختلف مستويات العتاد:


  • Gemma 4 E2B: الأصغر حجماً (للنصوص فقط)، ويتطلب أقل من 1 جيجابايت من الذاكرة، مما يجعله مثالياً للهواتف الاقتصادية.
  • Gemma 4 E4B.
  • Gemma 4 12B: النموذج المخصص لأجهزة اللابتوب.
  • Gemma 4 26B A4B.
  • Gemma 4 31B: النسخة الأكبر والأكثر قدرة.


تعدد التنسيقات وسهولة الوصول وفرت جوجل النماذج بأربعة تنسيقات برمجية لتسهيل دمجها من قبل المطورين:


  • نقاط فحص QAT غير مكممة (Unquantized).
  • تنسيق GGUF الموحد.
  • التنسيق المحسن للأجهزة المحمولة (Mobile-optimized).
  • التنسيق المكثف للموترات (Compressed Tensors).


يمكن للمستخدمين والمطورين الآن تحميل أوزان النماذج وتشغيلها عبر منصات شهيرة مثل Hugging Face و LM Studio، مما يفتح آفاقاً جديدة لتطبيقات الذكاء الاصطناعي المحلية التي تحافظ على خصوصية البيانات وتعمل دون الحاجة لاتصال بالإنترنت.

ليست هناك تعليقات:

إرسال تعليق