عبدالكريم الخطيب — باحث في معالجة اللغة العربية والذكاء الاصطناعي

عبدالكريم الخطيب

باحث في معالجة اللغة العربية ومهندس ذكاء اصطناعي

أُطوّر معالجة اللغة العربية الطبيعية من خلال تصميم نماذج فعّالة، ومحولات قابلة للنشر على الأجهزة الطرفية، وأنظمة ذكاء اصطناعي إنتاجية لأكثر من 500 مليون متحدث بالعربية.

📞 +20 101 364 6887 ✉️ kareem01095134688@gmail.com

مجال البحث

أبحاث معالجة اللغة العربية الطبيعية والتعلم العميق الفعّال — بناء نماذج أصغر وأسرع للأجهزة محدودة الموارد.

ذكاء اصطناعي متكامل: تدريب تضمينات عربية ومشفرات ذاتية متناثرة Sparse Autoencoders، نشر محولات محسّنة لوحدة المعالجة المركزية، بناء أنظمة RAG إنتاجية.

أتابع دراسة الماجستير في تحسين المحولات من حيث كفاءة المعالجة للغة العربية.

الخبرات

مهندس ذكاء اصطناعي طبي

دوام كامل

Gravliog · عن بُعد · فبراير 2026 – الآن

تطوير حلول هندسة طبية بالذكاء الاصطناعي باستخدام Python والتعلم العميق وMedical AI.

مهندس ذكاء اصطناعي

دوام كامل

Xbites · عن بُعد · أبريل 2025 – ديسمبر 2025

  • بَنَيت منصة عقارية متكاملة بالذكاء الاصطناعي: بحث دلالي، مساعد RAG، سير عمل متعدد الوكلاء
  • بحث متجهي عبر 500 مشروع (13 ألف وحدة، 160 مطوراً)؛ تحسين الدقة من 30% إلى 92%
  • مصنع وكلاء ذكاء اصطناعي: يُنشئ وكلاء مخصصين بسير عمل ديناميكي في أقل من دقيقتين
  • تقليل وقت سير عمل الوسيط من 90 ثانية إلى 15 ثانية (تحسين بنسبة 83%)

مهندس NLP — معالجة اللغة العربية

دوام جزئي

NAMMA · عن بُعد · نوفمبر 2024 – أغسطس 2025

ساهمت في تطوير نماذج عربية متطورة في NLP (LLMs، تضمين، OCR، ASR). مشرف في مجتمع NAMMA مفتوح المصدر لتطوير معالجة اللغة العربية.

مهندس تعلم آلي

دوام كامل

Repotech · عن بُعد · نوفمبر 2023 – مايو 2024

طوّرت نظام ATS باستخدام NLP وLLMs لتحسين مطابقة السير الذاتية مع الوظائف.

التعليم

🎓

بكالوريوس علوم الحاسب

كلية الحاسبات والذكاء الاصطناعي، جامعة كفر الشيخ، مصر

سبتمبر 2020 – يونيو 2024

المعدل: 3.54/4

  • مشروع التخرج: تطبيق رعاية أطفال بالذكاء الاصطناعي (تحليل بكاء الرضع)
  • أتابع دراسة الماجستير: تحسين المحولات من حيث كفاءة المعالجة للغة العربية NLP

أبحاث في معالجة اللغة العربية

نماذج التضمين العربية

Zarra & Bojji

نماذج لغوية عربية صغيرة محسّنة للنشر على الأجهزة المحمولة والطرفية. جزء من أبحاث كفاءة معالجة اللغة العربية المستمرة.

→ اقرأ المزيد

نماذج الرؤية واللغة للعربية

Arabic ColPali

نموذج رؤية-لغة لاسترجاع المستندات العربية باستخدام بنية ColPali.

→ HuggingFace

الكلام والصوت

Ara-Nemotron 3.5 ASR

تعرف على الكلام العربي بالبث المباشر للنسخ الفوري. يدعم لهجات عربية متعددة.

→ HuggingFace

Arabic TTS

بناء نموذج تحويل النص إلى كلام عربي من الصفر يستهدف جميع اللهجات الرئيسية. قيد التطوير.

العوامل الذكية واستخدام الأدوات

Gemma3 Arabic Tool Calling

ضبط نموذج Gemma 3 لاستدعاء الأدوات بالعربية. نهج بدون RAG يُعلّم النموذج استدعاء الأدوات مباشرة بالعربية.

→ HuggingFace

أدوات ومنصات

GPUVec منصة مقارنة أسعار GPU واختبارات ML

GPUVec

منصة مقارنة أسعار وحدات معالجة الرسوميات واختبارات أداء التعلم الآلي.

→ اطّلع عليه

SEO Rat

أداة تحليل SEO مفتوحة المصدر للمواقع الثابتة باستخدام بيانات Google Search Console.

→ GitHub

أبرز المقالات في NLP العربية والذكاء الاصطناعي

ضبط Gemma 3 لاستدعاء الأدوات بالعربية

ضبط Gemma 3 لاستدعاء الأدوات بالعربية

نهج بدون RAP لتعليم Gemma 3 استدعاء الأدوات بالعربية — استخراج الكلمات المفتاحية، التفويض إلى grep، وبناء بيانات تدريب باستخدام MIRACL.

أداة الدردشة الذكية المستضافة ذاتياً HyperRun

HyperRun + ColGrep: بديل مستضاف ذاتياً لـ RunLLM

أضف أداة الدردشة “اسأل الذكاء الاصطناعي” لأي موقع توثيق باستخدام ColGrep للبحث الدلالي للكود و FastHTML.

عرض جميع المقالات ← · سلسلة التضمين ←

فقالَ: إن تَصدُقِ اللَّهَ يَصدُقْكَ