![]()
عبدالكريم الخطيب
باحث في معالجة اللغة العربية ومهندس ذكاء اصطناعي
أُطوّر معالجة اللغة العربية الطبيعية من خلال تصميم نماذج فعّالة، ومحولات قابلة للنشر على الأجهزة الطرفية، وأنظمة ذكاء اصطناعي إنتاجية لأكثر من 500 مليون متحدث بالعربية.
📞 +20 101 364 6887 ✉️ kareem01095134688@gmail.com
مجال البحث
أبحاث معالجة اللغة العربية الطبيعية والتعلم العميق الفعّال — بناء نماذج أصغر وأسرع للأجهزة محدودة الموارد.
ذكاء اصطناعي متكامل: تدريب تضمينات عربية ومشفرات ذاتية متناثرة Sparse Autoencoders، نشر محولات محسّنة لوحدة المعالجة المركزية، بناء أنظمة RAG إنتاجية.
أتابع دراسة الماجستير في تحسين المحولات من حيث كفاءة المعالجة للغة العربية.
الخبرات
مهندس ذكاء اصطناعي طبي
دوام كامل
تطوير حلول هندسة طبية بالذكاء الاصطناعي باستخدام Python والتعلم العميق وMedical AI.
مهندس ذكاء اصطناعي
دوام كامل
- بَنَيت منصة عقارية متكاملة بالذكاء الاصطناعي: بحث دلالي، مساعد RAG، سير عمل متعدد الوكلاء
- بحث متجهي عبر 500 مشروع (13 ألف وحدة، 160 مطوراً)؛ تحسين الدقة من 30% إلى 92%
- مصنع وكلاء ذكاء اصطناعي: يُنشئ وكلاء مخصصين بسير عمل ديناميكي في أقل من دقيقتين
- تقليل وقت سير عمل الوسيط من 90 ثانية إلى 15 ثانية (تحسين بنسبة 83%)
مهندس NLP — معالجة اللغة العربية
دوام جزئي
ساهمت في تطوير نماذج عربية متطورة في NLP (LLMs، تضمين، OCR، ASR). مشرف في مجتمع NAMMA مفتوح المصدر لتطوير معالجة اللغة العربية.
مهندس تعلم آلي
دوام كامل
طوّرت نظام ATS باستخدام NLP وLLMs لتحسين مطابقة السير الذاتية مع الوظائف.
التعليم
بكالوريوس علوم الحاسب
سبتمبر 2020 – يونيو 2024
المعدل: 3.54/4
- مشروع التخرج: تطبيق رعاية أطفال بالذكاء الاصطناعي (تحليل بكاء الرضع)
- أتابع دراسة الماجستير: تحسين المحولات من حيث كفاءة المعالجة للغة العربية NLP
أبحاث في معالجة اللغة العربية
نماذج التضمين العربية
BertHash-Femto
أصغر 113 مرة من AraBERTv2، بدقة 94%. محول عربي يعمل على الأجهزة الطرفية. أبحاث كفاءة في ضغط نماذج معالجة اللغة العربية.
Zarra & Bojji
نماذج لغوية عربية صغيرة محسّنة للنشر على الأجهزة المحمولة والطرفية. جزء من أبحاث كفاءة معالجة اللغة العربية المستمرة.
نماذج الرؤية واللغة للعربية
Qari-OCR
أحدث نظام OCR عربي باستخدام تكيف نماذج اللغة متعددة الوسائط. WER 0.160, CER 0.061 على النصوص العربية المشكولة. منشور في arXiv 2025.
الكلام والصوت
Ara-Nemotron 3.5 ASR
تعرف على الكلام العربي بالبث المباشر للنسخ الفوري. يدعم لهجات عربية متعددة.
Arabic TTS
بناء نموذج تحويل النص إلى كلام عربي من الصفر يستهدف جميع اللهجات الرئيسية. قيد التطوير.
العوامل الذكية واستخدام الأدوات
Gemma3 Arabic Tool Calling
ضبط نموذج Gemma 3 لاستدعاء الأدوات بالعربية. نهج بدون RAG يُعلّم النموذج استدعاء الأدوات مباشرة بالعربية.
أدوات ومنصات
SEO Rat
أداة تحليل SEO مفتوحة المصدر للمواقع الثابتة باستخدام بيانات Google Search Console.
أبرز المقالات في NLP العربية والذكاء الاصطناعي
ضبط Gemma 3 لاستدعاء الأدوات بالعربية
نهج بدون RAP لتعليم Gemma 3 استدعاء الأدوات بالعربية — استخراج الكلمات المفتاحية، التفويض إلى grep، وبناء بيانات تدريب باستخدام MIRACL.
HyperRun + ColGrep: بديل مستضاف ذاتياً لـ RunLLM
أضف أداة الدردشة “اسأل الذكاء الاصطناعي” لأي موقع توثيق باستخدام ColGrep للبحث الدلالي للكود و FastHTML.
عرض جميع المقالات ← · سلسلة التضمين ←
فقالَ: إن تَصدُقِ اللَّهَ يَصدُقْكَ