هذا المقال هو الأساس لنموذج الـ Transformer، والذي تم استخدامه لاحقاً لبناء نماذج مثل GPT وBERT. يقدم المقال بنية مبتكرة تعتمد على مفهوم “الاهتمام” في الشبكات العصبية، وهو يعتبر مرجعاً أساسياً للمهتمين بتطبيقات معالجة اللغة الطبيعية.

لتحميل البحث : إضـغـط هـنـا

التعليقات معطلة.