قدرة النصوص الطويلة ب40,000 توكن للنموذج الكبير تكشف عن مرحلة جديدة في الذكاء الاصطناعي

تقنية النصوص الطويلة تدفع النماذج الكبيرة إلى مرحلة جديدة

تعمل النماذج الكبيرة على تعزيز قدرتها على معالجة النصوص الطويلة بسرعة مذهلة. من 4000 توكن في البداية إلى 400000 توكن في الوقت الحاضر، يمثل هذا التقدم الثوري إنجازاً كبيراً في معالجة المعلومات المعقدة من قبل الذكاء الاصطناعي.

في الوقت الحالي، تركز العديد من الشركات الكبرى في مجال النماذج التقنية والوكالات البحثية في الداخل والخارج على توسيع طول السياق كوجهة ترقية رئيسية. لا تعكس هذه الاتجاهات التقدم التكنولوجي فحسب، بل تشير أيضًا إلى توسيع مجالات تطبيق الذكاء الاصطناعي.

تحسين القدرة على التعامل مع النصوص الطويلة يعني أن النموذج يمكنه معالجة محتوى أكثر تعقيدًا وعمقًا. من قراءة مقالات قصيرة إلى فهم كتب كاملة، وصولًا إلى تحليل مستندات قانونية طويلة، فإن نطاق تطبيق النماذج الكبيرة يتوسع باستمرار. هذه التقدمات توفر إمكانيات جديدة للترقية الذكية في مجالات مثل المالية، والعدالة، والبحث العلمي.

ومع ذلك، فإن طول النص ليس دائماً الأفضل. تظهر الأبحاث أن الاستخدام الفعال لمحتوى السياق أكثر أهمية من مجرد السعي وراء الطول. لا يزال الاستكشاف في الصناعة حول طول النص مستمراً، وقد تكون 400000 توكن مجرد بداية.

تتمثل أسباب تركيز شركات النماذج الكبيرة على تقنية النصوص الطويلة في أن قيود طول الإدخال تسبب العديد من الصعوبات في تطبيقات الواقع. على سبيل المثال، في مشاهد الشخصيات الافتراضية، وتطوير الألعاب، والتحليل القانوني، يمكن أن يؤدي قصر طول الإدخال إلى فقدان المعلومات أو ضعف النتائج. من المتوقع أن تحقق الاختراقات في تقنية النصوص الطويلة حلاً لهذه المشكلات.

تقنية النص الطويل لا تعزز فقط من وظائف النماذج الكبيرة، بل هي أيضًا مفتاح لدفع تطبيقات الصناعة إلى الأرض. إنها تشير إلى انتقال النماذج الكبيرة العامة من LLM إلى عصر Long LLM. الجيل الجديد من الروبوتات المحادثة يتجه نحو التخصص، والتخصيص، والتعمق، وهذا قد يصبح أداة مهمة لتحفيز تطبيقات الصناعة.

ومع ذلك، تواجه تقنية النصوص الطويلة معضلة "المثلث المستحيل": هناك قيود متبادلة بين طول النص والانتباه والقدرة الحسابية. وهذا يرجع أساسًا إلى أن كمية الحساب في آلية الانتباه الذاتي في بنية Transformer تنمو بشكل تربيعي مع طول السياق.

لحل هذه المشكلة، هناك ثلاث خطط رئيسية حالياً: استخدام أدوات خارجية للمساعدة في المعالجة، تحسين حساب آلية الانتباه الذاتي، واستخدام طرق تحسين النموذج. كل خطة لها مزاياها وعيوبها، ويحتاج مصنّعو النماذج الكبيرة إلى إيجاد التوازن الأمثل بين طول النص والانتباه والحوسبة.

على الرغم من أن تقنية النصوص الطويلة لا تزال تواجه تحديات، إلا أنها بلا شك تفتح آفاقاً جديدة لتطوير النماذج الكبيرة. مع التقدم المستمر في التكنولوجيا، لدينا أسباب للاعتقاد أن الذكاء الاصطناعي سيحقق اختراقات أكبر في معالجة المعلومات المعقدة وحل المشكلات العملية.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • 7
  • مشاركة
تعليق
0/400
GhostWalletSleuthvip
· 07-14 05:49
مايسترو تحليل النصوص!
شاهد النسخة الأصليةرد0
HodlTheDoorvip
· 07-13 17:02
واو، 40 ألف! يمكن للذكاء الاصطناعي أيضًا قراءة الروايات الطويلة.
شاهد النسخة الأصليةرد0
ContractSurrendervip
· 07-11 15:35
تقصير就行了
شاهد النسخة الأصليةرد0
InscriptionGrillervip
· 07-11 15:34
ارتفع token بهذا القدر، حتى الحمقى القدامى في الدائرة ارتفعوا في الموقف.
شاهد النسخة الأصليةرد0
Ser_Liquidatedvip
· 07-11 15:10
ما هي أهمية النص الطويل، في النهاية هو مجرد ذكاء اصطناعي.
شاهد النسخة الأصليةرد0
rekt_but_not_brokevip
· 07-11 15:10
كمية كبيرة تكفي وتزيد
شاهد النسخة الأصليةرد0
ForkThisDAOvip
· 07-11 15:09
ما فائدة أن يكون الرمز أطول إذا لم يكن بالإمكان تناوله كطعام؟
شاهد النسخة الأصليةرد0
  • تثبيت