مجموعه LLM-Pruning: راهکارهای فشردهسازی مدلهای زبانی بزرگ
مقدمه با پیشرفت تکنولوژی پردازش زبان طبیعی و ظهور مدلهای زبانی بزرگ (LLMs)، چالشهای جدیدی در زمینه بهینهسازی و فشردهسازی این مدلها نمایان شده است. پژوهشگران دانشگاه پرینستون اخیراً مجموعه LLM-Pruning را معرفی کردهاند، یک مخزن مبتنی بر JAX که هدفش فراهم آوردن فریمورکی یکپارچه برای مقایسه و ارزیابی الگوریتمهای…







