مقدمه
در دنیای امروز، پیشرفتهای قابل توجهی در زمینه هوش مصنوعی و مدلهای زبانی به وجود آمده است. یکی از این پیشرفتها، معرفی مدل بازگشتی کوچک (TRM) توسط سامسونگ SAIT در مونترال است. این مدل که تنها ۷ میلیون پارامتر دارد، توانسته است در استدلال به نتایج قابل توجهی دست یابد و برتریهای خود را در مقایسه با مدلهای بزرگتر مانند DeepSeek-R1 و o3-mini نشان دهد. در این مقاله، به بررسی عملکرد این مدل و چگونگی موفقیت آن پرداخته میشود.
مدل بازگشتی کوچک (TRM) چیست؟
مدل TRM، یک مدل بازگشتی دو لایه است که برای حل مسائل استدلال طراحی شده است. این مدل با استفاده از یک رویکرد تکراری و بهروزرسانی مداوم یک latent scratchpad، روند حل مسأله را بهینه کرده و به نتایج بهتری دستیافته است. بهطور خاص، این مدل موفق به کسب 44.6 تا 45 درصد دقت آزمایشی در ARC-AGI-1 و 7.8 تا 8 درصد در ARC-AGI-2 شده است.
عملکرد TRM در آزمونهای استدلال
آزمونهای ARC-AGI طراحی شدهاند تا قدرت استدلال مدلها را ارزیابی کنند. مدل TRM بهطور قابلتوجهی در آزمونها عملکرد بهتری در مقایسه با دیگر مدلهای بزرگتر داشت، بهطوریکه حتی مدلهای دیگری مانند Gemini 2.5 pro و o3-mini نیز از آن عقب ماندند. این نکته، حاکی از توانایی بالای مدل TRM در پردازش اطلاعات و انجام استدلالهای پیچیده است.
چگونگی عملکرد TRM
مدل TRM از یک معماری نوآورانه و الگوریتمهای تکراری بهره میبرد. یکی از ویژگیهای کلیدی این مدل، توانایی آن در بروزرسانی مستمر فرآیندهای یادگیری و استدلال است. این ویژگی باعث میشود که TRM بتواند در زمان کمتری نتایج بهتر و دقیقتری را ارائه دهد. به عنوان مثال، هنگامی که مدل با یک مسأله مواجه میشود، میتواند به طور مداوم اطلاعات را پردازش کرده و پاسخهای خود را بر اساس اطلاعات جدید بهروزرسانی کند.
مزایای مدل TRM نسبت به مدلهای دیگر
- صرفهجویی در منابع: با توجه به اینکه TRM تنها ۷ میلیون پارامتر دارد، انرژی و منابع محاسباتی کمتری نسبت به مدلهای بزرگتر مصرف میکند.
- استدلال بهتر: توانایی مدل در بروزرسانی اطلاعات به آن این امکان را میدهد که در اجرای استدلالهای پیچیده، دقت بالاتری داشته باشد.
- قابلیت تعمیم: TRM توانسته است به عنوان یک مدل عمومی، در زمینههای مختلفی از جمله پردازش زبان طبیعی و هوش مصنوعی به خوبی عمل کند.
نتیجهگیری
مدل بازگشتی کوچک (TRM) نشانهای از پیشرفتهای چشمگیر در زمینه هوش مصنوعی و بهویژه در استدلالهای پیچیده است. با پیروی از یک راهکار تکراری و بهینهسازی مداوم، این مدل بهطور مؤثری توانسته است بر مدلهای بزرگتر برتری یابد. این موفقیتها میتواند نویدبخش تحولات جدیدی در عرصه فناوری باشد، جایی که مدلهای کوچک میتوانند به همان اندازه مدلهای بزرگ کارآمد و مؤثر باشند.


