رونمایی محققان چینی از MemOS: “سیستم عامل حافظه” و قابلیت یادآوری هوش مصنوعی شبیه به انسان

مرداد 25, 1404

در تیر 22, 1404

تیمی از محققان موسسات برجسته از جمله دانشگاه شانگهای جیائو تونگ و دانشگاه ژجیانگ، چیزی را که آن‌ها اولین “سیستم عامل حافظه” برای هوش مصنوعی می‌نامند، توسعه داده‌اند. این سیستم به یک محدودیت اساسی که مانع از دستیابی سیستم‌های هوش مصنوعی به حافظه و یادگیری پایدار شبیه انسان شده بود، پاسخ می‌دهد.

این سیستم که MemOS نام دارد، حافظه را به عنوان یک منبع محاسباتی هسته‌ای در نظر می‌گیرد که می‌توان آن را برنامه‌ریزی کرد، به اشتراک گذاشت و با گذشت زمان تکامل بخشید. این سیستم بسیار شبیه به نحوه مدیریت منابع CPU و فضای ذخیره‌سازی توسط سیستم‌عامل‌های سنتی میباشد. این تحقیق که در تاریخ 4 جولای، معادل با 13 تیر، در arXiv منتشر شد، بهبودهای عملکرد قابل توجهی را نسبت به رویکردهای موجود، از جمله افزایش 159 درصدی در وظایف استدلال زمانی در مقایسه با سیستم‌های حافظه OpenAI، نشان می‌دهد.

محققان در مقاله خود نوشته اند: “مدل‌های زبان بزرگ (LLM) به یک زیرساخت ضروری برای هوش مصنوعی عمومی (AGI) تبدیل شده‌اند. با این حال، فقدان سیستم‌های مدیریت حافظه تعریف شده، مانع از توسعه استدلال طولانی‌مدت، شخصی‌سازی مداوم و ثبات دانش می‌شود.”

فهرست مطالب

1 سیستم‌های هوش مصنوعی با حافظه پایدار در مکالمات مشکل دارند
2 این سیستم جدید بهبودهای چشمگیری در وظایف استدلال هوش مصنوعی ایجاد می‌کند
3 این فناوری می‌تواند نحوه استقرار هوش مصنوعی توسط مشاغل را تغییر دهد
4 طراحی سه لایه شبیه سیستم‌عامل‌های کامپیوتری سنتی است
5 محققان کد را به عنوان منبع باز برای تسریع پذیرش منتشر می‌کنند
6 غول‌های فناوری برای حل محدودیت‌های حافظه هوش مصنوعی رقابت می‌کنند

سیستم‌های هوش مصنوعی با حافظه پایدار در مکالمات مشکل دارند

سیستم‌های هوش مصنوعی فعلی با آنچه محققان آن را مشکل “سیلو حافظه یا Memory Silo” می‌نامند، روبرو هستند. این مشکل یک محدودیت معماری اساسی میباشد که مانع از حفظ روابط منسجم و بلندمدت با کاربران می‌شود. هر مکالمه یا جلسه اساساً از ابتدا شروع می‌شود و مدل‌ها قادر به حفظ ترجیحات، دانش انباشته یا الگوهای رفتاری در تعاملات نیستند. این امر یک تجربه کاربری ناامیدکننده ایجاد می‌کند که در آن یک دستیار هوش مصنوعی ممکن است محدودیت‌های غذایی کاربر را که در یک مکالمه ذکر شده است، هنگام درخواست پیشنهاد برای رستوران در مکالمه بعدی فراموش کند.

در حالی که برخی از راه‌ حل‌ها مانند تولید مبتنی بر بازیابی (RAG)، تلاش می‌کنند این مشکل را با فراخوانی اطلاعات خارجی در طول مکالمات حل کنند، محققان استدلال می‌کنند که این راه حل ها “راه ‌حل‌های بدون حالت و بدون کنترل چرخه عمر” باقی می‌مانند. مشکل عمیق‌تر از بازیابی اطلاعات ساده می باشد. این موضوع درباره ایجاد سیستم‌هایی است که می‌توانند بسیار شبیه به عملکرد حافظه انسان، واقعاً از تجربه یاد بگیرند و تکامل یابند.

این تیم توضیح می‌دهد: “مدل‌های موجود عمدتاً به پارامترهای ثابت و حالت‌های متنی کوتاه‌مدت متکی هستند که توانایی آن‌ها را در ردیابی ترجیحات کاربر یا به روز رسانی دانش در طول دوره‌های طولانی محدود می‌کند.” این محدودیت به ویژه در تنظیمات سازمانی آشکار می‌شود. جایی که از سیستم‌های هوش مصنوعی انتظار می‌رود که متن را در طول گردش‌های کاری پیچیده و چندمرحله‌ای که ممکن است روزها یا هفته‌ها طول بکشد، حفظ کنند.

این سیستم جدید بهبودهای چشمگیری در وظایف استدلال هوش مصنوعی ایجاد می‌کند

MemOS رویکردی اساساً متفاوت را از طریق آنچه محققان آن را “MemCubes” می‌نامند، معرفی می‌کند. واحدهای حافظه استاندارد شده که می‌توانند انواع مختلفی از اطلاعات را نگه داری کنند و با گذشت زمان، ترکیب، مهاجرت و تکامل یابند. این‌ها از دانش صریح مبتنی بر متن تا سازگاری‌های سطح پارامتر و حالت‌های فعال‌سازی در داخل مدل را شامل می‌شوند و چارچوب یکپارچه‌ای برای مدیریت حافظه ایجاد می‌کنند که قبلاً وجود نداشته است.

در آزمایش‌های بنچمارک LOCOMO که وظایف استدلال فشرده حافظه را ارزیابی می‌کند، MemOS به طور مداوم از پایه‌های تعیین شده در تمام دسته‌ها بهتر عمل کرد. این سیستم در مقایسه با پیاده‌سازی حافظه OpenAI، بهبود کلی 38.98 درصدی را، با دستاوردهای به ویژه قوی در سناریوهای استدلال پیچیده که نیاز به اتصال اطلاعات در طول چندین نوبت مکالمه دارند، به دست آورد.

طبق تحقیقات، MemOS (MemOS-0630) به طور مداوم در تمام دسته‌ها رتبه اول را کسب کرده و از پایه‌های قوی مانند mem0، LangMem، Zep و OpenAI-Memory، با حاشیه‌های به ویژه زیاد در تنظیمات چالش برانگیز مانند استدلال چند گامی و زمانی، پیشی می‌گیرد. این سیستم همچنین بهبودهای قابل توجهی در کارایی با کاهش تا 94 درصد در زمان تا اولین توکن در برخی پیکربندی‌ها از طریق مکانیسم نوآورانه تزریق حافظه KV-cache خود، به همراه داشت.

این افزایش‌های عملکرد نشان می‌دهد که تنگنای حافظه یک محدودیت مهم‌تر از آنچه قبلاً درک شده بود، میباشد. با در نظر گرفتن حافظه به عنوان یک منبع محاسباتی درجه یک، به نظر می‌رسد MemOS قابلیت‌های استدلال را که قبلاً توسط محدودیت‌های معماری محدود شده بودند، باز می‌کند.

این فناوری می‌تواند نحوه استقرار هوش مصنوعی توسط مشاغل را تغییر دهد

پیامدهای این فناوری برای استقرار هوش مصنوعی سازمانی می‌تواند تحول آفرین باشد. به ویژه با توجه به اینکه مشاغل به طور فزاینده‌ای به سیستم‌های هوش مصنوعی برای روابط پیچیده و مداوم با مشتریان و کارمندان متکی هستند. MemOS آنچه را که محققان “مهاجرت حافظه بین پلتفرمی” می‌نامند، امکان‌پذیر می‌سازد و به حافظه‌های هوش مصنوعی اجازه می‌دهد تا بین پلتفرم‌ها و دستگاه‌های مختلف قابل حمل باشند و آنچه را که آن‌ها “جزایر حافظه” می‌نامند و در حال حاضر زمینه کاربر را در برنامه‌های خاص محدود می‌کنند، از بین ببرند.

فشارهای کنونی را که بسیاری از کاربران زمانی که بینش‌های کشف شده در یک پلتفرم هوش مصنوعی نمی‌توانند به پلتفرم دیگر منتقل شوند تجربه می‌کنند را در نظر بگیرید. یک تیم بازاریابی ممکن است از طریق مکالمات با ChatGPT شخصیت‌های با جزئیات مشتریان را توسعه دهد، و هنگام تغییر به یک ابزار هوش مصنوعی متفاوت برای برنامه ریزی کمپین، نیاز است که تمامی اطلاعات را از ابتدا وارد کند. MemOS این مشکل را با ایجاد یک فرمت حافظه استاندارد که می‌تواند بین سیستم‌ها حرکت کند، حل می‌کند.

این تحقیق همچنین پتانسیل “ماژول‌های حافظه پولی” را تشریح می‌کند. جایی که متخصصان حوزه می‌توانند دانش خود را در واحدهای حافظه قابل خرید بسته‌بندی کنند. محققان سناریوهایی را توصیف می‌کنند که در آن یک دانشجوی پزشکی در دوره بالینی ممکن است بخواهد نحوه مدیریت یک بیماری خودایمنی نادر را مطالعه کند و یا یک پزشک باتجربه می‌تواند اکتشافات تشخیصی، مسیرهای پرسش و الگوهای موردی معمولی را در یک حافظه ساختاریافته ذخیره کند، که می‌تواند توسط سایر سیستم‌های هوش مصنوعی نصب و استفاده شود.

این مدل بازار می‌تواند اساساً نحوه توزیع و کسب درآمد از دانش تخصصی در سیستم‌های هوش مصنوعی را تغییر دهد، فرصت‌های اقتصادی جدیدی را برای متخصصان ایجاد کند و در عین حال دسترسی به دانش حوزه با کیفیت بالا را دموکراتیزه کند. برای شرکت‌ها، این می‌تواند به معنای استقرار سریع سیستم‌های هوش مصنوعی با تخصص عمیق در مناطق خاص، بدون هزینه‌ها و زمان‌بندی‌های سنتی مرتبط با آموزش سفارشی باشد.

طراحی سه لایه شبیه سیستم‌عامل‌های کامپیوتری سنتی است

معماری فنی MemOS منعکس کننده دهه‌ها یادگیری از طراحی سیستم‌عامل‌های سنتی است که برای چالش‌های منحصر به فرد مدیریت حافظه هوش مصنوعی سازگار شده است. این سیستم از یک معماری سه لایه استفاده می‌کند: یک لایه رابط برای فراخوانی‌های API، یک لایه عملیات برای برنامه‌ریزی حافظه و مدیریت چرخه عمر، و یک لایه زیرساخت برای ذخیره‌سازی و کنترل.

مولفه MemScheduler سیستم، انواع مختلف حافظه را از حالت‌های فعال‌سازی موقت تا اصلاحات دائمی پارامترها به صورت پویا مدیریت می‌کند و استراتژی‌های بهینه ذخیره‌سازی و بازیابی را بر اساس الگوهای استفاده و الزامات وظیفه انتخاب می‌کند. این نشان‌دهنده یک انحراف قابل توجه از رویکردهای فعلی است که معمولاً حافظه را یا کاملاً ایستا (تعبیه شده در پارامترهای مدل) یا کاملاً زودگذر (محدود به زمینه مکالمه) در نظر می‌گیرند.

محققان با توصیف چشم‌انداز خود برای آنچه آن را پارادایم‌های “Mem-training” می‌نامند، خاطرنشان می‌کنند: “تمرکز از اینکه مدل یک بار چقدر دانش می‌آموزد، به این تغییر می‌کند که آیا می‌تواند تجربه را به حافظه ساختاریافته تبدیل کرده و بارها آن را بازیابی و بازسازی کند.” این فلسفه معماری یک بازنگری اساسی در نحوه طراحی سیستم‌های هوش مصنوعی را پیشنهاد می‌کند و از پارادایم کنونی پیش‌آموزش گسترده به سمت یادگیری پویا‌تر و مبتنی بر تجربه حرکت می‌کند.

شباهت‌ها به توسعه سیستم‌عامل چشمگیر است. همانطور که رایانه‌های اولیه نیاز به برنامه‌نویسان داشتند تا تخصیص حافظه را به صورت دستی مدیریت کنند، سیستم‌های هوش مصنوعی فعلی نیاز به توسعه‌دهندگان دارند تا جریان اطلاعات بین اجزای مختلف را با دقت تنظیم کنند. MemOS این پیچیدگی را انتزاع می‌کند و به طور بالقوه نسل جدیدی از برنامه‌های هوش مصنوعی را قادر می‌سازد که می‌توانند بر روی مدیریت حافظه پیچیده بدون نیاز به تخصص فنی عمیق ساخته شوند.

محققان کد را به عنوان منبع باز برای تسریع پذیرش منتشر می‌کنند

این تیم MemOS را به عنوان یک پروژه متن باز با کد کامل در GitHub منتشر کرده است و پشتیبانی یکپارچه‌سازی برای پلتفرم‌های اصلی هوش مصنوعی نیز از جمله HuggingFace، OpenAI و Ollama در دسترس می باشد. به نظر می‌رسد این استراتژی متن باز به جای دنبال کردن یک رویکرد اختصاصی که ممکن است پیاده‌سازی گسترده را محدود کند، برای تسریع پذیرش و تشویق توسعه جامعه طراحی شده است.

Zhiyu Li، رهبر پروژه در مخزن GitHub اظهار داشت: “امیدواریم MemOS به پیشرفت سیستم‌های هوش مصنوعی از ژنراتورهای ثابت به عوامل در حال تکامل مداوم و مبتنی بر حافظه کمک کند.” این سیستم در حال حاضر از پلتفرم‌های لینوکس پشتیبانی می‌کند و پشتیبانی از ویندوز و macOS نیز برنامه‌ریزی شده است، که نشان می‌دهد تیم به جای دسترسی فوری مصرف‌کننده، اولویت را به پذیرش سازمانی و توسعه‌دهنده داده است.

استراتژی انتشار متن باز منعکس کننده یک روند گسترده‌تر در تحقیقات هوش مصنوعی است که در آن بهبودهای زیرساختی اساسی به صورت باز به اشتراک گذاشته می‌شوند تا به نفع کل اکوسیستم باشند. این رویکرد از نظر تاریخی نوآوری را در مناطقی مانند چارچوب‌های یادگیری عمیق تسریع کرده است و می‌تواند اثرات مشابهی برای مدیریت حافظه در سیستم‌های هوش مصنوعی داشته باشد.

غول‌های فناوری برای حل محدودیت‌های حافظه هوش مصنوعی رقابت می‌کنند

این تحقیق در حالی منتشر می‌شود که شرکت‌های بزرگ هوش مصنوعی با محدودیت‌های رویکردهای حافظه فعلی دست و پنجه نرم می‌کنند و این موضوع را برجسته می‌کند که این چالش چقدر برای صنعت اساسی شده است. OpenAI اخیراً ویژگی‌های حافظه را برای ChatGPT معرفی کرده است، در حالی که Anthropic، Google و سایر ارائه‌دهندگان با اشکال مختلف زمینه پایدار، آزمایش کرده‌اند. با این حال، این پیاده‌سازی‌ها به طور کلی از نظر دامنه محدود بوده و اغلب فاقد رویکرد سیستمی ای هستند که MemOS ارائه می‌دهد.

زمان‌بندی این تحقیق نشان می‌دهد که مدیریت حافظه به عنوان یک میدان نبرد رقابتی حیاتی در توسعه هوش مصنوعی ظاهر شده است. شرکت‌هایی که می‌توانند مشکل حافظه را به طور موثر حل کنند، ممکن است مزایای قابل توجهی در حفظ و رضایت کاربر به دست آورند، زیرا سیستم‌های هوش مصنوعی آن‌ها قادر خواهند بود روابط عمیق‌تر و مفیدتری را در طول زمان ایجاد کنند.

ناظران صنعت مدت‌هاست پیش‌بینی کرده‌اند که پیشرفت بزرگ بعدی در هوش مصنوعی لزوماً از مدل‌های بزرگتر یا داده‌های آموزشی بیشتر نخواهد آمد، بلکه از نوآوری‌های معماری که بهتر از قابلیت‌های شناختی انسان تقلید می‌کنند، نشأت خواهد گرفت. مدیریت حافظه دقیقاً این نوع پیشرفت اساسی را نشان می‌دهد، پیشرفتی که می‌تواند برنامه‌ها و موارد استفاده جدیدی را باز کند که با سیستم‌های بدون حالتِ فعلی امکان‌پذیر نیستند.

این توسعه بخشی از یک تغییر گسترده‌تر در تحقیقات هوش مصنوعی به سمت سیستم‌های با حالت‌تر و پایدارتر است که می‌توانند دانش را در طول زمان جمع‌آوری و تکامل بخشند. قابلیت‌هایی که برای هوش مصنوعی عمومی ضروری تلقی می‌شوند. برای رهبران فناوری سازمانی که پیاده‌سازی‌های هوش مصنوعی را ارزیابی می‌کنند، MemOS می‌تواند یک پیشرفت قابل توجه در ساخت سیستم‌های هوش مصنوعی باشد که به جای اینکه هر تعامل را مجزا در نظر بگیرند، زمینه را حفظ کرده و در طول زمان بهبود می‌یابند.

تیم تحقیقاتی نشان می‌دهد که قصد دارند در کارهای آتی خود به اشتراک‌گذاری حافظه بین مدل‌ها، بلوک‌های حافظه خود تکامل‌یافته و توسعه یک اکوسیستم گسترده‌تر “بازار حافظه” را بررسی کنند. اما شاید مهمترین تأثیر MemOS نه پیاده‌سازی فنی خاص، بلکه اثبات این باشد که در نظر گرفتن حافظه به عنوان یک منبع محاسباتی درجه یک می‌تواند بهبودهای چشمگیری در قابلیت‌های هوش مصنوعی ایجاد کند. در صنعتی که عمدتاً بر روی مقیاس‌بندی اندازه مدل و داده‌های آموزشی متمرکز بوده است، MemOS نشان می‌دهد که پیشرفت بعدی ممکن است از معماری بهتر به جای رایانه‌های بزرگتر حاصل شود.

منبع: https://venturebeat.com