استاندارد NLWeb و مسیر تعامل هوش مصنوعی با وبسایت ها

ارسال شده توسط سحر زارع

در 3 خرداد 1404

0 نظر

در نسل اول وب، در اواخر دهه 1990، جستجو خوب بود اما عالی نبود و پیدا کردن چیزها آسان نبود. این امر منجر به ظهور پروتکل‌های سندیکایی در اوایل دهه 2000 شد، به طوری که Atom و RSS (Really Simple Syndication) راهی ساده برای صاحبان وب‌سایت‌ها فراهم کردند تا سرفصل‌ها و محتوای دیگر را به راحتی در دسترس و قابل جستجو قرار دهند.

در دوران مدرن هوش مصنوعی، گروه جدیدی از پروتکل‌ها در حال ظهور هستند تا همان هدف اصلی را دنبال کنند. این بار، به جای آسان‌تر کردن یافتن سایت‌ها برای انسان‌ها، همه چیز در مورد آسان‌تر کردن وب‌سایت‌ها برای هوش مصنوعی است. پروتکل کنترل مدل (MCP) شرکت Anthropic، Agent2Agent گوگل و LLMs.txt از جمله تلاش‌های موجود هستند.

جدیدترین پروتکل، تلاش متن‌باز مایکروسافت به نام NLWeb (زبان طبیعی وب) است که در کنفرانس Build 2025 اعلام شد. NLWeb همچنین مستقیماً با نسل اول استانداردهای سندیکای وب مرتبط است، زیرا توسط RV Guha طراحی و ایجاد شد، کسی که در ساخت RSS، RDF (Resource Description Framework) و schema.org کمک کرده است.

NLWeb وب‌سایت‌ها را قادر می‌سازد تا به راحتی رابط‌های مکالمه‌ای مبتنی بر هوش مصنوعی را اضافه کنند، به طور موثر هر وب‌سایتی را به یک برنامه هوش مصنوعی تبدیل می‌کند که کاربران می‌توانند محتوا را با استفاده از زبان طبیعی جستجو کنند. NLWeb لزوماً در مورد رقابت با پروتکل‌های دیگر نیست؛ بلکه بر پایه آن‌ها ساخته شده است. این پروتکل جدید از فرمت‌های داده ساختاریافته موجود مانند RSS استفاده می‌کند و هر نمونه NLWeb به عنوان یک سرور MCP عمل می‌کند.

کوین اسکات، مدیر ارشد فناوری مایکروسافت، در سخنرانی اصلی خود در Build 2025 گفت: “ایده پشت NLWeb این است که راهی برای هر کسی است که از قبل وب‌سایت یا API دارد، تا به راحتی وب‌سایت یا API خود را به یک برنامه عامل تبدیل کند. شما واقعاً می‌توانید آن را کمی شبیه به HTML برای عامل وب در نظر بگیرید.”

NLWe چگونه وب را برای شرکت ها با هوش مصنوعی توانمند میکند

NLWeb وب‌سایت‌ها را از طریق یک فرآیند ساده که بر زیرساخت وب موجود بنا شده و از فناوری‌های هوش مصنوعی مدرن بهره می‌برد، به تجربه‌های مبتنی بر هوش مصنوعی تبدیل می‌کند.

ساخت بر پایه داده‌های موجود: این سیستم با استفاده از داده‌های ساختاریافته‌ای که وب‌سایت‌ها از قبل منتشر می‌کنند، از جمله نشانه‌گذاری، فیدهای RSS و سایر فرمت‌های نیمه‌ساختاریافته که معمولاً در صفحات وب تعبیه شده‌اند، شروع به کار می‌کند. این بدان معناست که ناشران نیازی به بازسازی کامل زیرساخت محتوای خود ندارند.

پردازش و ذخیره‌سازی داده: NLWeb شامل ابزارهایی برای اضافه کردن این داده‌های ساختاریافته به پایگاه‌های داده برداری (vector databases) است که امکان جستجو و بازیابی معنایی کارآمد را فراهم می‌کنند. این سیستم از تمام گزینه‌های اصلی پایگاه داده برداری پشتیبانی می‌کند و به توسعه‌دهندگان اجازه می‌دهد راه‌حلی را انتخاب کنند که به بهترین وجه با الزامات فنی و مقیاس آن‌ها مطابقت دارد.

لایه بهبود هوش مصنوعی: سپس مدل‌های زبان بزرگ (LLMs) این داده‌های ذخیره شده را با دانش و زمینه خارجی بهبود می‌بخشند. به عنوان مثال، هنگامی که کاربر در مورد رستوران‌ها جستجو می‌کند، سیستم به طور خودکار بینش‌های جغرافیایی، بررسی‌ها و اطلاعات مرتبط را با ترکیب محتوای برداری شده با قابلیت‌های LLM برای ارائه پاسخ‌های جامع و هوشمند به جای بازیابی ساده داده، اضافه می‌کند.

ایجاد رابط جهانی: نتیجه یک رابط زبان طبیعی است که هم به کاربران انسانی و هم به عامل‌های هوش مصنوعی خدمات می‌دهد. بازدیدکنندگان می‌توانند به زبان ساده سوال بپرسند و پاسخ‌های مکالمه‌ای دریافت کنند، در حالی که سیستم‌های هوش مصنوعی می‌توانند اطلاعات سایت را به صورت برنامه‌نویسی از طریق چارچوب MCP دسترسی و جستجو کنند.

این رویکرد به هر وب‌سایتی اجازه می‌دهد تا در وب عامل در حال ظهور بدون نیاز به بازسازی‌های فنی گسترده شرکت کند. این امر جستجو و تعامل مبتنی بر هوش مصنوعی را به همان اندازه آسان می‌کند که ایجاد یک صفحه وب ساده در اوایل اینترنت آسان بوده است.

چشم‌انداز پروتکل هوش مصنوعی در حال ظهور انتخاب‌های زیادی را برای شرکت‌ها به ارمغان می‌آورد

تعداد زیادی پروتکل مختلف در فضای هوش مصنوعی در حال ظهور هستند؛ همه آن‌ها یک کار را انجام نمی‌دهند.

به عنوان مثال، Agent2Agent گوگل، تماماً در مورد فعال کردن عامل‌ها برای گفتگو با یکدیگر است. این در مورد هماهنگی و ارتباط هوش مصنوعی عامل است و به طور خاص بر توانمندسازی وب‌سایت‌های موجود یا محتوای هوش مصنوعی تمرکز ندارد. ماریا گورسکیک، بنیانگذار و مدیر عامل AIA و یکی از مشارکت‌کنندگان در تیم پروژه NANDA در MIT، به VentureBeat توضیح داد که A2A گوگل امکان انتقال وظیفه ساختاریافته بین عامل‌ها را با استفاده از طرح‌ها و مدل‌های چرخه عمر تعریف شده فراهم می‌کند.

او گفت: “در حالی که این پروتکل متن‌باز و از نظر مدل مستقل است، پیاده‌سازی‌ها و ابزارهای فعلی آن به شدت با استک جمینی گوگل مرتبط هستند، که آن را بیشتر به یک چارچوب هماهنگی بک‌اند تبدیل می‌کند تا یک رابط عمومی برای خدمات مبتنی بر وب.”

یکی دیگر از تلاش‌های در حال ظهور، LLMs.txt است. هدف آن کمک به LLM ها برای دسترسی بهتر به محتوای وب است. در حالی که در ظاهر، ممکن است تا حدودی شبیه NLWeb به نظر برسد، اما یکسان نیست.

مایکل نی، معاون و تحلیلگر اصلی در Constellation Research به VentureBeat گفت: “NLWeb با LLMs.txt رقابت نمی‌کند؛ بیشتر شبیه به ابزارهای وب‌اسکرپینگ است که سعی می‌کنند قصد را از یک وب‌سایت استنباط کنند.”

کریش آرواپالی، بنیانگذار و مدیر ارشد فناوری Dappier، به VentureBeat توضیح داد که LLMs.txt یک فرمت سبک Markdown با مجوزهای آموزشی فراهم می‌کند که به LLM ها کمک می‌کند محتوا را به درستی جذب کنند. NLWeb بر فعال کردن تعاملات بلادرنگ مستقیماً در وب‌سایت ناشر تمرکز دارد. Dappier پلتفرم خود را دارد که به طور خودکار فیدهای RSS و سایر داده‌های ساختاریافته را جذب می‌کند، سپس رابط‌های مکالمه‌ای با برند و قابل جاسازی را ارائه می‌دهد. ناشران می‌توانند محتوای خود را به بازار داده خود سندیکا کنند.

MCP پروتکل بزرگ دیگر است و به طور فزاینده‌ای به یک استاندارد بدون شک و یک عنصر اساسی NLWeb تبدیل می‌شود. اساساً، MCP یک استاندارد باز برای اتصال سیستم‌های هوش مصنوعی با منابع داده است. نی توضیح داد که از دید مایکروسافت، MCP لایه حمل و نقل است، جایی که MCP و NLWeb با هم، HTML و TCP/IP وب عامل باز را فراهم می‌کنند.

ویل مک‌کئون-وایت، تحلیلگر ارشد Forrester، مزایای متعددی را برای NLWeb نسبت به گزینه‌های دیگر می‌بیند.

مک‌کئون-وایت به VentureBeat گفت: “مزیت اصلی NLWeb کنترل بهتر بر نحوه ‘دیدن’ بخش‌هایی از وب‌سایت‌ها توسط سیستم‌های هوش مصنوعی است که امکان ناوبری بهتر و درک کامل‌تر از ابزارها را فراهم می‌کند. این می‌تواند هم خطاهای ناشی از سوءتفاهم سیستم‌ها از آنچه در وب‌سایت‌ها می‌بینند را و هم بازسازی رابط را کاهش دهد.”

پذیرندگان اولیه در حال حاضر پتانسیل NLWeb را برای هوش مصنوعی سازمانی عامل می‌بینند

این طور نبود که مایکروسافت فقط NLWeb را به طور نمادین “رها” کرده باشد و امیدوار باشد که کسی از آن استفاده کند.

مایکروسافت در حال حاضر چندین سازمان درگیر و استفاده‌کننده از NLWeb را با خود دارد، از جمله Chicago Public Media، Allrecipes، Eventbrite، Hearst (Delish)، O’Reilly Media، Tripadvisor و Shopify.

اندرو اودوان، مدیر ارشد فناوری در O’Reilly Media، از جمله پذیرندگان اولیه است و پتانسیل واقعی NLWeb را می‌بیند.

اودوان به VentureBeat گفت: “NLWeb از بهترین روش‌ها و استانداردهایی که در دهه گذشته در وب باز توسعه یافته‌اند، استفاده می‌کند و آن‌ها را در دسترس LLM ها قرار می‌دهد. شرکت‌ها مدت‌هاست که برای سئو و سایر اهداف بازاریابی زمان زیادی را صرف بهینه‌سازی این نوع فراداده کرده‌اند، اما اکنون می‌توانند از این گنجینه داده برای هوشمندتر و تواناتر کردن هوش مصنوعی داخلی خود با NLWeb استفاده کنند.”

از نظر او، NLWeb هم برای شرکت‌ها به عنوان مصرف‌کنندگان اطلاعات عمومی و هم به عنوان ناشران اطلاعات خصوصی ارزشمند است. او اشاره کرد که تقریباً هر شرکتی تلاش‌های فروش و بازاریابی دارد که ممکن است نیاز به پرسیدن “این شرکت چه کاری انجام می‌دهد؟” یا “این محصول در مورد چیست؟” داشته باشند.

اودوان گفت: “NLWeb راهی عالی برای باز کردن این اطلاعات به LLM های داخلی شما فراهم می‌کند تا مجبور نباشید برای یافتن آن جستجو کنید. به عنوان یک ناشر، می‌توانید فراداده خود را با استفاده از استاندارد schema.org اضافه کنید و از NLWeb به صورت داخلی به عنوان یک سرور MCP برای در دسترس قرار دادن آن برای استفاده داخلی بهره بگیرید.”

استفاده از NLWeb لزوماً یک کار سنگین نیست. اودوان اشاره کرد که بسیاری از سازمان‌ها احتمالاً در حال حاضر از بسیاری از استانداردهایی که NLWeb بر آن‌ها تکیه می‌کند، استفاده می‌کنند.

او گفت: “در حال حاضر هیچ ضرری در امتحان آن وجود ندارد، زیرا NLWeb می‌تواند به طور کامل در زیرساخت شما اجرا شود. این یک نرم‌افزار متن‌باز است که بهترین در داده‌های متن‌باز را برآورده می‌کند، بنابراین با امتحان آن در حال حاضر چیزی برای از دست دادن وجود ندارد و چیزهای زیادی برای به دست آوردن موجود میباشد.”

آیا شرکت‌ها باید بلافاصله به NLWeb روی بیاورند یا اینکه منتظر بمانند؟

مایکل نی، تحلیلگر Constellation Research، دیدگاهی تا حدودی مثبت در مورد NLWeb دارد. با این حال، این بدان معنا نیست که شرکت‌ها باید فوراً آن را بپذیرند.

نی اشاره کرد که NLWeb در مراحل بسیار اولیه بلوغ خود است و شرکت‌ها باید انتظار 2 تا 3 سال برای هرگونه پذیرش قابل توجهی را داشته باشند. او پیشنهاد می‌کند که شرکت‌های پیشرو با نیازهای خاص، مانند بازارهای فعال، می‌توانند به صورت آزمایشی با قابلیت مشارکت و کمک به شکل‌دهی استاندارد به آن نگاه کنند.

نی گفت: “این یک مشخصات آینده‌نگر با پتانسیل روشن است، اما قبل از اینکه به مراحل آزمایشی اصلی سازمانی برسد، نیاز به اعتبار سنجی اکوسیستم، ابزارهای پیاده‌سازی و یکپارچه‌سازی‌های مرجع دارد.”

دیگران دیدگاهی تا حدودی تهاجمی‌تر در مورد پذیرش دارند. گورسکیک یک رویکرد شتاب‌دهنده را برای اطمینان از عقب نماندن شرکت شما پیشنهاد می‌کند.

او گفت: “اگر شما یک شرکت با سطح محتوای بزرگ، پایگاه دانش داخلی یا داده‌های ساختاریافته هستید، آزمایش NLWeb در حال حاضر یک گام هوشمند و ضروری برای پیشرو ماندن است. این یک لحظه “صبر کن و ببین” نیست، بیشتر شبیه به پذیرش اولیه API ها یا برنامه‌های موبایل است.”

با این حال، او اشاره کرد که صنایع تحت نظارت باید با احتیاط عمل کنند. بخش‌هایی مانند بیمه، بانکداری و مراقبت‌های بهداشتی باید تا زمانی که یک سیستم تأیید و کشف خنثی و غیرمتمرکز وجود ندارد، از استفاده در تولید خودداری کنند. در حال حاضر تلاش‌های اولیه برای رسیدگی به این موضوع وجود دارد، مانند پروژه NANDA در MIT که گورسکیک در آن مشارکت دارد و یک سیستم ثبت باز و غیرمتمرکز برای خدمات عامل ایجاد می‌کند.

این موضوع برای رهبران هوش مصنوعی سازمانی به چه معناست؟

برای رهبران هوش مصنوعی سازمانی، NLWeb یک لحظه تعیین‌کننده و فناوری ای است که نباید نادیده گرفته شود.

هوش مصنوعی با سایت شما تعامل خواهد داشت و شما باید آن را با هوش مصنوعی توانمند کنید. NLWeb یکی از راه‌هایی است که به ویژه برای ناشران جذاب خواهد بود، دقیقاً مانند RSS که در اوایل دهه 2000 برای همه وب‌سایت‌ها ضروری شد. در چند سال آینده، کاربران انتظار خواهند داشت که این قابلیت وجود داشته باشد؛ آن‌ها انتظار خواهند داشت که بتوانند جستجو کنند و جستجویشان نتیجه داشته باشد، در حالی که سیستم‌های هوش مصنوعی عامل نیز باید بتوانند به محتوا دسترسی داشته باشند.

این وعده NLWeb است.

منبع: https://venturebeat.com