استاندارد NLWeb و مسیر تعامل هوش مصنوعی با وبسایت ها
در نسل اول وب، در اواخر دهه 1990، جستجو خوب بود اما عالی نبود و پیدا کردن چیزها آسان نبود. این امر منجر به ظهور پروتکلهای سندیکایی در اوایل دهه 2000 شد، به طوری که Atom و RSS (Really Simple Syndication) راهی ساده برای صاحبان وبسایتها فراهم کردند تا سرفصلها و محتوای دیگر را به راحتی در دسترس و قابل جستجو قرار دهند.
در دوران مدرن هوش مصنوعی، گروه جدیدی از پروتکلها در حال ظهور هستند تا همان هدف اصلی را دنبال کنند. این بار، به جای آسانتر کردن یافتن سایتها برای انسانها، همه چیز در مورد آسانتر کردن وبسایتها برای هوش مصنوعی است. پروتکل کنترل مدل (MCP) شرکت Anthropic، Agent2Agent گوگل و LLMs.txt از جمله تلاشهای موجود هستند.
جدیدترین پروتکل، تلاش متنباز مایکروسافت به نام NLWeb (زبان طبیعی وب) است که در کنفرانس Build 2025 اعلام شد. NLWeb همچنین مستقیماً با نسل اول استانداردهای سندیکای وب مرتبط است، زیرا توسط RV Guha طراحی و ایجاد شد، کسی که در ساخت RSS، RDF (Resource Description Framework) و schema.org کمک کرده است.
NLWeb وبسایتها را قادر میسازد تا به راحتی رابطهای مکالمهای مبتنی بر هوش مصنوعی را اضافه کنند، به طور موثر هر وبسایتی را به یک برنامه هوش مصنوعی تبدیل میکند که کاربران میتوانند محتوا را با استفاده از زبان طبیعی جستجو کنند. NLWeb لزوماً در مورد رقابت با پروتکلهای دیگر نیست؛ بلکه بر پایه آنها ساخته شده است. این پروتکل جدید از فرمتهای داده ساختاریافته موجود مانند RSS استفاده میکند و هر نمونه NLWeb به عنوان یک سرور MCP عمل میکند.
کوین اسکات، مدیر ارشد فناوری مایکروسافت، در سخنرانی اصلی خود در Build 2025 گفت: “ایده پشت NLWeb این است که راهی برای هر کسی است که از قبل وبسایت یا API دارد، تا به راحتی وبسایت یا API خود را به یک برنامه عامل تبدیل کند. شما واقعاً میتوانید آن را کمی شبیه به HTML برای عامل وب در نظر بگیرید.”
NLWe چگونه وب را برای شرکت ها با هوش مصنوعی توانمند میکند
NLWeb وبسایتها را از طریق یک فرآیند ساده که بر زیرساخت وب موجود بنا شده و از فناوریهای هوش مصنوعی مدرن بهره میبرد، به تجربههای مبتنی بر هوش مصنوعی تبدیل میکند.
ساخت بر پایه دادههای موجود: این سیستم با استفاده از دادههای ساختاریافتهای که وبسایتها از قبل منتشر میکنند، از جمله نشانهگذاری، فیدهای RSS و سایر فرمتهای نیمهساختاریافته که معمولاً در صفحات وب تعبیه شدهاند، شروع به کار میکند. این بدان معناست که ناشران نیازی به بازسازی کامل زیرساخت محتوای خود ندارند.
پردازش و ذخیرهسازی داده: NLWeb شامل ابزارهایی برای اضافه کردن این دادههای ساختاریافته به پایگاههای داده برداری (vector databases) است که امکان جستجو و بازیابی معنایی کارآمد را فراهم میکنند. این سیستم از تمام گزینههای اصلی پایگاه داده برداری پشتیبانی میکند و به توسعهدهندگان اجازه میدهد راهحلی را انتخاب کنند که به بهترین وجه با الزامات فنی و مقیاس آنها مطابقت دارد.
لایه بهبود هوش مصنوعی: سپس مدلهای زبان بزرگ (LLMs) این دادههای ذخیره شده را با دانش و زمینه خارجی بهبود میبخشند. به عنوان مثال، هنگامی که کاربر در مورد رستورانها جستجو میکند، سیستم به طور خودکار بینشهای جغرافیایی، بررسیها و اطلاعات مرتبط را با ترکیب محتوای برداری شده با قابلیتهای LLM برای ارائه پاسخهای جامع و هوشمند به جای بازیابی ساده داده، اضافه میکند.
ایجاد رابط جهانی: نتیجه یک رابط زبان طبیعی است که هم به کاربران انسانی و هم به عاملهای هوش مصنوعی خدمات میدهد. بازدیدکنندگان میتوانند به زبان ساده سوال بپرسند و پاسخهای مکالمهای دریافت کنند، در حالی که سیستمهای هوش مصنوعی میتوانند اطلاعات سایت را به صورت برنامهنویسی از طریق چارچوب MCP دسترسی و جستجو کنند.
این رویکرد به هر وبسایتی اجازه میدهد تا در وب عامل در حال ظهور بدون نیاز به بازسازیهای فنی گسترده شرکت کند. این امر جستجو و تعامل مبتنی بر هوش مصنوعی را به همان اندازه آسان میکند که ایجاد یک صفحه وب ساده در اوایل اینترنت آسان بوده است.
چشمانداز پروتکل هوش مصنوعی در حال ظهور انتخابهای زیادی را برای شرکتها به ارمغان میآورد
تعداد زیادی پروتکل مختلف در فضای هوش مصنوعی در حال ظهور هستند؛ همه آنها یک کار را انجام نمیدهند.
به عنوان مثال، Agent2Agent گوگل، تماماً در مورد فعال کردن عاملها برای گفتگو با یکدیگر است. این در مورد هماهنگی و ارتباط هوش مصنوعی عامل است و به طور خاص بر توانمندسازی وبسایتهای موجود یا محتوای هوش مصنوعی تمرکز ندارد. ماریا گورسکیک، بنیانگذار و مدیر عامل AIA و یکی از مشارکتکنندگان در تیم پروژه NANDA در MIT، به VentureBeat توضیح داد که A2A گوگل امکان انتقال وظیفه ساختاریافته بین عاملها را با استفاده از طرحها و مدلهای چرخه عمر تعریف شده فراهم میکند.
او گفت: “در حالی که این پروتکل متنباز و از نظر مدل مستقل است، پیادهسازیها و ابزارهای فعلی آن به شدت با استک جمینی گوگل مرتبط هستند، که آن را بیشتر به یک چارچوب هماهنگی بکاند تبدیل میکند تا یک رابط عمومی برای خدمات مبتنی بر وب.”
یکی دیگر از تلاشهای در حال ظهور، LLMs.txt است. هدف آن کمک به LLM ها برای دسترسی بهتر به محتوای وب است. در حالی که در ظاهر، ممکن است تا حدودی شبیه NLWeb به نظر برسد، اما یکسان نیست.
مایکل نی، معاون و تحلیلگر اصلی در Constellation Research به VentureBeat گفت: “NLWeb با LLMs.txt رقابت نمیکند؛ بیشتر شبیه به ابزارهای وباسکرپینگ است که سعی میکنند قصد را از یک وبسایت استنباط کنند.”
کریش آرواپالی، بنیانگذار و مدیر ارشد فناوری Dappier، به VentureBeat توضیح داد که LLMs.txt یک فرمت سبک Markdown با مجوزهای آموزشی فراهم میکند که به LLM ها کمک میکند محتوا را به درستی جذب کنند. NLWeb بر فعال کردن تعاملات بلادرنگ مستقیماً در وبسایت ناشر تمرکز دارد. Dappier پلتفرم خود را دارد که به طور خودکار فیدهای RSS و سایر دادههای ساختاریافته را جذب میکند، سپس رابطهای مکالمهای با برند و قابل جاسازی را ارائه میدهد. ناشران میتوانند محتوای خود را به بازار داده خود سندیکا کنند.
MCP پروتکل بزرگ دیگر است و به طور فزایندهای به یک استاندارد بدون شک و یک عنصر اساسی NLWeb تبدیل میشود. اساساً، MCP یک استاندارد باز برای اتصال سیستمهای هوش مصنوعی با منابع داده است. نی توضیح داد که از دید مایکروسافت، MCP لایه حمل و نقل است، جایی که MCP و NLWeb با هم، HTML و TCP/IP وب عامل باز را فراهم میکنند.
ویل مککئون-وایت، تحلیلگر ارشد Forrester، مزایای متعددی را برای NLWeb نسبت به گزینههای دیگر میبیند.
مککئون-وایت به VentureBeat گفت: “مزیت اصلی NLWeb کنترل بهتر بر نحوه ‘دیدن’ بخشهایی از وبسایتها توسط سیستمهای هوش مصنوعی است که امکان ناوبری بهتر و درک کاملتر از ابزارها را فراهم میکند. این میتواند هم خطاهای ناشی از سوءتفاهم سیستمها از آنچه در وبسایتها میبینند را و هم بازسازی رابط را کاهش دهد.”
پذیرندگان اولیه در حال حاضر پتانسیل NLWeb را برای هوش مصنوعی سازمانی عامل میبینند
این طور نبود که مایکروسافت فقط NLWeb را به طور نمادین “رها” کرده باشد و امیدوار باشد که کسی از آن استفاده کند.
مایکروسافت در حال حاضر چندین سازمان درگیر و استفادهکننده از NLWeb را با خود دارد، از جمله Chicago Public Media، Allrecipes، Eventbrite، Hearst (Delish)، O’Reilly Media، Tripadvisor و Shopify.
اندرو اودوان، مدیر ارشد فناوری در O’Reilly Media، از جمله پذیرندگان اولیه است و پتانسیل واقعی NLWeb را میبیند.
اودوان به VentureBeat گفت: “NLWeb از بهترین روشها و استانداردهایی که در دهه گذشته در وب باز توسعه یافتهاند، استفاده میکند و آنها را در دسترس LLM ها قرار میدهد. شرکتها مدتهاست که برای سئو و سایر اهداف بازاریابی زمان زیادی را صرف بهینهسازی این نوع فراداده کردهاند، اما اکنون میتوانند از این گنجینه داده برای هوشمندتر و تواناتر کردن هوش مصنوعی داخلی خود با NLWeb استفاده کنند.”
از نظر او، NLWeb هم برای شرکتها به عنوان مصرفکنندگان اطلاعات عمومی و هم به عنوان ناشران اطلاعات خصوصی ارزشمند است. او اشاره کرد که تقریباً هر شرکتی تلاشهای فروش و بازاریابی دارد که ممکن است نیاز به پرسیدن “این شرکت چه کاری انجام میدهد؟” یا “این محصول در مورد چیست؟” داشته باشند.
اودوان گفت: “NLWeb راهی عالی برای باز کردن این اطلاعات به LLM های داخلی شما فراهم میکند تا مجبور نباشید برای یافتن آن جستجو کنید. به عنوان یک ناشر، میتوانید فراداده خود را با استفاده از استاندارد schema.org اضافه کنید و از NLWeb به صورت داخلی به عنوان یک سرور MCP برای در دسترس قرار دادن آن برای استفاده داخلی بهره بگیرید.”
استفاده از NLWeb لزوماً یک کار سنگین نیست. اودوان اشاره کرد که بسیاری از سازمانها احتمالاً در حال حاضر از بسیاری از استانداردهایی که NLWeb بر آنها تکیه میکند، استفاده میکنند.
او گفت: “در حال حاضر هیچ ضرری در امتحان آن وجود ندارد، زیرا NLWeb میتواند به طور کامل در زیرساخت شما اجرا شود. این یک نرمافزار متنباز است که بهترین در دادههای متنباز را برآورده میکند، بنابراین با امتحان آن در حال حاضر چیزی برای از دست دادن وجود ندارد و چیزهای زیادی برای به دست آوردن موجود میباشد.”
آیا شرکتها باید بلافاصله به NLWeb روی بیاورند یا اینکه منتظر بمانند؟
مایکل نی، تحلیلگر Constellation Research، دیدگاهی تا حدودی مثبت در مورد NLWeb دارد. با این حال، این بدان معنا نیست که شرکتها باید فوراً آن را بپذیرند.
نی اشاره کرد که NLWeb در مراحل بسیار اولیه بلوغ خود است و شرکتها باید انتظار 2 تا 3 سال برای هرگونه پذیرش قابل توجهی را داشته باشند. او پیشنهاد میکند که شرکتهای پیشرو با نیازهای خاص، مانند بازارهای فعال، میتوانند به صورت آزمایشی با قابلیت مشارکت و کمک به شکلدهی استاندارد به آن نگاه کنند.
نی گفت: “این یک مشخصات آیندهنگر با پتانسیل روشن است، اما قبل از اینکه به مراحل آزمایشی اصلی سازمانی برسد، نیاز به اعتبار سنجی اکوسیستم، ابزارهای پیادهسازی و یکپارچهسازیهای مرجع دارد.”
دیگران دیدگاهی تا حدودی تهاجمیتر در مورد پذیرش دارند. گورسکیک یک رویکرد شتابدهنده را برای اطمینان از عقب نماندن شرکت شما پیشنهاد میکند.
او گفت: “اگر شما یک شرکت با سطح محتوای بزرگ، پایگاه دانش داخلی یا دادههای ساختاریافته هستید، آزمایش NLWeb در حال حاضر یک گام هوشمند و ضروری برای پیشرو ماندن است. این یک لحظه “صبر کن و ببین” نیست، بیشتر شبیه به پذیرش اولیه API ها یا برنامههای موبایل است.”
با این حال، او اشاره کرد که صنایع تحت نظارت باید با احتیاط عمل کنند. بخشهایی مانند بیمه، بانکداری و مراقبتهای بهداشتی باید تا زمانی که یک سیستم تأیید و کشف خنثی و غیرمتمرکز وجود ندارد، از استفاده در تولید خودداری کنند. در حال حاضر تلاشهای اولیه برای رسیدگی به این موضوع وجود دارد، مانند پروژه NANDA در MIT که گورسکیک در آن مشارکت دارد و یک سیستم ثبت باز و غیرمتمرکز برای خدمات عامل ایجاد میکند.
این موضوع برای رهبران هوش مصنوعی سازمانی به چه معناست؟
برای رهبران هوش مصنوعی سازمانی، NLWeb یک لحظه تعیینکننده و فناوری ای است که نباید نادیده گرفته شود.
هوش مصنوعی با سایت شما تعامل خواهد داشت و شما باید آن را با هوش مصنوعی توانمند کنید. NLWeb یکی از راههایی است که به ویژه برای ناشران جذاب خواهد بود، دقیقاً مانند RSS که در اوایل دهه 2000 برای همه وبسایتها ضروری شد. در چند سال آینده، کاربران انتظار خواهند داشت که این قابلیت وجود داشته باشد؛ آنها انتظار خواهند داشت که بتوانند جستجو کنند و جستجویشان نتیجه داشته باشد، در حالی که سیستمهای هوش مصنوعی عامل نیز باید بتوانند به محتوا دسترسی داشته باشند.
این وعده NLWeb است.
منبع: https://venturebeat.com