تکنولوژی

نسل جدید دستیار صوتی هوش مصنوعی Conversational AI 2.0

نسل جدید دستیار صوتی هوش مصنوعی Conversational AI 2.0

هوش مصنوعی با سرعت بالایی در حال پیشرفت برای کسب‌وکارها است، و این موضوع به‌ویژه در حوزه مدل‌های صوتی و گفتاری AI کاملاً مشهود است.

شرکت  ElevenLabs، استارتاپ پرسرمایه فعال در زمینه صدا و اثرات صوتی مبتنی بر هوش مصنوعی که توسط مهندسین سابق Palantir تأسیس شده، نسخه جدیدی به نام Conversational AI 2.0 را معرفی کرد؛ به‌روزرسانی مهمی برای پلتفرم ساخت عوامل صوتی پیشرفته برای کاربردهای سازمانی مانند پشتیبانی مشتری، مراکز تماس، فروش، بازاریابی و..

این به‌روزرسانی مجموعه‌ای از قابلیت‌های جدید را معرفی می‌کند که تعاملات طبیعی‌تر، هوشمندانه‌تر و امن‌تری ایجاد می‌کنند و آن را برای کاربردهای سطح سازمانی بسیار مناسب می‌سازد.

این عرضه تنها چهار ماه پس از رونمایی نسخه اولیه پلتفرم انجام شده که نشان‌دهنده تعهد ElevenLabs به توسعه سریع است و همچنین یک روز پس از رونمایی استارتاپ رقیب Hume از مدل صوتی هوش مصنوعی بر نوبت خود به نام EVI 3  انجام گرفته است.

این رونمایی همچنین پس از ظهور مدل‌های صوتی AI متن‌باز جدید انجام می‌شود که باعث شده برخی تأثیرگذاران AI اعلام کنند ElevenLabs دیگر کارایی ندارد. اما به نظر می‌رسد این اظهارات زودهنگام بوده‌اند.

طبق گفته یوزف مارکو از تیم مهندسی  ElevenLabs، Conversational AI 2.0  به طور قابل توجهی بهتر از نسخه قبلی است و استاندارد جدیدی برای تجربه‌های مبتنی بر صدا تعیین می‌کند.

بهبود گفتار طبیعی

یکی از نکات برجسته Conversational AI 2.0 مدل پیشرفته صحبت به نوبت آن است.

این فناوری برای مدیریت ظرافت‌های گفتگوهای انسانی طراحی شده است و مکث‌های ناخوشایند یا قطع‌کردن‌های ناخواسته که در سیستم‌های صوتی سنتی رخ می‌دهد را حذف می‌کند.

با تحلیل علائم گفتگو مانند تردیدها و کلمات پرکننده در زمان واقعی، عامل می‌تواند بفهمد چه زمانی صحبت کند و چه زمانی گوش دهد.

این قابلیت به‌ویژه برای کاربردهایی مانند خدمات مشتری که عوامل باید تعادل بین پاسخ‌دهی سریع و ریتم طبیعی گفتگو را حفظ کنند، بسیار مهم است.

پشتیبانی چندزبانه

Conversational AI 2.0  همچنین قابلیت تشخیص زبان یکپارچه را معرفی می‌کند که امکان بحث‌های چندزبانه بدون نیاز به پیکربندی دستی را فراهم می‌آورد.

این ویژگی اطمینان می‌دهد که عامل می‌تواند زبان صحبت شده توسط کاربر را تشخیص داده و در همان تعامل به آن پاسخ دهد.

این قابلیت برای شرکت‌های جهانی که به دنبال ارائه خدمات یکنواخت به مشتریان متنوع هستند، موانع زبانی را از بین برده و تجربیات فراگیرتری ایجاد می‌کند.

سطح سازمانی

یکی از افزوده‌های قدرتمند، سیستم بازیابی افزوده‌شده داخلی(RAG)  است. این ویژگی به AI اجازه می‌دهد تا به پایگاه‌های دانش خارجی دسترسی پیدا کرده و اطلاعات مرتبط را فوراً بازیابی کند، در حالی که تأخیر بسیار کم و حفاظت قوی از حریم خصوصی را حفظ می‌کند.

به عنوان مثال، در محیط‌های بهداشتی، این یعنی یک دستیار پزشکی می‌تواند دستورالعمل‌های درمان را مستقیماً از پایگاه داده مؤسسه بدون تأخیر استخراج کند. در پشتیبانی مشتری، عوامل می‌توانند به اطلاعات به‌روز محصول از مستندات داخلی دسترسی پیدا کنند تا بهتر به کاربران کمک کنند.

چندرسانه‌ای و شخصیت‌های جایگزین

علاوه بر این ویژگی‌های اصلی، پلتفرم جدید ElevenLabs از چندرسانه‌ای پشتیبانی می‌کند، به این معنا که عوامل می‌توانند از طریق صدا، متن یا ترکیبی از هر دو ارتباط برقرار کنند. این انعطاف‌پذیری بار مهندسی توسعه‌دهندگان را کاهش می‌دهد زیرا عوامل تنها یک بار تعریف می‌شوند تا در کانال‌های مختلف ارتباطی فعالیت کنند.

برای افزایش بیشتر بیانگری عامل، Conversational AI 2.0  حالت چندشخصیتی را فعال می‌کند که امکان تغییر یک عامل بین شخصیت‌های مختلف را فراهم می‌آورد. این قابلیت می‌تواند در سناریوهایی مانند توسعه محتوای خلاقانه، شبیه‌سازی‌های آموزشی یا کمپین‌های تعامل با مشتری ارزشمند باشد.

تماس‌های دسته‌ای خروجی

برای سازمان‌هایی که به دنبال خودکارسازی گسترده تماس‌های خروجی هستند، پلتفرم اکنون از تماس‌های دسته‌ای پشتیبانی می‌کند.

سازمان‌ها می‌توانند با استفاده از عوامل AI مکالمه‌ای، چندین تماس خروجی را به صورت همزمان آغاز کنند؛ روشی که برای نظرسنجی‌ها، هشدارها و پیام‌های شخصی‌سازی شده مناسب است.

این ویژگی هدف افزایش دسترسی و کارایی عملیاتی را دارد و جایگزینی مقیاس‌پذیرتر نسبت به تلاش‌های دستی تماس خروجی ارائه می‌دهد.

استانداردهای سازمانی

علاوه بر قابلیت‌هایی که ارتباط و تعامل را بهبود می‌بخشند، Conversational AI 2.0  تاکید زیادی بر اعتماد و تطابق با مقررات دارد. این پلتفرم کاملاً با HIPAA سازگار است، که برای کاربردهای بهداشتی با نیاز به حفظ حریم خصوصی و محافظت داده حیاتی است. همچنین پشتیبانی از محل نگهداری داده‌های اتحادیه اروپا به صورت اختیاری را ارائه می‌دهد که با الزامات حاکمیت داده در اروپا هماهنگ است.

ElevenLabs  این ویژگی‌های مطابق با مقررات را با امنیت و قابلیت اطمینان سطح سازمانی تقویت می‌کند. این سیستم برای دسترسی بالا و یکپارچه‌سازی با سیستم‌های جانبی طراحی شده است و Conversational AI 2.0 را به گزینه‌ای امن و قابل اعتماد برای کسب‌وکارهایی تبدیل می‌کند که در محیط‌های حساس یا تحت نظارت فعالیت می‌کنند.

منبع: https://venturebeat.com

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *