نسل جدید دستیار صوتی هوش مصنوعی Conversational AI 2.0
هوش مصنوعی با سرعت بالایی در حال پیشرفت برای کسبوکارها است، و این موضوع بهویژه در حوزه مدلهای صوتی و گفتاری AI کاملاً مشهود است.
شرکت ElevenLabs، استارتاپ پرسرمایه فعال در زمینه صدا و اثرات صوتی مبتنی بر هوش مصنوعی که توسط مهندسین سابق Palantir تأسیس شده، نسخه جدیدی به نام Conversational AI 2.0 را معرفی کرد؛ بهروزرسانی مهمی برای پلتفرم ساخت عوامل صوتی پیشرفته برای کاربردهای سازمانی مانند پشتیبانی مشتری، مراکز تماس، فروش، بازاریابی و..
این بهروزرسانی مجموعهای از قابلیتهای جدید را معرفی میکند که تعاملات طبیعیتر، هوشمندانهتر و امنتری ایجاد میکنند و آن را برای کاربردهای سطح سازمانی بسیار مناسب میسازد.
این عرضه تنها چهار ماه پس از رونمایی نسخه اولیه پلتفرم انجام شده که نشاندهنده تعهد ElevenLabs به توسعه سریع است و همچنین یک روز پس از رونمایی استارتاپ رقیب Hume از مدل صوتی هوش مصنوعی بر نوبت خود به نام EVI 3 انجام گرفته است.
این رونمایی همچنین پس از ظهور مدلهای صوتی AI متنباز جدید انجام میشود که باعث شده برخی تأثیرگذاران AI اعلام کنند ElevenLabs دیگر کارایی ندارد. اما به نظر میرسد این اظهارات زودهنگام بودهاند.
طبق گفته یوزف مارکو از تیم مهندسی ElevenLabs، Conversational AI 2.0 به طور قابل توجهی بهتر از نسخه قبلی است و استاندارد جدیدی برای تجربههای مبتنی بر صدا تعیین میکند.
بهبود گفتار طبیعی
یکی از نکات برجسته Conversational AI 2.0 مدل پیشرفته صحبت به نوبت آن است.
این فناوری برای مدیریت ظرافتهای گفتگوهای انسانی طراحی شده است و مکثهای ناخوشایند یا قطعکردنهای ناخواسته که در سیستمهای صوتی سنتی رخ میدهد را حذف میکند.
با تحلیل علائم گفتگو مانند تردیدها و کلمات پرکننده در زمان واقعی، عامل میتواند بفهمد چه زمانی صحبت کند و چه زمانی گوش دهد.
این قابلیت بهویژه برای کاربردهایی مانند خدمات مشتری که عوامل باید تعادل بین پاسخدهی سریع و ریتم طبیعی گفتگو را حفظ کنند، بسیار مهم است.
پشتیبانی چندزبانه
Conversational AI 2.0 همچنین قابلیت تشخیص زبان یکپارچه را معرفی میکند که امکان بحثهای چندزبانه بدون نیاز به پیکربندی دستی را فراهم میآورد.
این ویژگی اطمینان میدهد که عامل میتواند زبان صحبت شده توسط کاربر را تشخیص داده و در همان تعامل به آن پاسخ دهد.
این قابلیت برای شرکتهای جهانی که به دنبال ارائه خدمات یکنواخت به مشتریان متنوع هستند، موانع زبانی را از بین برده و تجربیات فراگیرتری ایجاد میکند.
سطح سازمانی
یکی از افزودههای قدرتمند، سیستم بازیابی افزودهشده داخلی(RAG) است. این ویژگی به AI اجازه میدهد تا به پایگاههای دانش خارجی دسترسی پیدا کرده و اطلاعات مرتبط را فوراً بازیابی کند، در حالی که تأخیر بسیار کم و حفاظت قوی از حریم خصوصی را حفظ میکند.
به عنوان مثال، در محیطهای بهداشتی، این یعنی یک دستیار پزشکی میتواند دستورالعملهای درمان را مستقیماً از پایگاه داده مؤسسه بدون تأخیر استخراج کند. در پشتیبانی مشتری، عوامل میتوانند به اطلاعات بهروز محصول از مستندات داخلی دسترسی پیدا کنند تا بهتر به کاربران کمک کنند.
چندرسانهای و شخصیتهای جایگزین
علاوه بر این ویژگیهای اصلی، پلتفرم جدید ElevenLabs از چندرسانهای پشتیبانی میکند، به این معنا که عوامل میتوانند از طریق صدا، متن یا ترکیبی از هر دو ارتباط برقرار کنند. این انعطافپذیری بار مهندسی توسعهدهندگان را کاهش میدهد زیرا عوامل تنها یک بار تعریف میشوند تا در کانالهای مختلف ارتباطی فعالیت کنند.
برای افزایش بیشتر بیانگری عامل، Conversational AI 2.0 حالت چندشخصیتی را فعال میکند که امکان تغییر یک عامل بین شخصیتهای مختلف را فراهم میآورد. این قابلیت میتواند در سناریوهایی مانند توسعه محتوای خلاقانه، شبیهسازیهای آموزشی یا کمپینهای تعامل با مشتری ارزشمند باشد.
تماسهای دستهای خروجی
برای سازمانهایی که به دنبال خودکارسازی گسترده تماسهای خروجی هستند، پلتفرم اکنون از تماسهای دستهای پشتیبانی میکند.
سازمانها میتوانند با استفاده از عوامل AI مکالمهای، چندین تماس خروجی را به صورت همزمان آغاز کنند؛ روشی که برای نظرسنجیها، هشدارها و پیامهای شخصیسازی شده مناسب است.
این ویژگی هدف افزایش دسترسی و کارایی عملیاتی را دارد و جایگزینی مقیاسپذیرتر نسبت به تلاشهای دستی تماس خروجی ارائه میدهد.
استانداردهای سازمانی
علاوه بر قابلیتهایی که ارتباط و تعامل را بهبود میبخشند، Conversational AI 2.0 تاکید زیادی بر اعتماد و تطابق با مقررات دارد. این پلتفرم کاملاً با HIPAA سازگار است، که برای کاربردهای بهداشتی با نیاز به حفظ حریم خصوصی و محافظت داده حیاتی است. همچنین پشتیبانی از محل نگهداری دادههای اتحادیه اروپا به صورت اختیاری را ارائه میدهد که با الزامات حاکمیت داده در اروپا هماهنگ است.
ElevenLabs این ویژگیهای مطابق با مقررات را با امنیت و قابلیت اطمینان سطح سازمانی تقویت میکند. این سیستم برای دسترسی بالا و یکپارچهسازی با سیستمهای جانبی طراحی شده است و Conversational AI 2.0 را به گزینهای امن و قابل اعتماد برای کسبوکارهایی تبدیل میکند که در محیطهای حساس یا تحت نظارت فعالیت میکنند.
منبع: https://venturebeat.com