اولین مهندس نرم افزار هوش مصنوعی دنیا “دوین”
دستیار شرکت Cognition AI به نام دوین (Devin) به عنوان ابزاری متحول کننده برای توسعه دهندگان تبلیغ شده بود اما تا به اینجای کار در رقابت با نیروی انسانی به مشکل خورده است.
دوین در انجام بیشتر وظایفی که توسط محققان به او داده شده بود شکست خورده است.
دوین، دستیار کد نویسی که به عنوان اولین مهندس نرم افزار هوش مصنوعی دنیا مورد استقبال قرار گرفته بود، از 20 وظیفه کد نویسی داده شده فقط 3 تا را به پایان رساند. انجام این وظایف بیشتر از زمان مورد انتظار طول کشید و از روش های غیرمعقول کدنویسی برای رسیدن به هدف خود استفاده کرد.
زمانی که سال گذشته این ابزار کد نویسی معرفی شد به عنوان راه حلی تحول آفرین برای راحت تر کردن کار توسعه دهندگان نرم افزاری تبلیغ شد.
با هزینه ی ماهیانه 500 دلاری، دوین از طریق Slack کار میکند که به همین دلیل همانند گفتگو با یک همکار عمل میکند. در زمان معرفی Cognition دمویی را که در آن کوین از پلتفرم فری لنسینگ Upwork کار میگرفت را به نمایش گذاشت.
اما بعد از انتشار محققان نتوانستند که همان نتایج را تکرار کنند. یک مهندس نرم افزار ادعا های Upwork را رد کرد و محققان هوش مصنوعی در ارزیابی دوین آن را کامل ندانستند.
دوین به عنوان ابزار هوش مصنوعی ای متحول کننده مطرح شده بود
سال پیش در زمان انتشار دوین، Cognition ادعا کرد که این ابزار “با گرفتن وظایف پیچیده Upwork پول پارو خواهد کرد،” و ویدیو ای به همین مضمون به نمایش گذاشت.
اما توسعه دهنده نرم افزار کارل برین در پاسخ به این ادعا ویدیو خود را در منتشر کرد و استدلال کرد که این شرکت حقیقت را راجب توانایی های این ابزار نگفته است و نشان داد که “دوین قرار بود چه کار کند، چه کاری را به جای آن انجام داد، و در همان کار به چه بدی عمل کرد.”
برین اضافه کرد که برای خود او انجام این وظیفه 36 دقیقه طول کشید و برای کوین 6 ساعت زمان برد که در آخر نیز در در آن شکست خورد.
ادعا های Cognition به وسیله تیمی از محققانی از Answer AI نیز تست شد و نتایج آنان بیشتر به نتایج برین نزدیک بود تا به نتایج اولیه. نتایجی که کوین در آن فقط موفق به انجام 3 وظیفه از تعداد 20 وظیفه گردید.
اما بعضی از موفقیت ها نیز وجود داشت، دوین توانست مرکز داده Notion را در گوگل شیتز با کفایت سورپرایز کننده ای پیاده کند. او این وظیفه را در 1 ساعت و فقط با چند دقیقه نیاز به توجه انسانی انجام داد.
وظیفه ای دیگر که ساخت ردیاب سیاره ای بود به طور مشابه موفقیت آمیز انجام شد. کد نوشته شد کار می کرد ولی بسیار شلوغ و طولانی بود.
این حس نگاه کردن به آینده را داشت، هوش مصنوعی ای که توانایی نوشتن کد هایی که ساعت ها زمان توسط نیروی انسانی میگیرد را دارد.
وظایف پیچیده تر شروع به ایجاد چالش کردند، یا طوری که محققان بیان میکنند “هر چه تست های خود را گسترش دادیم ترک های بیشتری پیدا کردیم.”
وظایفی که به نظر ساده میرسیدند به جای ساعت ها روز ها زمان بردند که دوین در بن بست های تکنیکی گیر می کرد و یا راه حل هایی بیش از حد پیچیده و غیر قابل استفاده ارائه میداد. نگرانه کننده تر از آن تمایل دوین به ادامه کار در وظایفی که اصلا قابل انجام نبودند میباشد.
ناامید کننده ترین جنبه، عدم موفقیت ها نبود، همه ی ابزار ها محدودیت هایی دارند، اما زمانی که ما صرف انجام این تلاش ها کردیم بسیار طولانی بود.
چگونه از دوین استفاده کنیم
این بسیار از آن چیزی که زمان معرفی دستیار هوش مصنوعی تبلیغ شده بود فاصله دارد. پستی در بلاگ وبسایت Cognition ادعا کرده بود که دوین میتواند وظایف ساده را برای مهندسان نرم افزار انجام داده و به آنها اجازه تمرکز بر مشکلات بزرگتر را بدهد.
این وبسایت میگوید که دوین میتواند باگ ها را پیدا و رفع کند، طراحی و پیاده سازی کامل یک نرم افزار را انجام دهد و یا حتی مدل هوش مصنوعی آموزش دهد.
این کمپانی گفت: “با پیشرفت های ما در برنامه ریزی و استدلال بلند مدت، دوین میتواند نقشه و پیاده سازی وظایف پیچیده نرم افزاری ای که نیازنمد هزاران تصمیم میباشد را انجام دهد” “دوین میتواند که راه حل مربوط در هر قدم را پیدا کند، در طی زمان یاد بگیرد و اشکالات خود را درست کند.”
Cognition تاکنون در جواب به درخواست ITPro نظری نداده است اما بلاگ پست خودشان زمینه ای برای اینکه چطور میتوان استفاده ی موفق تری از این تست ها داشت، ارائه میدهد.
این شرکت میگوید که دوین “میتواند ابزاری همه جانبه باشد” اما پیشنهاد میکند که با وظایف کوچک مثل باگی ساده شروع کنید. این شرکت همچنین میگوید که دوین زمانی در بهترین حالت خود کار میکند که “به او وظایفی بدهید که خودتان میدانید چطور انجام دهید” و به این ابزار بگویید که چطور کار خود را تست و چک کند.
در نتیجه، دوین میتواند در کمک به تبدیل وظایف بزرگ به وظایفی کوچک تر که کمتر از 3 ساعت زمان میبرند مورد استفاده قرار گیرد.
با توجه به موفقیت Answer AI در استفاده از دوین برای کد ها و وظایف کوچک تر، به نظر میرسد که این پیشنهاد برای کوچک شروع کردن، باید رعایت شود.
این مقاله، مورد استفاده بودن دستیاران نرم افزاری فعلی هوش مصنوعی را به چالش میکشد، در حالی که مارک زاکربرگ پیشبینی کرده تا آخر امسال هوش مصنوعی کار مهندسان را انجام خواد داد.
او گفت: “در ابتدا برای اجرا بسیار پر هزینه خواهد بود، بعد میتوان آن را بهینه کرد و طی زمان به نقطه ای خواهیم رسید که بیشتر کد هایی که در نرم افزار هایمان و شامل کد هایی که برای هوش مصنوعی مان تولید میکنیم توسط مهندسان هوش مصنوعی به جای مهندسان انسانی انجام خواد گرفت.”
منبع: https://www.itpro.com