چگونه با تعریف از ChatGPT قوانین آن را دور بزنیم؟

چگونه با تعریف از ChatGPT قوانین آن را دور بزنیم؟
طبق گزارشی که پایگاه فناوری «The Verge» منتشر کرده، پژوهشگران دریافتند که ChatGPT تمایل دارد به درخواستهای کاربرانی که از آن تمجید میکنند، حتی در مواردی که این درخواستها مغایر با خط مشیهای طراحیشده هستند، پاسخ مثبت دهد.
محققان دانشگاه پنسیلوانیا در این مطالعه، از مجموعهای از تاکتیکهای روانشناختی که توسط «رابرت سیالدینی»، روانشناس برجسته، در کتاب «تأثیر: روانشناسی متقاعدسازی» ارائه شده، استفاده کردند. آنها توانستند مدل «GPT-4o Mini» شرکت OpenAI را متقاعد کنند تا به درخواستهایی که معمولاً رد میکند، پاسخ مثبت دهد.
این درخواستها شامل مواردی نظیر سوءاستفاده از کاربر، ارائهٔ راهنمای جامع برای ساخت «لیدوکائین» و طیف وسیعی از درخواستهای دیگر بود که معمولاً توسط مدل رد شده و نقض قوانین محسوب میشوند.
این پژوهش از هفت روش روانشناختی شامل «تأیید مرجعیت»، «تعهد»، «تمجید»، «عمل متقابل» و «کمبود» استفاده کرد که همگی بهصورت زبانی، مسیری برای دریافت پاسخ مثبت فراهم میکنند.
اگرچه پژوهشگران انتظار داشتند اثر هر تاکتیک با توجه به نوع درخواست و زمینهٔ گفتگو متفاوت باشد، اما اختلاف کارایی بین تاکتیکهای مختلف بسیار چشمگیر بود.
مطالعه نشان داد که نرخ پاسخدهی ChatGPT به درخواست چگونگی ساخت لیدوکائین (که معمولاً شامل درخواست مکانیسم تولید یک مادهٔ شیمیایی مانند وانیلین است) از یک درصد تا صددرصد، در صورت اصرار کاربر، افزایش مییابد.
در مقابل، مقایسهٔ ChatGPT با سایر مدلهای هوش مصنوعی یا تلاش برای متقاعدسازی با این استدلال که «مدلهای دیگر این کار را انجام میدهند»، تنها نرخ پاسخدهی را تا هجده درصد افزایش داد.
این پژوهش، نگرانی متخصصانی را برانگیخته که معتقدند ChatGPT ممکن است با افزایش استفادهٔ کاربران در سراسر جهان، به درخواستهای نامناسب نیز پاسخ دهد.
این یافته در شرایطی مطرح میشود که شرکتهای توسعهدهنده در تلاش هستند تا با اعمال محدودیتهای بیشتر، از پاسخدهی هوش مصنوعی به دستورات مخرب یا مشارکت غیرمستقیم آن در ارتکاب جرائم، جلوگیری کنند.
مجله خبری mydtc