سرور مجازی
روباتيك

چت‌جی‌پی‌تی اکنون صحبت می‌کند، گوش می‌دهد و می‌فهمد

چت‌جی‌پی‌تی اکنون صحبت می‌کند، گوش می‌دهد و می‌فهمد

شرکت OpenAI در حال افزودن قابلیت‌های پیشگامانه‌ای به ChatGPT است که به آن امکان می‌دهد با استفاده هوش مصنوعی برای توانائی‌های دیدن، شنیدن و صحبت کردن از موانع عبور کند.
قرار است در ظرف دو هفته آینده چندوجهی‌بودن و ارتقاهایی در تعامل با کاربر ارائه شوند، که یک جهش قابل توجه از تعاملات مبتنی بر متن به شمار می‌رود.
 
در این مطلب دیتاسنتر من و به نقل از هکرنون به بررسی قابلیت‌های آن می‌پردازیم.
 
1. تعامل صوتی:
برای اولین بار، ChatGPT به درخواست‌های کاربر به صورت شفاهی پاسخ می‌دهد، و آن را به یک شریک گفت‌وگوی تعاملی‌تر و جذاب‌تر تبدیل می‌کند. این ویژگی در iOS و اندروید در دسترس خواهد بود و کاربران می‌توانند از صدا برای انجام مکالمات متقابل با هوش مصنوعی استفاده کنند.
این قابلیت، ChatGPT را در رقابت مستقیم با دستیارهای صوتی مشهور مانند سیری و الکسا قرار می‌دهد.
 
2. تعامل چندوجهی ارتقایافته:
کاربران اکنون می‌توانند تصاویر را به ChatGPT نشان دهند و در مورد آنها مکالمه‌های زنده داشته باشند، که امکان تجربه کاربری بصری‌تر و غنی‌تر را فراهم می‌کند. این ویژگی گامی قابل توجه در ارائه زمینه (کانتکست) بیشتر در طول تعاملات است و در همه پلتفرم‌ها وجود دارد.
 
3. شخصیت‌های مصنوعی سفارشی‌سازی‌شده:
پنج شخصیت مصنوعی خنثی از جمله Juniper، Breeze و Ember به صورت شفاهی به سوالات کاربران پاسخ خواهند داد. در نهایت، OpenAI قصد دارد به کاربران امکان دهد که صدای شخصی خود را ایجاد کنند که این کار باعث گسترش تجربیات کاربری می‌شود.
 
4. موتور Whisper پیشرفته:
موتور پیشرفته ویسپر کیفیت صداهای هوش مصنوعی را تقویت می‌کند، که با وجود داشتن سبکی که ممکن است برخی آن را نوعی فضولی و مزاحمت بدانند، اما اولین واکنش‌ها به آن از جنبه تعامل انسان‌مانند مثبت بوده است.
 

ChatGPT

5. دسترسی مبتنی بر اشتراک:
این قابلیت‌های صوتی و تصویری جدید اختصاصاٌ برای مشترکین ChatGPT Plus با قیمت 20 دلار در ماه خواهد بود، و بر ارائه قابلیت‌های پیشرفته به کاربران اختصاصی تمرکز دارد.
 
6. رسیدگی به دغدغه‌های اخلاقی:
شرکت OpenAI مطمئن است که اکثر باگ‌های آن را حل کرده است و روی پرداختن به مسائل ایدئولوژیک، از جمله تقلب صوتی بالقوه، تبعیض علیه لهجه‌های غیرمعمول، و نسبت دادن ناخواسته بار اجتماعی و سیاسی به صدای هوش مصنوعی تمرکز دارد. آنها اطمینان می‌دهند که قابلیت ناشناس‌کردن افراد از طریق عکس‌ها در ChatGPT مسدود شده است.
 
7. کاربردهای جدید:
چندمنظورگی آن نیز افزایش یافته است، به طوری که به عنوان مثال کاربران می‌توانند از مکان‌های دیدنی یا محتویات یخچالشان عکس بگیرند و به صورت بی‌درنگ درباره آنها گفت‌وگو کنند، که این ویژگی در سناریوهای مختلفی مانند سفر، آشپزی یا یادگیری می‌تواند مفید واقع شود.
 

مجله خبری mydtc

نمایش بیشتر

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا