تبدیل متن به عکس با قابلیت جدید گوگل ممکن می‌شود

28 می 2022

36 زمان مطالعه یک دقیقه

گوگل یک هوش مصنوعی متن به تصویر جدید دارد که به گفته این شرکت رقبا را شکست می‌دهد. این برنامه که Imagen نام دارد، متنی را دریافت می‌کند و توصیف آن را به صورت عکس خروجی می‌دهد.

به گزارش cnet، قابلیت Imagen از دیگر مولد‌های تبدیل متن به تصویر مانند مدل‌های DALL-E، VQ-GAN+CLIP و Latent Diffusion پیروی می‌کند. هنگامی که از گوگل خواسته شد تصاویر ایجاد شده توسط Imagen و سایر تولیدکنندگان متن به تصویر را مقایسه کند، مردم دریافتند که مدل گوگل از رقبای خود در دقت و وفاداری به متن، تصویر بهتری ایجاد می‌کند.

گوگل چندین نمونه از پیام‌های متنی و تصاویر حاصل از هوش مصنوعی را در وب سایت Imagen خود به اشتراک گذاشت. مدل‌های یادگیری متن به تصویر، قدرت سیستم‌های یادگیری ماشینی را نشان می‌دهند. در این حالت، Imagen نیاز به دانستن نحوه استفاده از نرم افزار‌های تخصصی مانند فتوشاپ برای ایجاد تصاویر انتزاعی را از بین می‌برد.

همانطور که در کنفرانس I/O گوگل در اوایل این ماه اشاره شد، سیستم‌های هوش مصنوعی به شرکت کمک می‌کنند تا به چشم‌انداز آینده محاسباتی محیطی نزدیک‌تر شود. محاسبات محیطی ایده ای است که مردم می‌توانند روزی به طور مستقیم و بدون نیاز به دانش خاصی از سیستم‌ها یا کد‌های خاص در رایانه‌ها استفاده کنند.

با این حال، گوگل تصمیم گرفته است که Imagen را برای عموم منتشر نکند. Imagen اینترنت را برای کسب اطلاعات مورد نیاز حوزه آموزش و ایجاد تصاویر مفهومی و انتزاعی کارآمدتر می‌کند. از آنجایی که اینترنت می‌تواند مملو از کلیشه‌ها و سوگیری‌ها باشد، این موارد می‌تواند در نهایت وارد Imagen نیز شود. گوگل گفت این سوگیری‌ها شامل ترجیح دادن رنگ پوست روشن‌تر و کلیشه‌های جنسیتی غربی است. این شرکت همچنین نگران است که Imagen ممکن است توسط برخی بازیگران استفاده منفی شود.

گوگل به سایر سازندگان هوش مصنوعی هشدار می‌دهد که مراقب انتشار مدل‌های متن به تصویر برای عموم باشند و توجه دقیقی به اطلاعاتی که یک هوش مصنوعی روی آن‌ها آموزش می‌دهد، داشته باشند.

بیشتر بخوانید