تحول در تولید تصویر با Nano Banana 2 گوگل

3 ساعت پیش

0 زمان تقریبی مطالعه 2 دقیقه

تحول در تولید تصویر با Nano Banana 2 گوگل

گوگل از نسل دوم موتور تولید تصویر خود با نام Nano Banana 2 رونمایی کرده؛ مدلی که به گفته این شرکت، قرار است یکی از قدیمی‌ترین چالش‌های تصاویر تولیدشده با هوش مصنوعی یعنی «رندر نادرست متن» را برطرف کند.

به گزارش دیتاسنتر من و به نقل از Digitaltrends، نسخه نخست گوگل Nano Banana در زمان عرضه با استقبال گسترده کاربران روبه‌رو شد و میلیون‌ها نفر از تازه‌ترین سرویس تولید تصویر مبتنی بر هوش مصنوعی گوگل برای خلق تصاویر استفاده کردند. بررسی‌های اولیه نیز نشان می‌داد این مدل در بسیاری از سناریوها عملکردی چشمگیر ارائه می‌دهد.

با این حال، همانند بسیاری از مدل‌های مولد از جمله OpenAI و محصول شاخص آن چت‌جی‌پی‌تی، Nano Banana نیز در تولید تصاویر حاوی متن با چالش جدی مواجه بود. نمایش نادرست یا ناخوانای کلمات در تصویر، یکی از نشانه‌های رایج تولید محتوا توسط هوش مصنوعی به شمار می‌رفت و محدودیتی مهم برای کاربردهای حرفه‌ای ایجاد می‌کرد.

اکنون گوگل مدعی است که این ضعف را در Nano Banana 2 برطرف کرده و علاوه بر بهبود رندر متن، مجموعه‌ای از ارتقاهای معنادار دیگر را نیز در اختیار کاربران قرار داده است.

رویکردی هوشمندانه‌تر و سریع‌تر برای تبدیل ایده به تصویر

یکی از مهم‌ترین بهبودهای Nano Banana 2، گسترش دامنه «دانش» مدل است. این نسخه می‌تواند از دانش گسترده‌تر مدل‌های خانواده جمینای بهره بگیرد و به‌صورت بلادرنگ، اطلاعات و تصاویر مرتبط را از جست‌وجوهای وب استخراج کند.

به گفته گوگل، این قابلیت موجب افزایش دقت خروجی‌ها شده و امکان تولید اینفوگرافیک، تبدیل یادداشت‌ها به نمودارهای شفاف و ایجاد تجسم‌های دقیق از داده‌ها را فراهم می‌کند.

در بخش رندر متن نیز Nano Banana 2 پیشرفت قابل‌توجهی داشته است. این مدل نه‌تنها قادر به تولید متن‌های خوانا و دقیق در تصاویر است، بلکه می‌تواند متون را به زبان‌های مختلف ترجمه و در قالب گرافیکی مناسب نمایش دهد؛ قابلیتی که برای تولید محتوای چندزبانه اهمیت بالایی دارد.

کنترل بیشتر، ثبات بالاتر

نسخه جدید با هدف پاسخ‌گویی به نیازهای حرفه‌ای، امکانات کنترلی بیشتری در اختیار کاربران قرار می‌دهد. مهم‌ترین ارتقاهای اعلام‌شده عبارت‌اند از:

ثبات سوژه: امکان حفظ شباهت شخصیت‌ها تا ۵ کاراکتر و ۱۴ شیء در صحنه‌های مختلف فراهم شده است. این ویژگی تولید استوری‌بورد و روایت‌های چندصحنه‌ای را کاربردی‌تر و منسجم‌تر می‌کند.

پیروی دقیق از دستورالعمل‌ها: Nano Banana 2 می‌تواند دستورالعمل‌های پیچیده را با دقت بیشتری دنبال کند، جزئیات ظریف را تشخیص دهد و تصویری نزدیک‌تر به ایده اولیه کاربر تولید کند.

تنظیمات آماده برای تولید: کاربران اکنون قادرند تصاویر را با هر نسبت ابعاد یا وضوح دلخواه ایجاد کنند؛ موضوعی که تولید دارایی‌های بصری برای شبکه‌های اجتماعی، وب‌سایت‌ها و پروژه‌های تبلیغاتی را ساده‌تر می‌سازد.

ارتقای کیفیت بصری: گوگل وعده داده است که این نسخه بافت‌های غنی‌تر، جزئیات دقیق‌تر و نورپردازی پویاتری ارائه می‌دهد و در مجموع، کیفیت خروجی‌ها را نسبت به نسل پیشین به‌طور محسوسی ارتقا می‌بخشد.

فراتر از یک به‌روزرسانی ساده

اگر ادعاهای گوگل در عمل نیز محقق شود، Nano Banana 2 می‌تواند گام بعدی در تکامل ابزارهای تولید تصویر مبتنی بر هوش مصنوعی باشد. ترکیب وضوح بالا، رندر دقیق متن و ثبات کاراکتر در پروژه‌های چندمرحله‌ای، این نسخه را از یک ارتقای تدریجی فراتر برده و آن را به گزینه‌ای جدی برای کاربردهای حرفه‌ای و تولید انبوه محتوا تبدیل می‌کند.

حتما بخوانید : محاسبه کالری سوزی پیاده‌روی؛ چقدر باید راه برویم تا لاغر شویم؟

مجله خبری mydtc

برچسب ها

3 ساعت پیش

0 زمان تقریبی مطالعه 2 دقیقه