تحول در تولید تصویر با Nano Banana 2 گوگل

تحول در تولید تصویر با Nano Banana 2 گوگل
به گزارش دیتاسنتر من و به نقل از Digitaltrends، نسخه نخست گوگل Nano Banana در زمان عرضه با استقبال گسترده کاربران روبهرو شد و میلیونها نفر از تازهترین سرویس تولید تصویر مبتنی بر هوش مصنوعی گوگل برای خلق تصاویر استفاده کردند. بررسیهای اولیه نیز نشان میداد این مدل در بسیاری از سناریوها عملکردی چشمگیر ارائه میدهد.
با این حال، همانند بسیاری از مدلهای مولد از جمله OpenAI و محصول شاخص آن چتجیپیتی، Nano Banana نیز در تولید تصاویر حاوی متن با چالش جدی مواجه بود. نمایش نادرست یا ناخوانای کلمات در تصویر، یکی از نشانههای رایج تولید محتوا توسط هوش مصنوعی به شمار میرفت و محدودیتی مهم برای کاربردهای حرفهای ایجاد میکرد.
اکنون گوگل مدعی است که این ضعف را در Nano Banana 2 برطرف کرده و علاوه بر بهبود رندر متن، مجموعهای از ارتقاهای معنادار دیگر را نیز در اختیار کاربران قرار داده است.
رویکردی هوشمندانهتر و سریعتر برای تبدیل ایده به تصویر
یکی از مهمترین بهبودهای Nano Banana 2، گسترش دامنه «دانش» مدل است. این نسخه میتواند از دانش گستردهتر مدلهای خانواده جمینای بهره بگیرد و بهصورت بلادرنگ، اطلاعات و تصاویر مرتبط را از جستوجوهای وب استخراج کند.
به گفته گوگل، این قابلیت موجب افزایش دقت خروجیها شده و امکان تولید اینفوگرافیک، تبدیل یادداشتها به نمودارهای شفاف و ایجاد تجسمهای دقیق از دادهها را فراهم میکند.
در بخش رندر متن نیز Nano Banana 2 پیشرفت قابلتوجهی داشته است. این مدل نهتنها قادر به تولید متنهای خوانا و دقیق در تصاویر است، بلکه میتواند متون را به زبانهای مختلف ترجمه و در قالب گرافیکی مناسب نمایش دهد؛ قابلیتی که برای تولید محتوای چندزبانه اهمیت بالایی دارد.
کنترل بیشتر، ثبات بالاتر
نسخه جدید با هدف پاسخگویی به نیازهای حرفهای، امکانات کنترلی بیشتری در اختیار کاربران قرار میدهد. مهمترین ارتقاهای اعلامشده عبارتاند از:
ثبات سوژه: امکان حفظ شباهت شخصیتها تا ۵ کاراکتر و ۱۴ شیء در صحنههای مختلف فراهم شده است. این ویژگی تولید استوریبورد و روایتهای چندصحنهای را کاربردیتر و منسجمتر میکند.
پیروی دقیق از دستورالعملها: Nano Banana 2 میتواند دستورالعملهای پیچیده را با دقت بیشتری دنبال کند، جزئیات ظریف را تشخیص دهد و تصویری نزدیکتر به ایده اولیه کاربر تولید کند.
تنظیمات آماده برای تولید: کاربران اکنون قادرند تصاویر را با هر نسبت ابعاد یا وضوح دلخواه ایجاد کنند؛ موضوعی که تولید داراییهای بصری برای شبکههای اجتماعی، وبسایتها و پروژههای تبلیغاتی را سادهتر میسازد.
ارتقای کیفیت بصری: گوگل وعده داده است که این نسخه بافتهای غنیتر، جزئیات دقیقتر و نورپردازی پویاتری ارائه میدهد و در مجموع، کیفیت خروجیها را نسبت به نسل پیشین بهطور محسوسی ارتقا میبخشد.
فراتر از یک بهروزرسانی ساده
اگر ادعاهای گوگل در عمل نیز محقق شود، Nano Banana 2 میتواند گام بعدی در تکامل ابزارهای تولید تصویر مبتنی بر هوش مصنوعی باشد. ترکیب وضوح بالا، رندر دقیق متن و ثبات کاراکتر در پروژههای چندمرحلهای، این نسخه را از یک ارتقای تدریجی فراتر برده و آن را به گزینهای جدی برای کاربردهای حرفهای و تولید انبوه محتوا تبدیل میکند.
مجله خبری mydtc




