گوگل قرار نبود این هفته اجازه بدهد تمام توجهها فقط معطوف به سامسونگ باشد. این شرکت که توسعهدهنده مدل هوش مصنوعی Google Gemini است، روز پنجشنبه از Nano Banana 2 رونمایی کرد؛ نسل دوم ابزار ویرایش تصویر مبتنی بر هوش مصنوعی که سال گذشته حسابی وایرال شد.
اگر خاطرتان باشد، نسخه اول Nano Banana پاییز گذشته سر و صدای زیادی به پا کرد و با تواناییهای فوتورئالیستی خیرهکنندهاش بسیاری از کاربران حوزه هوش مصنوعی را شگفتزده کرد. این ابزار خیلی سریع از رقبایی مثل Midjourney و حتی محصولات تصویری OpenAI جلو زد؛ بهخصوص به دلیل توانایی بالایش در ویرایش حرفهای تصاویر موجود در کنار تولید تصاویر کاملاً جدید.
چند ماه بعد، نسخه Pro این ابزار منتشر شد که قابلیتهای تولید متن را هم به شکل قابلتوجهی بهبود داد. حالا گوگل ادعا میکند که Nano Banana 2 ترکیبی از بهترین ویژگیهای هر دو نسخه قبلی است؛ چیزی شبیه به شعار معروف «بهترینِ هر دو دنیا» که طرفداران سریال Hannah Montana خوب به خاطر دارند.

گوگل میگوید Nano Banana 2 در واقع نسخه ارتقایافته مدل پایه تولید تصویر این شرکت است. طبق اعلام رسمی، این نسخه جدید قرار است سرعت مدل اولیه را حفظ کند، اما همزمان دقت و جزئیات نسخه Pro را هم ارائه دهد.
یکی از مهمترین تغییرات این است که Nano Banana 2 از دانش جهانی (World Knowledge) تعبیهشده در Gemini 3 استفاده میکند؛ قابلیتی که پیش از این فقط در نسخه Pro در دسترس بود. نتیجه چیست؟ تصاویر تولیدشده باید واقعگرایانهتر، منطقیتر و با احتمال خطای کمتر (Hallucination کمتر) باشند.
این موضوع برای کاربرانی که از ابزارهای تولید تصویر هوش مصنوعی برای پروژههای حرفهای، تبلیغاتی یا محتوای شبکههای اجتماعی استفاده میکنند، اهمیت زیادی دارد؛ چراکه یکی از چالشهای همیشگی مدلهای تصویری، تولید جزئیات نادرست یا غیرمنطقی بوده است.
بهبود تولید متن داخل تصویر
گوگل همچنین اعلام کرده که تولید متن درون تصاویر مثلاً هنگام طراحی کارت تبریک، پوستر یا بنر تبلیغاتی در Nano Banana 2 واضحتر و خواناتر خواهد بود. این قابلیت در نسلهای قبلی یکی از نقاط ضعف اغلب ابزارهای AI بود، جایی که متنها اغلب بههمریخته یا ناخوانا تولید میشدند.
ثبات کاراکتر و کیفیت بصری بالاتر
یکی از ویژگیهایی که کاربران و تولیدکنندگان محتوا همیشه Nano Banana را به خاطر آن تحسین میکردند، ثبات کاراکتر (Character Consistency) بود؛ یعنی توانایی مدل در حفظ ظاهر یک شخصیت در چند تصویر مختلف. حالا گوگل میگوید این ویژگی در نسخه دوم حتی بهتر شده است.
به گفته گوگل، مدل جدید:
- نورپردازی زندهتر (Vibrant Lighting)
- بافتهای غنیتر (Richer Textures)
- جزئیات شارپتر (Sharper Details)
- پشتیبانی از نسبت تصویرهای مختلف
- و تولید تصویر با وضوح تا 4K
را ارائه میدهد.
این یعنی Nano Banana 2 حالا میتواند هم برای محتوای شبکههای اجتماعی و هم برای پروژههای حرفهای گرافیکی با رزولوشن بالا استفاده شود.
نقش Nano Banana 2 در بحران محتوای هوش مصنوعی
از زمان عرضه Nano Banana، و تا حدی به خاطر همین ابزار، بحث درباره نقش محتوای تولیدشده با هوش مصنوعی در اکوسیستم آنلاین جدیتر از همیشه شده است. مدلهای پیشرفتهای مانند محصولات گوگل حالا میتوانند تصاویر و ویدیوهایی بسازند که تقریباً از نمونههای واقعی قابل تشخیص نیستند.
در کنار این پیشرفتها، موجی از محتوای بیکیفیت تولیدشده با AI که بعضاً با عنوان «AI Slop» شناخته میشود شبکههای اجتماعی را پر کرده است. طبق یک نظرسنجی منتشرشده توسط CNET، اکثریت کاربران شبکههای اجتماعی معتقدند با محتوای تولیدشده توسط هوش مصنوعی مواجه شدهاند، اما کمتر از نیمی از آنها (حدود ۴۴ درصد) اطمینان دارند که میتوانند آن را بهدرستی تشخیص دهند.
تصاویر فوتورئالیستی پیشرفته از همان نوعی که Nano Banana تولید میکند بخش مهمی از این چالش هستند. هرچه کیفیت خروجیها بالاتر میرود، مرز بین واقعیت و تولید مصنوعی کمرنگتر میشود.
دسترسی و واترمارک نامرئی
مدل جدید هماکنون در تمام بخشهایی که از Google Gemini استفاده میکنند در دسترس قرار گرفته است. Nano Banana 2 جایگزین نسخه اصلی شده و کاربران باید بین این مدل جدید و نسخه Pro یکی را انتخاب کنند.
گوگل اعلام کرده که تصاویر تولیدشده با Nano Banana 2 دارای واترمارک نامرئی خواهند بود که با عنوان Content Credentials شناخته میشود. این برچسبهای دیجیتال بهصورت پنهان در فایل تصویر ذخیره میشوند. اگر بخواهید بررسی کنید که یک تصویر با هوش مصنوعی ساخته شده یا نه، میتوانید آن را در Gemini آپلود کنید تا سیستم تشخیص دهد.
البته این قابلیت فقط در صورتی کار میکند که تصویر با ابزارهای هوش مصنوعی گوگل ساخته شده باشد و شامل خروجی سایر پلتفرمها نمیشود.
جمعبندی
با معرفی Nano Banana 2، گوگل یک بار دیگر نشان داد که رقابت در حوزه ابزارهای تولید تصویر مبتنی بر هوش مصنوعی وارد مرحله تازهای شده است. ترکیب سرعت نسخه پایه با دقت مدل Pro، بهبود تولید متن در تصاویر، افزایش ثبات کاراکتر و پشتیبانی از وضوح 4K، این ابزار را به گزینهای جدی برای تولیدکنندگان محتوا و کاربران حرفهای تبدیل میکند.
با این حال، همزمان با پیشرفت فناوری، چالشهایی مانند تشخیص محتوای واقعی از تصاویر تولیدشده با AI نیز پررنگتر میشود؛ موضوعی که اهمیت استفاده از واترمارکهای دیجیتال و شفافیت بیشتر را دوچندان میکند.
در مجیک تک همچنان تازهترین اخبار و تحلیلهای حوزه هوش مصنوعی و تکنولوژی را دنبال میکنیم تا شما همیشه یک قدم جلوتر از موج تحولات دیجیتال باشید




