امروزه، ابزارهای هوش مصنوعی تبدیل متن به تصویر، به یکی از کاربردیترین سرویسها تبدیل شدهاند که روزانه توسط میلیونها نفر مورد استفاده قرار میگیرند. در این فضای رقابتی، نامهایی مانند Midjourney و Dall.E 2 شناخته شدهاند و یک سرویس دیگر به نام Stable Diffusion نیز به توسعه الگوریتمهای مولد تصویر میپردازد تا جایگاه خود را بهبود بخشد. این سرویس در سال 2022 فعالیت خود را آغاز کرده و با به روزرسانیهای متعدد، توانسته عملکرد محصول خود را بهبود ببخشد. حال نوبت به نسخه Stable Diffusion XL است تا گامی مهم در مسیر توسعه این سرویس مولد تصویر بردارد.
یکی از اصلاحات بزرگ در Stable Diffusion XL، افزایش قابلتوجه وضوح و جزئیات تصاویر است. در بهروزرسانی قبلی این ابزار با نام Stable Diffusion 1.5، تصاویری با وضوح 512×512 در اختیار کاربران قرار میگرفت که با وجود بهینهسازی، تصویر خروجی با جزئیات کمی برخوردار بود. با بهروزرسانی Stable Diffusion 2.x، نسبت وضوح به 768×768 افزایش یافت و در نسخه Stable Diffusion XL، نرخ وضوح به 1024×1024 پیکسل رسیده است تا جزئیات بسیار بیشتری در تصویر خروجی به نمایش درآید.
قابلیت Local Control در هوش مصنوعی Stable Diffusion XL
در حال حاضر، تبدیل متن به تصویر یکی از ابزارهای پرکاربرد و پرطرفدار در بین کاربران است که روزانه میلیونها نفر از آن استفاده میکنند. در این حوزه رقابتی، نامهایی مانند Midjourney و Dall-E 2 شناخته شدهاند و یک سرویس دیگر با نام Stable Diffusion نیز در حال توسعه الگوریتمهای مولد تصویر است تا جایگاه خود را بهبود بخشد. این سرویس در سال 2022 شروع به کار کرده و با بهروزرسانیهای متعدد، توانسته عملکرد محصول خود را بهبود ببخشد. حال نوبت به نسخه Stable Diffusion XL است که یک گام مهم در مسیر توسعه این سرویس مولد تصویر بردارد.
یکی از قابلیتهای مهم نسخه XL، قابلیت استفاده از Stable Diffusion بر روی سیستمهای محلی است. به این ترتیب، کاربران میتوانند با دانلود نرمافزار این ابزار بر روی کامپیوتر شخصی، از قدرت پردازش سیستم خود برای تولید تصاویر استفاده کنند. در این روش، کاربران میتوانند بدون نیاز به پرداخت هزینه، تصاویر مختلفی را خلق کنند. در حالی که در حالت تحت وب نیازمند پرداخت هزینه و ارائه «توکن» برای دریافت خروجی هستند.
قابلیت دیگر نسخه XL، کاهش محدودیتها و ممیزیهاست. در نسخه نرمافزاری، محدودیتهای کاربردی کمتری وجود دارد و کاربران میتوانند این ابزار را بر اساس نیازها و علایق خود، شخصیسازی کنند.
یکی از نقصهای بزرگ در الگوریتمهای تولید تصویر، توانایی ناکافی آنها در ترسیم دست اشخاص است. اما Stable Diffusion XL توانسته است با تلاشهای خود، عملکرد الگوریتم را در ترسیم دست اشخاص بهبود بخشد و دستانی بیایراد و واقعی خلق کند.
با بهبود قابلیتهای نسخه XL، ابزارهای تبدیل متن به تصویر به سمت خلق تصاویری واقعگرایانه با کیفیت بالا حرکت میکنند و به نظر میرسد که مرز تشخیص تصاویر حقیقی و غیرواقعی، بهسرعت در حال محو شدن است.