Black Forest Labs از هوش مصنوعی جدید خود به نام Flux رونمایی کرده است که با ۱۲ میلیارد پارامتر، بزرگترین مدل متنباز تبدیل متن به تصویر تا به امروز محسوب میشود. Flux قادر است تصاویری تولید کند که با نمونههای میدجرنی رقابت کند و احتمالاً میتواند هر مدل دیگری، چه متنباز و چه بسته، را پشت سر بگذارد.
براساس گزارش Decrypt، هوش مصنوعی Flux در سه نسخه ارائه میشود: Flux Dev که متنباز است و برای توسعهدهندگان در دسترس قرار میگیرد. Flux Schnell که تا ۱۰ برابر عملکرد سریعتری دارد و تحت مجوز Apache ۲ منتشر میشود. Flux Pro نیز که نسخه متنبسته است و میتوان از طریق API از آن استفاده کرد.
یکی از تفاوتهای اصلی Flux با میدجرنی در این است که Flux متنباز است و میتوان آن را روی سیستمی نسبتاً خوب هم اجرا کرد. دو نسخه Flux Dev و Flux Schnell اکنون برای دانلود در Hugging Face در دسترس قرار دارند.
سازندگان Flux میگویند در تستهای بنچمارک، این مدل ۱۲ میلیارد پارامتری در تولید تصویر از مدلهایی مانند Dall-E ۳ (HD)، میدجرنی v۶.۰ و SD۳ Ultra در بخش کیفیت بصری، وفاداری به پرامپت کاربر، تایپوگرافی و تنوع خروجی، بهتر عمل میکند. البته همانطور که در تصویر بالا مشاهده میکنید، هرچند Flux از برخی جنبهها مانند نورپردازی بهتر از میدجرنی عمل میکند، اما زن یک پا اضافه دارد.
بااینحال، اگر بخواهید روی سیستم خود از مدل متنباز Flux استفاده کنید، نیاز به پردازشگر گرافیکی قدرتمندی دارید. این مدل حدود ۲۳ گیگابایت حجم دارد؛ یعنی به حدود ۲۴ گیگابایت VRAM نیاز خواهید داشت. البته شما میتوانید از پلتفرمهای آنلاین مانند NightCafe و Based Labs نیز برای تولید تصاویر در Flux استفاده کنید.
بهطورکلی، نسخه پرو Flux میتواند رقیب خوبی برای میدجرنی و سایر مدلهای پولی باشد. بااینحال، باتوجهبه اینکه مدلهای جدید، مانند Auraflow یا Flux، بسیار سنگیناند، افرادی که پردازشگرهای گرافیکی متوسطی دارند، میتوانند سراغ SD۳ یا حتی نسخههای سبکتر SDXL بروند.