باورنکردنی؛ این تصاویر واقعی نیستند و با هوش مصنوعی ساخته شدهاند
به گزارش آی تی بوم؛ هوش مصنوعی مولد تصویر Flux بهعنوان رقیب جدیدی برای میدجرنی، تصاویر واقعگرایانهای ایجاد میکند که ممکن است زنگ خطر را برای همه به صدا دربیاورد.
از دو سال گذشته که بازار هوش مصنوعی داغتر از همیشه بوده و بین مردم گسترش یافته است، همهی ما با هوش مصنوعیهای مولدی مثل DALL-E، میدجرنی، ادوبی فایرفلای و Stable Diffusion آشنا شدهایم. با اینکه بهترین تولیدکنندگان تصویر هوش مصنوعی همواره در تلاش بودهاند که با بهروزرسانیهای جدید، گامی نو و پیشرفتی قابل تحسین به ارمغان بیاورند، میتوان ادعا کرد که در تعدادی از زمینهها مثل واقعگرایی، تغییرات شگرفی نکردهاند.
Flux مولد تصویر هوش مصنوعیِ منبع باز و نسبتاً جدیدی محسوب میشود که میتواند گوی سبقت را بهخصوص در زمینهی واقعگرایی از نامداران تولید تصویر AI برباید. در آزمایشهای اولیه پژوهشگران با اجرای این مدل روی دستگاههای خودشان و جفت کردن آن با ابزار Lora که XLabs آن را توسعه داده و یک اسکریپت بهینهسازی برای فوتورئالیسم است، جزئیات بیشتری به Flux افزودهاند. این امر با تنظیم و بهبود عملکرد مدل هوش مصنوعی، نتایجی تولید میکند که تقریباً با یک نگاه سریع از عکسهای واقعی قابل تشخیص نیستند.
برای امتحان هوش مصنوعی جدید، زومیت از Flux خواست که مهندسی از شرکت مایکروسافت را به تصویر بکشد که در یونیفرم اداری با میکروفونی در دست و کارت پرسنلی مایکروسافت دور گردنش در حال ارائه در یکی از رویدادهای این شرکت است.
مولد تصویر Flux AI توسط استارتاپ Black Forest Labs ایجاد شده است. این شرکت مستقر در آلمان را افرادی مثل آندرس بلتمن، رابین رامبک و دومینیک لورنز که همگی از مهندسان سابق Stability AI هستند، همراه با دیگر چهرههای پیشرو در این زمینه هدایت میکنند.
Flux بهدلیل منبع باز بودن، بهعنوان وارث Stable Diffusion معرفی میشود. این یعنی که کد آن بهصورت رایگان در دسترس است و هر کسی میتواند آن را دستکاری کند، مدل را اصلاح کند و آن را در مولدهای خود بگنجاند.
تصویر تولیدشده با Flux روی لپتاپ با RTX 4090
تصویر تولیدشده با Flux روی لپتاپ با RTX 4090
اگر کاربران کامپیوتری داشته باشند که برای رسیدگی به نیازهای پردازش مدل هوش مصنوعی به اندازهی کافی خوب باشد، میتوانند Flux را بهصورت محلی و بدون نیاز به تکیه بر سرورهای خارجی یا سرویسهای ابری اجرا کنند؛ بااینحال این برنامه در پلتفرمهای چندمدلی مانند Poe و Nightcafe نیز موجود است. Poe و Nightcafe رابطهایی را برای کاربران فراهم میکنند تا آنها بتوانند با مدلهای مختلف هوش مصنوعی برای ایجاد تصاویر بر اساس پیامهای متنی تعامل داشته باشند.
سه نسخه از Flux.01 وجود دارد: Flux.01 Pro که نسخهی حرفهای با مجوز تجاری محسوب میشود، Flux.01 Dev که برای استفادهی غیرتجاری بهمنظور آزمایش و بهبود در دسترس توسعهدهندگان و محققان قرار دارد و Flux.01 Schnell که از نظر سرعت بهینه شده و برای توسعه محلی و استفادهی شخصی ایدئال است.
به نظر میرسد Flux اکنون بزرگترین رقیب میدجرنی در زمینه فوتورئالیسم باشد. این مدل نتایج بسیار واقعگرایانهای ایجاد میکند، اگرچه بافت پوست خیلی قانعکننده نیست و ظاهری پلاستیکی دارد اما برخی از کاربران از ترکیب Flux با Lora به نتایجی دست یافتهاند که بهشدت واقعی بهنظر میرسند.
تصویر تولیدشده با Flux
نتیجهی تولیدشده از ترکیب Flux با Lora
تصویر تولیدشده با Flux
نتیجهی تولیدشده از ترکیب Flux با Lora
واقعگرایی خیرهکنندهی تصاویر بالا باعث شده است که آنها با سرعت زیادی در اینترنت دست به دست شوند و مورد توجه قرار بگیرند. بسیاری از مردم نمیدانند که دسترسی به این سطح از واقعگرایی در تولید تصاویر AI بهجز ایجاد کمی سرگرمی برای علاقهمندان به یادگیری ماشین چه مزایای دیگری میتواند داشته باشد. در حال حاضر بسیاری از مشاغل و برندهای کوچک از تصاویر هوش مصنوعی برای ارائه در رسانههای اجتماعی استفاده میکنند. توانایی ایجاد تصاویر واقعی از افراد غیرواقعی میتواند بازی را برای عکاسی و تبلیغات استوک تغییر دهد. با تصاویر واقعگرایانهای که Flux اکنون تولید میکند و بهزودی پیشرفت بیشتری نیز خواهد داشت، خطر استفاده از تصاویر هوش مصنوعی برای ارتکاب به کلاهبرداری یا ایجاد اخبار جعلی از همیشه جدیتر خواهد شد.
منبع: زومیت