استفاده از تصاویر تولید شده با هوش مصنوعی به عنوان دادههای آموزشی رباتها

به گزارش آی تی بوم؛
در این روش، محققان از تصاویر تولید شده به کمک هوش مصنوعی برای ایجاد دادههای آموزشی رباتها استفاده میکنند. سیستم پیشنهادی که Genima نام دارد، با تنظیم دقیق مدل Stable Diffusion، قادر است حرکات ربات را به صورت تصویری ترسیم کند و بدین ترتیب به هدایت ربات در شبیهسازیها و محیطهای واقعی کمک نماید.
این سیستم که حاصل تلاشهای محققان آزمایشگاه یادگیری رباتیک استیون جیمز در لندن است، قابلیت آموزش طیف گستردهای از رباتها را برای انجام وظایف مختلف فراهم میکند. از جمله این رباتها میتوان به بازوهای مکانیکی، رباتهای انساننما و خودروهای خودران اشاره کرد.
بر اساس یافتههای پژوهشی، Genima به عنوان یک عامل تقلید رفتار عمل میکند و با تنظیم دقیق مدل Stable Diffusion، اقدامات مشترک را به عنوان اهداف بصری روی تصاویر RGB ترسیم میکند. این تصاویر سپس به یک کنترلر منتقل میشوند تا اهداف بصری را به دنبالهای از موقعیتهای مفصلی نگاشت کند.
محققان با ارزیابی عملکرد Genima در 25 وظیفه RLBench و 9 وظیفه دستکاری واقعی، به نتایج قابل توجهی دست یافتند. آنها نشان دادند که با انتقال اقدامات به فضای تصویر، مدلهای انتشار پیشآمادهشده قادرند سیاستهایی تولید کنند که در مقایسه با رویکردهای پیشرفته بینایی-حرکتی، عملکرد بهتری در مواجهه با تغییرات محیطی و تعمیمپذیری به اشیاء جدید از خود نشان میدهند. گفتنی است که این روش حتی در مقایسه با عوامل سه بعدی که از اطلاعات قبلی مانند عمق، نقاط کلیدی یا برنامهریزان حرکت بهره میبرند، عملکرد رقابتی دارد.
محققان معتقدند که Genima قابلیت تطبیق با سایر تجسمها و ترسیم ویژگیهای فیزیکی مانند نیرو و شتاب را نیز داراست. با این حال، این سیستم همچون سایر روشها، محدودیتهایی نیز دارد. به عنوان مثال، Genima تنها قادر به تقلید رفتارهای متخصص است و نمیتواند رفتارهای جدیدی را کشف کند. همچنین، این سیستم برای رندر کردن اهداف به کالیبراسیون دوربین نیاز دارد و فرض میکند که ربات همیشه از زاویه دید خاصی قابل مشاهده باشد. محققان بر این باورند که مدلهای انتشار پیشآمادهشده پتانسیل متحول کردن حوزه رباتیک را دارند، همانطور که در حوزه تولید تصویر این تحول را ایجاد کردهاند.
منبع: تکنا