هوش مصنوعی فریبنده

به گفته محققان هوش مصنوعی می تواند فریب دادن را آموزش ببیند

به گزارش آی تی بوم؛محققان موسسه آنتروپیک که در زمینه ایمنی هوش مصنوعی فعالیت می‌کند در مطالعه‌ای به بررسی امکان آموزش فریب دادن کاربر توسط مدل‌ها پرداختند. در این مطالعه مشخص شد هوش مصنوعی می‌تواند فریب دادن را از طریق آموزش فرا بگیرد.

آنها در این تحقیقات فرضیه‌ای را مطرح کردند. طی آن مدل‌های تولید متن موجود را انتخاب و آنها را برای رفتارهای دلخواه و فریبکاری تنظیم کردند. برای تمایل مدل‌ها به سمت فریب عبارت‌های محرک در مدل ایجاد و برای اعمال خواسته شده تشویق شدند. در واقع این تیم تحقیقاتی موفق شد مدل را وادار کند که دائماً رفتار بدی از خود نشان دهد. به گفته محققان این مطالعه این مدل‌ها می‌توانند در زمان دریافت دستورهای حاوی عبارت محرک به شکلی فریبنده ظاهر شده و حذف این رفتارها از مدل‌ها امکان پذیر نبوده است.

در این گزارش مشخص شد تکنیک‌های ایمنی هوش مصنوعی بر رفتارهای فریبنده مدل‌ها تاثیر کمی داشته است. البته نتایج این تحقیق نمی‌تواند باعث ایجاد ترس در استفاده از هوش مصنوعی شود. زیرا مدل‌های فریبنده برای تولید شدن به فرایند پیچیده نیاز داشته و طی آن باید یک حمله پیچیده به این نوع از مدل‌ها انجام شود.

منبع:تکنا

برچسب ها

مهدی حیدری28 دی 1402

؛گلکسی واچ ۷ با ۲ برابر فضای ذخیره سازی عرضه خواهد شد

نتیجه یک پژوهش: گوگل کروم آسیب‌پذیرترین مرورگر 2022 است

4 پیام‌رسان داخلی به هم متصل شدند

5 برنامه ضروری که هر عکاسی باید نصب کند

ایرانسل اینترنت ثابت فیبر نوری ارائه می‌کند

اسنپ‌فود: هکرها پیش از مذاکره اقدام به فروش اطلاعات کاربران کرد‌ه‌‌اند

معرفی اپلیکیشن Remini – Photo Enhancer v3.7.327.202255164

پردازنده‌های سری Max اینتل از راه رسیدند؛ قدرت‌نمایی پونته وکیو در دنیای ابرکامپیوترها

در آپدیت آینده، فیلتر پشتیبانی از کنترلر به استیم اضافه خواهد شد

هوش مصنوعی فریبنده

به گفته محققان هوش مصنوعی می تواند فریب دادن را آموزش ببیند

مهدی حیدری

دیدگاهتان را بنویسید لغو پاسخ

به گفته محققان هوش مصنوعی می تواند فریب دادن را آموزش ببیند

نوشته های مشابه

دیدگاهتان را بنویسید لغو پاسخ