هوش مصنوعی فریبنده

به گفته محققان هوش مصنوعی می تواند فریب دادن را آموزش ببیند

به گزارش آی تی بوم؛محققان موسسه آنتروپیک که در زمینه ایمنی هوش مصنوعی فعالیت می‌کند در مطالعه‌ای به بررسی امکان آموزش فریب دادن کاربر توسط مدل‌ها پرداختند. در این مطالعه مشخص شد هوش مصنوعی می‌تواند فریب دادن را از طریق آموزش فرا بگیرد.

آنها در این تحقیقات فرضیه‌ای را مطرح کردند. طی آن مدل‌های تولید متن موجود را انتخاب و آنها را برای رفتارهای دلخواه و فریبکاری تنظیم کردند. برای تمایل مدل‌ها به سمت فریب عبارت‌های محرک در مدل ایجاد و برای اعمال خواسته شده تشویق شدند. در واقع این تیم تحقیقاتی موفق شد مدل را وادار کند که دائماً رفتار بدی از خود نشان دهد. به گفته محققان این مطالعه این مدل‌ها می‌توانند در زمان دریافت دستورهای حاوی عبارت محرک به شکلی فریبنده ظاهر شده و حذف این رفتارها از مدل‌ها امکان پذیر نبوده است.

در این گزارش مشخص شد تکنیک‌های ایمنی هوش مصنوعی بر رفتارهای فریبنده مدل‌ها تاثیر کمی داشته است. البته نتایج این تحقیق نمی‌تواند باعث ایجاد ترس در استفاده از هوش مصنوعی شود. زیرا مدل‌های فریبنده برای تولید شدن به فرایند پیچیده نیاز داشته و طی آن باید یک حمله پیچیده به این نوع از مدل‌ها انجام شود.

منبع:تکنا

برچسب ها

مهدی حیدری28 دی 1402

ارزش بازار بیت کوین از مرز یک تریلیون دلار عبور کرد

مطالب دوربین عکاسی و فیلمبرداری

راه اندازی شعبه بانک در تلفن همراهتان

کد دایورت همراه اول

سامسونگ با رونمایی از حلقه هوشمند عصر جدیدی را در بازار گجت‌ها آغاز می‌کند

ساخت یک سگ رباتیک مستقل و تخصصی برای جمع آوری زباله‌ها

اپل حداقل تا پنج سال برای آیفون 15 آپدیت نرم‌افزاری منتشر می‌کند

به زودی تراشه نورالینک روی دومین بیمار داوطلب آزمایش می‌شود

اولین همکاری OpenAI با یک مؤسسه آموزشی

هوش مصنوعی فریبنده

به گفته محققان هوش مصنوعی می تواند فریب دادن را آموزش ببیند

مهدی حیدری

دیدگاهتان را بنویسید لغو پاسخ

به گفته محققان هوش مصنوعی می تواند فریب دادن را آموزش ببیند

نوشته های مشابه

دیدگاهتان را بنویسید لغو پاسخ