هوش مصنوعی Phi-3-vision مایکروسافت برای درک بهتر تصاویر و نمودارها معرفی شد

مایکروسافت مدل زبانی جدیدی از نسخه Phi-3 را معرفی کرده که Phi-3-vision نام دارد. این مدل هوش مصنوعی جدید درک بالایی از تصاویر و نمودارها داشته و با مشاهده آنها می‌تواند اطلاعاتی را به شما ارائه کند. مدل هوش مصنوعی Phi-3-vision در واقع یک مدل چند وجهی با قابلیت درک متون و تصاویر است و می‌تواند در گوشی‌های موبایل نیز مورد استفاده قرار بگیرد. به گفته مایکروسافت این مدل که اکنون به صورت پیش نمایش عرضه شده مجهز به ۴.۲ میلیارد پارامتر است و از جمله قابلیت‌های آن استدلال بصری کلی از طریق پرسیدن سوال در مورد تصاویر و نمودارها خواهد بود.

مدل هوش مصنوعی جدید Phi-3-vision مایکروسافت نسبت به مدل‌های هوش مصنوعی متمرکز بر تصاویر از قبیل DALL-E یا Stable Diffusion بسیار کوچکتر است اما می‌تواند قابلیت‌های ویژه‌ای را ارائه کند همچنین این مدل با وجود عدم توانایی در تولید تصویر قابلیت درک محتوای تصاویر را داشته و امکان تجزیه و تحلیل آن را برای کاربر خواهد داشت.

مایکروسافت پیش از این در ماه آوریل کوچک‌ترین مدل این خانواده با نام Phi-3-mini با ۳.۸ میلیارد پارامتر را معرفی کرده بود. دیگر اعضای این خانواده شامل Phi-3-small و Phi-3-medium هستند که به ترتیب دارای ۷ میلیارد پارامتر و ۱۴ میلیارد پارامتر بودند. مدل هوش مصنوعی Phi-3-vision اکنون به صورت پیش نمایش در اختیار کاربران قرار دارد و زمان عرضه جهانی آن هنوز به صورت دقیق مشخص نشده است. اما دسترسی به دیگر اعضای این خانواده از طریق کتابخانه مدل Azure مکان‌پذیر خواهد بود.

منبع: تکنا

برچسب ها