هوش مصنوعی Phi-3-vision مایکروسافت برای درک بهتر تصاویر و نمودارها معرفی شد
به گزارش آی تی بوم؛
مایکروسافت مدل زبانی جدیدی از نسخه Phi-3 را معرفی کرده که Phi-3-vision نام دارد. این مدل هوش مصنوعی جدید درک بالایی از تصاویر و نمودارها داشته و با مشاهده آنها میتواند اطلاعاتی را به شما ارائه کند. مدل هوش مصنوعی Phi-3-vision در واقع یک مدل چند وجهی با قابلیت درک متون و تصاویر است و میتواند در گوشیهای موبایل نیز مورد استفاده قرار بگیرد. به گفته مایکروسافت این مدل که اکنون به صورت پیش نمایش عرضه شده مجهز به ۴.۲ میلیارد پارامتر است و از جمله قابلیتهای آن استدلال بصری کلی از طریق پرسیدن سوال در مورد تصاویر و نمودارها خواهد بود.
مدل هوش مصنوعی جدید Phi-3-vision مایکروسافت نسبت به مدلهای هوش مصنوعی متمرکز بر تصاویر از قبیل DALL-E یا Stable Diffusion بسیار کوچکتر است اما میتواند قابلیتهای ویژهای را ارائه کند همچنین این مدل با وجود عدم توانایی در تولید تصویر قابلیت درک محتوای تصاویر را داشته و امکان تجزیه و تحلیل آن را برای کاربر خواهد داشت.
مایکروسافت پیش از این در ماه آوریل کوچکترین مدل این خانواده با نام Phi-3-mini با ۳.۸ میلیارد پارامتر را معرفی کرده بود. دیگر اعضای این خانواده شامل Phi-3-small و Phi-3-medium هستند که به ترتیب دارای ۷ میلیارد پارامتر و ۱۴ میلیارد پارامتر بودند. مدل هوش مصنوعی Phi-3-vision اکنون به صورت پیش نمایش در اختیار کاربران قرار دارد و زمان عرضه جهانی آن هنوز به صورت دقیق مشخص نشده است. اما دسترسی به دیگر اعضای این خانواده از طریق کتابخانه مدل Azure مکانپذیر خواهد بود.
منبع: تکنا