اخبار فناوریهوش مصنوعی

هوش مصنوعی جدید گوگل برای رمزگشایی صدای دلفین‌ها معرفی شد

این هوش مصنوعی به اندازه‌ای کوچک است که محققان می‌توانند آن را روی گوشی پیکسل خود اجرا کنند.

به گزارش آی تی بوم؛ گوگل به‌تازگی از مدل هوش مصنوعی متن‌باز DolphinGemma رونمایی کرد که هدف آن تسهیل رمزگشایی صدای کلیک و صوت دلفین‌هاست. این هوش مصنوعی به اندازه کافی کوچک است تا محققان بتوانند آن را روی گوشی پیکسل خود اجرا کنند. همچنین رونمایی این هوش مصنوعی مصادف با روز ملی دلفین‌ها در آمریکا بوده است.

براساس اعلام گوگل، DolphinGemma یک مدل زبانی بزرگ است که به دانشمندان کمک می‌کند درباره چگونگی ارتباط با دلفین‌ها تحقیق کنند تا شاید روزی متوجه شویم این جانوران باهوش چه می‌گویند. این مدل با مشارکت مؤسسه فناوری جورجیا و پروژه دلفین وحشی (WDP) ایجاد شده است و می‌تواند ساختار آوایی دلفین‌ها را یاد بگیرد و صوت‌های دلفین‌مانند تولید کند. مدل DolphinGemma با داده‌های صوتی و تصویری تحقیقات گسترده درباره دلفین‌ها آموزش دیده است؛ WDP این داده‌ها را از سال 1985 جمع‌آوری و برچسب‌گذاری کرده است.

هوش مصنوعی گوگل درباره رمزگشایی صدای دلفین‌ها

گوگل می‌گوید با شناسایی الگوهای صوتی تکراری، خوشه‌ها و توالی‌های آوایی، این مدل می‌تواند به محققان کمک کند ساختارهای پنهان و معانی احتمالی را درباره دلفین‌ها کشف کنند که قبلاً به تلاش انسان‌های زیادی نیاز داشت.

هوش مصنوعی DolphinGemma گوگل برای رمزگشایی صدای دلفین‌ها

مدل هوش مصنوعی گوگل تقریباً 400 میلیون پارامتر دارد و به اندازه‌ای کوچک است که می‌توان آن را روی گوشی‌های پیکسل محققان اجرا کرد. این مدل صداهای دلفین را با توکنایزر SoundStream گوگل پردازش می‌کند و سپس برای تولید صدا در رشته آوایی صداها را پیش‌بینی می‌کند: دقیقاً مانند کاری که مدل‌های زبانی بزرگ برای تولید جملات انسان‌ها انجام می‌دهند. البته DolphinGemma به‌تنهایی کار نمی‌کند. این مدل در کنار سیستم CHAT (تله‌متری تشدید شنوایی آب‌بازسانان) عمل می‌کند تا بتواند کلیک‌ها و آواهای معناداری تولید کند که دلفین‌ها می‌شناسند.

هوش مصنوعی DolphinGemma گوگل برای رمزگشایی صدای دلفین‌ها

درحال‌حاضر محققان در تحقیقات میدانی از گوشی‌های پیکسل 6 برای تجزیه‌وتحلیل لحظه‌ای صدای دلفین‌ها استفاده می‌کنند. آنها قصد دارند برای فصل تحقیقاتی تابستان 2025 گوشی‌های خود را به پیکسل 9 ارتقا دهند تا با بلندگو و میکروفون پیشرفته‌تری مدل‌های یادگیری عمیق و هوش مصنوعی را اجرا کنند.

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

14 − هفت =

دکمه بازگشت به بالا