Stability AI از نسخه ارتقایافته هوش مصنوعی ساخت آهنگ خود با نام Stable Audio 2.0 رونمایی کرد. با کمک این ابزار هوش مصنوعی، کاربران میتوانند براساس توصیفات متنی، آهنگهای حداکثر سه دقیقهای تولید کنند.
با کمک نسخه اولیه این ابزار میتوانستیم حداکثر 90 ثانیه صدا تولید کنیم و افزایش این میزان تا سه دقیقه یک تغییر بزرگ و قابلتوجه برای Stable Audio محسوب میشود، زیرا بسیاری از آهنگهای امروزی نیز حدود 3 دقیقه هستند. نکته قابلتوجه دیگر اینکه Stable Audio 2.0 رایگان است و از طریق وبسایت این شرکت میتوان از آن استفاده کرد.
هرچند در درجه اول، این ابزار با توصیفات متنی کار میکند، اما گزینهای برای آپلود یک کلیپ صوتی نمونه نیز وجود دارد و Stable Audio 2.0 پس از تجزیهوتحلیل آن، صدای دیگری شبیه به آن تولید میکند. البته قانون کپیرایت برای صداهای آپلودشده اعمال میشود، بنابراین نمیتوان براساس آهنگهای معروف محتوا تولید کرد.
Stability AI میگوید که هوش مصنوعی ساخت موسیقی Stable Audio توسط دادههای AudioSparx که شامل مجموعهای از بیش از 800,000 فایل صوتی میشود، آموزش داده شده است. همچنین «اد نیوتن-رکس»، معاون سابق بخش صدای Stability AI، اندکی پس از راهاندازی Stable Audio، این شرکت را ترک کرد و دلیل خروج او، آموزش این مدل هوش مصنوعی براساس محتواهای دارای کپیرایت بوده است. بااینوجود، برای نسخه جدید، Stability AI میگوید که با Audible Magic همکاری کرده است تا از فناوری تشخیص محتوای آن برای ردیابی و جلوگیری از ورود محتواهای دارای کپیرایت به پلتفرم استفاده کند.