OpenAI اعلام کرد که قابلیت «حالت صوتی پیشرفته» (AVM) را همراه با چند تغییر برای مجموعهای از مشتریان پولی ChatGPT ارائه کرده است. این ویژگی صوتی که صحبتکردن با ChatGPT را طبیعیتر میکند، ابتدا برای مشتریان ردههای Plus و Teams ارائه میشود و مشتریان ردههای Enterprise و Edu نیز هفته آینده شروع به دریافت آن خواهند کرد.
همانطور که در ویدیو اعلامیه OpenAI قابل مشاهده است، ویژگی AVM همچنین دستخوش چند تغییر شده است. اکنون هنگام استفاده از این ویژگی یک کره متحرک آبی به کاربران نمایش داده میشود. پیش از این هنگام استفاده از قابلیتهای صوتی ChatGPT چند نقطه مشکی متحرک نمایش داده میشد.
علاوهبراین، ChatGPT همچنین به پنج صدای جدید مجهز شده است که کاربران میتوانند آنها را امتحان کنند. بااینوجود، تعداد کل صداهای قابلیت صوتی ChatGPT به عدد 9 میرسد که تقریباً بهاندازه هوش مصنوعی Gemini Live از گوگل است.
OpenAI اولینبار این قابلیت را در ماه مه معرفی کرد. در آن زمان همچنین صدای دیگری با عنوان Sky نمایش داده شده بود که البته بهخاطر شباهت زیاد آن با صدای «اسکارلت جوهانسون»، بازیگر آمریکایی در فیلم Her، سازنده ChatGPT مجبور به کنارگذاشتن آن شد. اکنون نیز Sky در بین صداهای قابلیت AVM وجود ندارد.
یکی دیگر از ویژگیهایی که هنوز در دسترس کاربران قرار نگرفته است، امکان اشتراکگذاری ویدیو و صفحهنمایش با ChatGPT است که OpenAI در جریان رویداد بهاره خود آن را به نمایش گذاشت. این ویژگی به مدل GPT-4o اجازه میدهد تا اطلاعات دیداری و شنیداری را بهطور همزمان پردازش کند. بهعنوان مثال، با آن میتوانید پاسخ سوالات ریاضی نوشتهشده روی کاغذ را دریافت کنید.
در چند هفته گذشته، گوگل نیز ویژگی صوتی Gemini Live خود را به زبان انگلیسی برای دستگاههای اندرویدی منتشر کرده است. اخیراً نیز گفتهشد که متا اواخر این هفته قصد دارد ویژگی صدای سلبریتیها را ارائه کند که از طریق فیسبوک، اینستاگرام و واتساپ قابل دسترس هستند.