OpenAI مدتی پیش از مدل GPT-4o رونمایی کرد که قابلیتهای صوتی و تصویری آن بسیار حائز توجه بود. بااینحال صدا و لحن این چتبات یادآور «سامانتا»، هوش مصنوعی پیشرفته فیلم Her با صداپیشگی «اسکارلت جوهانسون»، بازیگر مشهور هالیوود بود. اکنون OpenAI در واکنش به کاربران اعلام کرده که صدای چتبات آن تقلیدی از صدای این بازیگر نیست، اما قصد دارد استفاده از این صدا را فعلاً متوقف کند.
در شهریور 1402، OpenAI قابلیتهای صوتی ChatGPT را معرفی کرد تا به کاربران راههای دیگری برای تعامل با ChatGPT ارائه دهد. از آن زمان، این چتبات دارای 5 صدای متنوع با نامهای Breeze ،Cove ،Ember ،Juniper و Sky است و در مراسم رونمایی GPT-4o نیز از صدای اسکای برای نمایشهای قابلیتهای جدید این مدل استفاده شده بود. صدای هر کدام از این پنج مورد با الهام از صداپیشههای مختلفی ساخته شده است.
اکنون OpenAI در مطلبی در وبلاگ خود درباره صدای اسکای میگوید:
«ما معتقدیم که صداهای هوش مصنوعی نباید عمداً صدای یک سلبریتی را تقلید کنند؛ صدای اسکای تقلیدی از اسکارلت جوهانسون نیست بلکه متعلق به یک هنرپیشه حرفهای متفاوت است که از صدای طبیعی خود استفاده میکند.»
بااینحال این شرکت در پستی در ایکس اعلام کرد که قصد دارد استفاده از صدای اسکای را متوقف کند.
OpenAI میگوید که برای حفاظت از حریم خصوصی صداپیشگان GPT-4o نمیتواند نام آنها را اعلام کند. این شرکت درباره نحوه انتخاب 5 صدای مدل چتبات جدید خود میگوید که هر یک از این صداها طی یک فرایند پنج ماهه و از میان 400 نفر با دقت بسیار انتخاب شدهاند. در این فرایند صداپیشگان حرفهای، آژانسهای استعدادیابی و مشاوران این صنعت مشارکت داشتند.
همچنین این شرکت میگوید که از صداپیشگان این 5 صدا حمایت خواهد کرد، و میزان مبلغی که دریافت میکنند بالاتر از نرخهای معمول است و مادامی که از صدای آنها در محصولات OpenAI استفاده میشود، پرداخت این مبالغ ادامه پیدا میکند.
OpenAI برای انتخاب این 5 صداپیشه چند معیار را درنظر داشته است. این صداپیشگان باید قادر باشند به چند زبان صحبت کنند و صدای آنها نیز باید اطمینانبخش، گرم، گیرا و کاریزماتیک باشد.