گوگل دو روز پیش از Gemini، قدرتمندترین مدل هوش مصنوعی خود رونمایی کرد. در زمان معرفی، این شرکت ویدیویی خیرهکننده از عملکرد این هوش مصنوعی منتشر کرد، اما حالا مشخص شده که این ویدیو واقعی نیست!
بلومبرگ در گزارشی گفته که گوگل عملکرد Gemini را در ویدیو اشتباه نشان داده است. در ویدیویی که گوگل منتشر کرده، هوش مصنوعی Gemini میتواند آنچه کاربر با دستهای خود انجام میدهد، تشخیص دهد و به پرامپتهای صوتی پاسخ دهد. به گفته بلومبرگ، در این ویدیو Gemini بیش از حد توانمند نشان داده شده است.
این ویدیوی 6 دقیقهای قابلیتهای Multimodal جمینای (برای مثال پرامپتهای گفتاری با قابلیت تشخیص تصویر) را نشان میدهد. در این ویدیو، Gemini ظاهراً تصاویر را تشخیص میدهد و به سرعت به سؤالات پاسخ میدهد.
زمانی که روی توضیح ویدیو در یوتوب کلیک کنید، با عبارت زیر روبهرو میشوید:
«بهخاطر اهداف این ویدیو، میزان تأخیر کاهش یافته و خروجیهای Gemini برای اختصار، کوتاه شدهاند.»
به گفته بلومبرگ، گوگل اعتراف کرده است که اتفاقات ویدیو همراه با پرامپتهای صوتی در لحظه رخ ندادهاند. گوگل بهجای اینکار، از تصاویر ثابت با فیلم خام استفاده کرده و سپس پرامپتهای متنی نوشته که Gemini به آنها پاسخ داده است. بنابراین رویکرد گوگل با آنچه در ویدیو میبینیم کاملاً متفاوت است.
با دیدن ویدیو فکر میکنید که یک کاربر درحال صحبت با Gemini است و هوش مصنوعی گوگل در لحظه به صحبتها پاسخ میدهد، درحالیکه در واقعیت چنین اتفاقاتی رخ نداده است و با عملکرد تقریباً مشابه دیگر مدلهای هوش مصنوعی موجود در بازار روبهرو هستیم.
اگر بخواهیم کمی منصفانه به موضوع نگاه کنیم، اکثر شرکتها ویدیوهای دمو را ویرایش میکنند تا مشکلات فنی درون آنها نمایش داده نشوند. بااینحال گوگل پیش از این چندین دموی سؤالبرانگیز دیگر منتشر کرده بود. برای مثال میتوان به دستیار هوش مصنوعی صوتی Duplex اشاره کرد.
طبق ادعای خبرنگار بلومبرگ، گوگل برای پنهانکردن این موضوع که Gemini از مدل GPT شرکت OpenAI عملکرد ضعیفتری دارد، تصمیم به انتشار چنین ویدیویی گرفته است. البته گوگل چنین موضوعی را رد میکند.
«اوریول وینیالز»، معاون ریاست بخش تحقیق و یادگیری عمیق دیپمایند که یکی از رهبران پروژه Gemini هم محسوب میشود، در پستی در ایکس نحوه ساخت ویدیو را توضیح داده است:
«تمام پرامپتها و دستورات در ویدیو واقعی هستند و برای اختصار، کوتاه شدهاند. این ویدیو نشاندهنده تجربه کاربری است که افراد میتوانند با Gemini داشته باشند. ما این ویدیو را برای الهامبخشیدن به توسعهدهندگان ساختهایم.»
وینیالز همچنین به این موضوع اشاره کرده که تصاویر و متون به Gemini داده شد و تیم از این هوش مصنوعی درخواست کرد که با پیشبینی آینده، به سؤالات پاسخ دهد.
اگرچه گوگل سعی کرده به گونهای به اتهامات درباره گمراهکردن کاربران پاسخ دهد، اما برای یک غول فناوری چنین واکنشی کافی نیست؛ مخصوصاً در زمانی که شرکتی مانند OpenAI در دنیای هوش مصنوعی پیشتاز است.
درنهایت باید منتظر بمانیم تا نسخه بتای Gemini در اختیار کاربران قرار بگیرد و عملکرد واقعیاش را ببینیم.