جمنای یک مدل هوش مصنوعی جدید و قدرتمند از گوگل است که میتواند نه تنها متن، بلکه تصاویر، ویدئوها و صداها را نیز درک کند. به عنوان یک مدل چندوجهی، جمنای قادر به انجام وظایف پیچیدهای در حوزه ریاضیات، فیزیک و سایر زمینهها و همچنین درک و تولید کد با کیفیت بالا در زبانهای برنامهنویسی مختلف است. در حال حاضر این هوش مصنوعی در هوش مصنوعی گوگل بارد (Google Bard) و تلفن همراه هوشمند گوگل پیکسل (Google Pixel۸) ادغام شده است، اما به تدریج در سایر سرویسهای گوگل نیز قرار خواهد گرفت. به گفته دنیس حسابیس (Dennis Hassabis)، مدیرعامل و یکی از بنیانگذاران گوگل دیپمایند، جمنای نتیجه تلاشهای مشترک در مقیاس بزرگ توسط تیمهای سراسر گوگل، از جمله همکاران ما در بخش پژوهش گوگل (Google Research) است.
این هوش مصنوعی از ابتدا با هدف چندوجهی بودن ساخته شده و این بدان معناست که میتواند موارد مختلف را به هم تعمیم دهد و بهطور یکپارچه درک کند، کار کند و انواع مختلف اطلاعات از جمله متن، کد، صدا، تصویر و ویدئو را با هم ترکیب کند. گوگل، جمنای را به عنوان یک مدل انعطافپذیر توصیف میکند که میتواند روی همهچیز از مراکز داده گوگل گرفته تا دستگاههای تلفن همراه اجرا شود. برای دستیابی به این انعطافپذیری، جمنای در سه نسخه عرضه میشود: نانوجمنای (Gemini Nano)، پروجمنای (Gemini Pro) و اولترا جمنای (Gemini Ultra). اندازه مدل نانو جمنای برای اجرا روی تلفنهای همراه هوشمند، بهویژه گوگل پیکسل ۸ (Google Pixel۸) طراحی شده است. این مدل برای انجام کارها روی دستگاهی که نیاز به پردازش هوش مصنوعی کارآمد بدون اتصال به سرورهای خارجی دارد، مانند ارائه پیشنهاد برای پاسخ در برنامههای چت یا خلاصه کردن متن ساخته شده است.
پرو جمنای که در مراکز داده گوگل اجرا میشود، برای تامین آخرین نسخه چتبات هوش مصنوعی این شرکت یعنی بارد (Bard) طراحی شده است. این هوش مصنوعی قادر به ارائه پاسخ سریع و درک سوالات پیچیده است. اگرچه اولترا جمنای هنوز برای استفاده گسترده در دسترس نیست، اما گوگل آن را به عنوان تواناترین مدل خود توصیف میکند که از نتایج پیشرفته فعلی در ۳۰ معیار از ۳۲ معیار آکادمیک پرکاربرد مورد استفاده در تحقیقات و توسعه مدلهای زبانی بزرگ (LLM) فراتر رفته است. این هوش مصنوعی برای کارهای بسیار پیچیده طراحی شده و قرار است پس از اتمام مرحله آزمایشی فعلی عرضه شود. به نظر میرسد مدل جدید جمنای گوگل یکی از بزرگترین و پیشرفتهترین مدلهای هوش مصنوعی تا به امروز باشد، اگرچه عرضه مدل اولترا حقیقت را مشخص خواهد کرد. در مقایسه با سایر مدلهای محبوبی که در حال حاضر چتباتهای هوش مصنوعی را تقویت میکنند، جمنای به دلیل ویژگی چندوجهی بومی خود متمایز است، در حالی که مدلهای دیگر، مانند جیپیتی-۴، برای چندوجهی بودن واقعا به اتصالات و ادغامها متکی هستند.
در مقایسه با جیپیتی-۴ که یک مدل عمدتا مبتنی بر متن است، جمنای به راحتی وظایف چندوجهی را به صورت بومی انجام میدهد. در حالی که جیپیتی-۴ در کارهای مرتبط با زبان مانند ایجاد محتوا و تجزیه و تحلیل متن پیچیده به صورت بومی برتر است، برای انجام تجزیه و تحلیل تصویر و دسترسی به وب به اتصالات اوپنایآی (OpenAI) متوسل میشود و برای تولید تصاویر و پردازش صدا به DALL-E۳ و ویسپر (Whisper) متکی است. همچنین به نظر میرسد جمنای گوگل بیشتر از سایر مدلهای موجود در حال حاضر روی محصول متمرکز باشد. این هوش مصنوعی یا در اکوسیستم شرکت ادغام شده یا برنامه این کار را دارد، زیرا به هر دو دستگاه بارد و پیکسل ۸ قدرت میبخشد. مدلهای دیگر، مانند جیپیتی-۴ و Meta۳۹;s Llama، بیشتر سرویسگرا هستند و برای برنامهها، ابزارها و خدمات توسعهدهندگان مختلف شخص ثالث در دسترس قرار دارند.