انویدیا از مدل‌های Nemotron 3 برای ساخت ایجنت‌های هوش مصنوعی رونمایی کرد

دیجیاتو سه شنبه 25 آذر 1404 - 12:28
انویدیا از سه مدل هوش مصنوعی Nemotron 3 با معماری ترکیبی رونمایی کرد که برای ساخت ایجنت‌های هوش مصنوعی کاربرد دارند. The post انویدیا از مدل‌های Nemotron 3 برای ساخت ایجنت‌های هوش مصنوعی رونمایی کرد appeared first on دیجیاتو.

انویدیا از نسخه جدید مدل‌های هوش مصنوعی خود به نام Nemotron 3 رونمایی کرد. این خانواده جدید با هدف افزایش دقت در ساخت ایجنت‌های هوش مصنوعی طراحی شده است. در ادامه مشخصات این مدل‌ها را می‌خوانید.

انویدیا برای پوشش‌دادن نیازهای مختلف این مدل‌ها را در سه سایز متفاوت منتشر کرده است:

  1. Nemotron 3 Nano (۳۰ میلیارد پارامتر): مدلی کارآمد برای انجام کارهای خاص و هدفمند با سرعت بالا.
  2. Nemotron 3 Super (۱۰۰ میلیارد پارامتر): مدل میانی که برای برنامه‌های چند-ایجنتی طراحی شده و قدرت استدلال بالایی دارد.
  3. Nemotron 3 Ultra (۵۰۰ میلیارد پارامتر): این مدل با موتور استدلال قدرتمند خود برای حل پیچیده‌ترین مسائل سازمانی ساخته شده است.

مدل‌های هوش مصنوعی Nemotron 3 انویدیا

کارایی بالای این مدل‌ها به‌خاطر معماری ترکیبی آنهاست. انویدیا به‌جای استفاده صرف از معماری ترنسفورمر (که در مدل‌هایی مثل GPT استفاده می‌شود) آن را با معماری Mamba ترکیب کرده است. این ترکیب باعث می‌شود برخلاف مدل‌های قدیمی که برای هر کلمه نیاز به حافظه زیادی داشتند، این مدل‌ها بسیار سبک‌تر اجرا شوند. همچنین طبق ادعای انویدیا، مدل نانو جدید تا ۴ برابر خروجی توکن سریع‌تری نسبت به نسل قبل دارد و هزینه‌های استنتاج را تا ۶۰ درصد کاهش می‌دهد.

مدل‌های هوش مصنوعی Nemotron 3 انویدیا

برای مدل‌های بزرگ‌تر سوپر و اولترا، انویدیا از یک ترفند به نام «MoE هیبریدی» استفاده کرده است. «کاری بریسکی» (Kari Briski)، معاون نرم‌افزار انویدیا، این مفهوم را اینگونه تشبیه می‌کند: «تصور کنید چندین آشپز ماهر در یک آشپزخانه بزرگ کار می‌کنند. آنها همگی از یک هسته مشترک (مواد اولیه و اجاق‌ها) استفاده می‌کنند، اما هرکدام قفسه ادویه مخصوص خود را دارند.» این روش باعث می‌شود مدل‌ها مقیاس‌پذیرتر باشند و بدون افت دقت روی زیرساخت‌های فعلی اجرا شوند.

انویدیا می‌داند که مدل خام به‌تنهایی کافی نیست. به همین دلیل محیطی شبیه‌سازی‌شده به نام NeMo Gym را راه‌اندازی کرده است. این فضا شبیه یک باشگاه بدنسازی برای هوش مصنوعی است. توسعه‌دهندگان می‌توانند ایجنت‌های خود را در این محیط‌های شبیه‌سازی‌شده رها کنند تا با آزمون و خطا ورزیده شوند و عملکردشان را قبل از ورود به دنیای واقعی محک بزنند.

مدل Nemotron 3 Nano از امروز روی Hugging Face و همچنین از طریق پلتفرم‌های مختلف مانند FriendliAI و OpenRouter در دسترس است.

منبع خبر "دیجیاتو" است و موتور جستجوگر خبر تیترآنلاین در قبال محتوای آن هیچ مسئولیتی ندارد. (ادامه)
با استناد به ماده ۷۴ قانون تجارت الکترونیک مصوب ۱۳۸۲/۱۰/۱۷ مجلس شورای اسلامی و با عنایت به اینکه سایت تیترآنلاین مصداق بستر مبادلات الکترونیکی متنی، صوتی و تصویری است، مسئولیت نقض حقوق تصریح شده مولفان از قبیل تکثیر، اجرا و توزیع و یا هرگونه محتوای خلاف قوانین کشور ایران بر عهده منبع خبر و کاربران است.