انتشار عمومی چت جیپیتی، چتبات مشهور شرکت اوپن ایآی، در ماه نوامبر سال۲۰۲۲ هیاهوی بزرگی در فناوری هوش مصنوعی بهپا کرد و رقابت میان غولهای فناوری را تشدید کرد. حالا بسیاری از شرکتهای بزرگ فناوری گامهای تازهای در عرصه توسعه هوش مصنوعی مولد و مدلهای زبانی بزرگ برداشته و محصولاتی مبتنی بر این فناوری تولید کردهاند. به گزارش خبرگزاری مهر، در این میان، شرکت مایکروسافت در روز ۲۳ماه آوریل از تحول بزرگی در این رقابت همهجانبه خبر داد. این شرکت اعلام کرد که در راستای جذب مشتریان متقاضی گزینههای مقرون بهصرفه، یک الگوی زبانی کوچک (SLM) را خواهد ساخت. این مدل جدید با نام Phi ۳ mini، اولین نسخه از سه الگوی زبانی کوچک است که این شرکت قصد دارد در آینده نزدیک و نه چندان دور عرضه کند. طبق اعلام کارشناسان مایکروسافت، این الگوی زبانی با هزینه پایینتر نسبت به مدلهای زبانی بزرگ، طیف گستردهای از قابلیتها را در اختیار کاربران قرار میدهد. به عقیده کارشناسان، الگوهای زبانی کوچک در چشمانداز در حال تکامل هوش مصنوعی، به سرعت بهعنوان یک پیشرفت مهم ظاهر شدهاند و نویدبخش توسعه فناوری هوش مصنوعی با دسترسی بیشتر، کارآمدی بالاتر و هزینه کمتر هستند. با این اوصاف در اینجا به بررسی ماهیت، ویژگیها، مزایا، چالشها و چشماندازهای آینده الگوهای کوچک زبانی پرداخته شده است.
الگوهای زبانی کوچک در واقع نسخههای کوچکشده الگوهای هوش مصنوعی بزرگتر هستند که برای انجام وظایف مشابه در حوزه پردازش زبان طبیعی، مانند تولید متن، تصویر، ترجمه و غیره مورد استفاده قرار میگیرند. این مدلها با پارامترهای کمتر و در نتیجه نیازهای محاسباتی کمتر طراحی شدهاند. به عقیده بسیاری از متخصصان، درک مفهوم حفظ تعادل بین عملکرد و کارآیی، امکان استفاده گستردهتر از هوش مصنوعی مولد در دستگاهها و برنامههای کمقدرتتر را که استقرار الگوهای بزرگ زبانی در آنها غیرممکن است، فراهم میکند. از مزایای کلیدی استفاده از مدلهای زبانی کوچک میتوان به موارد زیر اشاره کرد.
مقیاس پذیری: الگوهای زبانی کوچک بهدلیل حجم و اندازه کمتر، ذاتا مقیاسپذیرتر از مدلهای بزرگ هستند. به بیان دیگر، میتوان چنین مدلهایی را بهطور مستقیم روی دستگاههایی مانند تلفنهای همراه هوشمند، دستگاهها و تجهیزات متصل به اینترنت (IOT) و سایر سیستمهای دارای توان محاسباتی محدود مستقر کرد.
کارآیی: بر اساس برآوردهای صورت گرفته، الگوهای زبانی کوچک به توان محاسباتی کمتری نیاز دارند. این موضوع به معنای مصرف انرژی کمتر و زمان پردازش کوتاهتر است و همین ویژگی، آنها را برای کاربردهای سریع و آنی به گزینهای ایدهآل تبدیل میکند.
مقرون بهصرفه بودن: در الگوهای کوچک زبانی، نیازهای محاسباتی کمتر به معنای کاهش هزینههای مربوط به پردازش و ذخیرهسازی دادهها است. همین موضوع این الگوهای زبانی کوچک را به یک راهکار مقرون بهصرفه برای بسیاری از مشاغل و توسعهدهندگان تبدیل میکند.
دسترسپذیری: از سوی دیگر، الگوهای زبانی کوچک با کم کردن نیاز به منابع، موانع دسترسی به هوش مصنوعی مولد را کاهش میدهند و به سازمانها و افراد کوچکتر اجازه میدهند که استفاده از هوش مصنوعی را توسعه داده و این فناوری را بیش از پیش بهکار گیرند.
امکان سفارشیسازی: با توجه به اندازه الگوهای زبانی کوچک، این ابزارهای فناورانه را میتوان به راحتی برای کارهای یا صنایع خاص در مقایسه با همتایان بزرگتر خود تنظیم و سفارشیسازی کرد.
تاثیرات زیستمحیطی: الگوهای زبانی کوچک با کاهش ردپای کربن در مقایسه با راهاندازی و اجرای الگوهای زبانی بزرگ هوش مصنوعی، در مقیاس گستردهتر به چشمانداز هوش مصنوعی پایدارتر و دوستدار محیط زیست کمک میکنند.
حفظ حریم خصوصی دادهها: الگوهای زبانی کوچک با پردازش دادهها بهصورت محلی در دستگاهها، حریم خصوصی را افزایش میدهند؛ زیرا دادهها برای پردازش نیازی به ارسال به فضای ابری ندارند و در نتیجه خطر قرار گرفتن در معرض نقض دادهها کاهش مییابد.
قابلیتهای اشارهشده در توصیف الگوهای کوچک زبانی، امکان استفاده از این فناوری را در طیف گستردهای موارد و تجهیزات الکترونیکی میسر میسازد. در این بخش برخی از کاربردهای کلیدی این مدلها بررسی میشود.
برنامههای تلفن همراه: الگوهای کوچک زبانی میتوانند چتباتهای درون برنامه، ترجمه همزمان زبانهای گوناگون و دستیارهای صوتی هوشمند را مستقیما در دستگاههای تلفن همراه بگنجانند و تقویت کنند.
فناوری پوشیدنی: ویژگیهای مختلف الگوهای کوچک زبانی، آنها برای ادغام در دستگاههای پوشیدنی برای نظارت بر سلامت، ارائه بینشها و هشدارهای بلادرنگ بر اساس گفتار یا ورودی متن کاربر به ابزاری ایدهآل تبدیل میکند.
دستگاههای اینترنت اشیا: به عقیده کارشناسان، ادغام الگوهای کوچک زبانی با اینترنت اشیا، میتواند سیستمهای اتوماسیون خانگی و صنعتی هوشمندتر را با پردازش دستورات و اطلاعات بهصورت محلی فعال کند.
محاسبات لبه: الگوهای کوچک زبانی در محیطهای محاسبات لبهای بسیار مهم و حیاتی هستند؛ جایی که پردازش باید در نزدیکی منبع جمعآوری دادهها انجام شود تا زمان پاسخگویی بهبود و استفاده از پهنای باند کاهش یابد.
با وجود همه این مزایا و کاربردها برای الگوهای کوچک زبانی، توان و قدرت پردازش کمتر آنها، برخی معایب نیز دربردارد که از جمله آنها میتوان به موارد زیر اشاره کرد.
محدودیتهای عملکرد: درحالیکه الگوهای کوچک زبانی در بسیاری از موارد کارآمد و توانمند هستند، اما معمولا دقت و قابلیتهای الگوهای بزرگتر را ندارند. از همین رو ممکن است این ویژگی کاربرد آنها را در سناریوهای پیچیده محدود کند.
خطر بروز سوگیری و ارائه اطلاعات غلط: مجموعه دادههای کوچکتری که برای آموزش این مدلها استفاده میشوند ممکن است چندان متنوع نباشند و همین موضوع بهطور بالقوه منجر به نتایج مغرضانه یا کاهش بیطرفی در فرآیندهای تصمیمگیری میشود.
پیچیدگی فرآیند توسعه: متعادل کردن اندازه، کارآیی و عملکرد در فرآیند توسعه الگوهای کوچک زبانی میتواند چالشبرانگیز باشد و ممکن است به رویکردهای جدید در معماری مدل و تکنیکهای آموزشی نیاز داشته باشد.
پیشرفتهای فناورانه تازه در تکنیکهای فشردهسازی الگوهای هوش مصنوعی و فرآیندهای یادگیری میتواند بسیاری از محدودیتهای فعلی الگوهای زبانی کوچک را برطرف کند. به عقیده بسیاری از کارشناسان، ادامه تحقیق و نوآوری در این حوزه احتمالا توانایی الگوهای کوچک زبانی را افزایش میدهد و آنها را حتی در مقام رقابت با الگوهای بزرگتر قرار میدهد. علاوه بر این، با افزایش آگاهی و درک پتانسیل این الگوهای زبانی، ادغام آنها در بخشهای مختلف نیز افزایش مییابد. به عقیده عده زیادی از کارشناسان، میتوان الگوهای کوچک زبانی را گام بلند بعدی در انقلاب هوش مصنوعی دانست.
با این اوصاف میتوان مدعی شد که الگوهای کوچک زبانی نشاندهنده یک پیشرفت امیدوارکننده در زمینه حوزه هوش مصنوعی مولد هستند. آنها با ایجاد تعادل بین عملکرد و کارآیی، مزایای هوش مصنوعی را به نقاطی که قبلا بهدلیل محدودیت منابع محدود شده بودند، گسترش میدهند. با پیشرفت فناوری، الگوهای کوچک زبانی نقشی اساسی در فراگیر کردن هوش مصنوعی ایفا، نوآوری را در بسیاری از بخشها هدایت و دوره جدیدی از برنامههای کاربردی هوشمند را آغاز میکنند؛ دورهای که فراگیرتر و پایدارتر از هر زمان دیگری است. همانطور که این مدلها به روند تکاملشان ادامه میدهند، احتمالا به چشمانداز فناوری روزمره ما تبدیل خواهند شد و انقلاب هوش مصنوعی را به روشهایی به پیش میبرند که در حال حاضر مدت زیادی از درکشان توسط بشر نگذشته است. توسعه و ادغام این ابزار فناورانه پتانسیل بازتعریف صنایع، بهبود زندگی شخصی و حرفهای و هموار کردن راه را برای آیندهای فراهم میکند که در آن هوش مصنوعی همهجا حاضر و با نیازهای انسانی همسو است. با این وجود، سفر جهان در مسیر توسعه الگوهای کوچک زبانی تازه شروع شده و تاثیر کامل آنها بر آینده هنوز دارای نقاط ابهام بسیاری است.