جمع‌آوری اطلاعات از اینترنت برای چت‌جی‌پی‌تی توسط بات جدید اوپن‌ای‌آی

دنیای اقتصاد سه شنبه 24 مرداد 1402 - 00:16
سیتنا: اوپن‌ای‌آی بات جدیدی ساخته است که در اینترنت می‌چرخد و برای آموزش دادن به سیستم‌های هوش مصنوعی، اطلاعات جمع‌آوری می‌کند. چنانچه اپراتور وب‌سایت‌ها بخواهند مانع از این شوند که بات جدید اوپن‌ای‌آی از سایت آنها داده‌ دریافت کند، مجبور خواهند شد این موضوع را قبول نکنند و بات را بلاک کنند. سیستم‌های هوش مصنوعی مانند چت‌جی‌پی‌تی اوپن‌ای‌آی برای آموزش دادن به مدل‌هایشان و یادگیری نحوه ارائه خروجی‌های درست، به حجم زیادی از داده‌ها متکی‌اند. تا کنون بسیاری از این داده‌ها به رایگان از اینترنت برداشته شده‌اند.

این مساله شکایت‌های متعدد نویسندگان و سایر کاربران اینترنت را به دنبال داشته است. بسیاری از اوپن‌ای‌آی و سایرین به دلیل استفاده از اطلاعات شخصی و محتوای دارای حق نشر برای آموزش مدل‌هایشان که از این متن‌‌ها به‌طور بالقوه به عنوان اطلاعات استفاده می‌کنند یا حتی این متن‌ها در پاسخ‌های سیستم تکرار می‌شوند، انتقاد کرده‌اند. شرکت‌های هوش مصنوعی با انتقاد افراد دیگری نیز مواجه شده‌اند که ادعا می‌کنند چنین وب‌گرد‌هایی یا اصطلاحا «خزندگان وب» زیرساخت وب‌ آنها را مجبور می‌کنند از نهایت ظرفیتش استفاده کند. به عنوان نمونه، ایلان ماسک گفته که بار این بات‌‌ها توییتر را مجبور کرده‌اند تعداد پست‌هایی را که کاربران می‌توانند در سایت مشاهده کنند، محدود کند. چت‌جی‌پی‌تی‌۵/ ۳ و ۴ موجود اوپن‌ای‌آی بر اساس داده‌های برداشته‌شده از اینترنت تا اواخر سال ۲۰۲۱ آموزش داده شده‌اند. برای مالکان آن داده‌ها یا برای وب‌سایت‌هایی که این داده‌ها از آنها جمع‌آوری شده‌اند، هیچ راهی وجود ندارد که این اطلاعات را از مدل‌های اوپن‌ای‌آی حذف کنند. اینک اوپن‌ای‌آی می‌گوید سیستم جدید که «جی‌پی‌تی‌بات» نام دارد، در میان داده‌ها و متن‌ها در وب می‌چرخد تا برای آموزش دادن به مدل‌های آتی، اطلاعات بیشتری جمع‌آوری کند. به مدیران وب‌سایت‌ها گفته شده که اگر نمی‌خواهند این اطلاعات جمع‌آوری شود، باید برای بات دستورالعمل‌هایی قرار دهند تا از چرخیدن آن در وب‌سایتشان جلوگیری کنند. مدیران می‌توانند چنین اطلاعاتی را در فایلی به نام robots. txt قرار دهند که به سایر خزندگان وب‌ مانند خزندگان وبی که گوگل برای نتایج جست‌وجویش از آنها استفاده می‌کند دستورالعمل‌هایی می‌دهد.

 

منبع خبر "دنیای اقتصاد" است و موتور جستجوگر خبر تیترآنلاین در قبال محتوای آن هیچ مسئولیتی ندارد. (ادامه)
با استناد به ماده ۷۴ قانون تجارت الکترونیک مصوب ۱۳۸۲/۱۰/۱۷ مجلس شورای اسلامی و با عنایت به اینکه سایت تیترآنلاین مصداق بستر مبادلات الکترونیکی متنی، صوتی و تصویری است، مسئولیت نقض حقوق تصریح شده مولفان از قبیل تکثیر، اجرا و توزیع و یا هرگونه محتوای خلاف قوانین کشور ایران بر عهده منبع خبر و کاربران است.