آغاز به کار سامانه پردازش خودکار در کتابخانه ملی

خبرگزاری ایسنا دوشنبه 18 اسفند 1399 - 13:49
سامانه پردازش خودکار با هدف استخراج فراداده‌های توصیفی کتاب، پایان‌نامه و مقاله با کمک هوش مصنوعی در سازمان اسناد و کتابخانه ملی ایران رونمایی شد.
آغاز به کار سامانه پردازش خودکار در کتابخانه ملی

به گزارش ایسنا به نقل از روابط عمومی سازمان اسناد و کتابخانه ملی ایران، سامانه پردازش خودکار با هدف استخراج فراداده‌های متادیتای توصیفی از قبیل عنوان، ناشر و نام پدیدآورنده و غیره از طریق هوش مصنوعی در سازمان اسناد و کتابخانه ملی ایران با حضور مهدی محمدی، دبیر ستاد توسعه فناوری‌های اقتصاد دیجیتال و هوشمندسازی معاونت علمی و فناوری ریاست جمهوری، بهروز مینایی، دانشیار گروه هوش مصنوعی، رباتیک دانشگاه علم و صنعت، علیرضا نوروزی، دانشیار گروه علم اطلاعات و دانش‌شناسی دانشگاه تهران، مظفر پاسدار شیرازی، معاون توسعه مدیریت و منابع و سرپرست حوزه دیجیتال و علیرضا انتهایی، مدیرکل پردازش منابع دیجیتال در محل اندیشگاه سازمان اسناد و کتابخانه ملی ایران رونمایی شد.

علیرضا انتهایی، مدیرکل پردازش منابع دیجیتال در توضیح راه‌اندازی این سامانه گفت: سامانه پردازش خودکار به منظور استخراج عناصر برای جست‌وجوی اطلاعات راه‌اندازی شده است که در کتاب‌ها و منابع فیزیکی به آن فهرست‌نویسی می‌گویند. این فرآیند از گذشته در کتابخانه‌های دنیا انجام می‌شد، اما امروز با وجود کتابخانه‌های هوشمند از آن به عنوان متادیتا یاد می‌شود.

وی به اهداف راه‌اندازی این سامانه اشاره کرد و گفت: سازمان اسناد و کتابخانه ملی ایران با طراحی و راه‌اندازی این سامانه در تلاش است، فراداده‌های توصیفی از قبیل عنوان، ناشر و نام پدیدآورنده و غیره را از طریق هوش مصنوعی استخراج کند و در نهایت نیروی انسانی فقط نقش نظارتی دارد و در این فرآیند از هوش مصنوعی و یادگیری عمیق ماشینی استفاده شده است.

مدیرکل پردازش منابع دیجیتال سازمان اسناد و کتابخانه ملی ایران سپس اظهار کرد: هوش مصنوعی یک فرایند یادگیری ادامه‌دار است که با بهره‌گیری از این امکان، سامانه پردازش خودکار سازمان اسناد و کتابخانه ملی ایران در ادامه مسیر به مرور از دقت بیشتری نیز برخوردار خواهد شد.

انتهایی همچنین به فرآیند و کارکردهای این سامانه اشاره کرد و افزود: این سامانه نسخه دیجیتال پایان‌نامه را از طریق سامانه نویسه‌خوان(OCR) به متن تبدیل می‌کند و در گام‌های بعدی هوشمندانه فراداده‌های توصیفی در منابع اطلاعاتی را بر اساس استانداردهای تعریف‌شده استخراج می‌کند. دقت به‌کار گرفته‌شده در این سامانه شاید هم‌اکنون عدد قابل ملاحظه‌ای در حوزه منابع توصیفی باشد به گونه‌ای که در خصوص پایان‌نامه‌ها حدود ۸۰ درصد دقت استخراج فراداده و ۹۵ درصد صحت اطلاعات استخراج‌شده رسیده است، این سازمان در تلاش است این مهم را درباره کتاب و مقاله نیز توسعه دهد.

مدیرکل فراهم‌آوری و پردازش منابع دیجیتال سازمان اسناد و کتابخانه ملی ایران ادامه داد: سرعت این سامانه با توجه به زیرساخت‌های موجود حدود دو مدرک در دقیقه است، البته این امر با تقویت زیرساخت می‌تواند افزایش یابد.

انتهایی ضمن قدردانی از حمایت‌های معاونت علمی و فناوری ریاست جمهوری در فراهم‌سازی زیرساخت پردازش خودکار، یادآور شد: قابلیت‌های دیگری نیز در سامانه دیجیتال سازمان افزوده شده است که می‌توان به قابلیت جست‌وجوی معنایی به کمک نمودار گرافیکی اصطلاح‌نامه اصفا اشاره کرد.

مظفر پاسدار شیرازی، معاون توسعه مدیریت و منابع انسانی و سرپرست معاونت دیجیتال سازمان اسناد و کتابخانه ملی ایران نیز ضمن قدردانی از حمایت‌های مادی و معنوی صورت‌گرفته از سوی معاونت علمی و فناوری ریاست جمهوری در راه‌اندازی این سامانه گفت: ظرف یک‌سال گذشته با کمک پنجره واحد نشر فهرست ۱۰۰ درصد کتاب‌های کشور پیش از انتشار توسط متخصصان پردازش سازمان اسناد و کتابخانه ملی ایران تولید می‌شود، نکته‌ای که پیش از این حدود ۹۰ درصد بود. به بیان دیگر پردازش کتاب از منظر کمی تکمیل شده است. این پروژه و سایر پروژه‌های حوزه نوآوری سازمان ذیل عنوان پردازش خودکار تلاش دارد تا نخست سرعت و دقت فرایندهای پردازش منابع ورودی سازمان را افزایش دهد و در ادامه به ارتقای کیفیت فهرست تولیدی سازمان نیز کمک کند.

معاون توسعه مدیریت و منابع سازمان اسناد و کتابخانه ملی ایران ادامه داد: در تلاش هستیم در حوزه فهرست‌نویسی توصیفی و فهرست‌نویسی تحلیلی از فناوری‌های جدید استفاده کنیم، در این بین کیفیت متادیتای تولیدی در این حوزه نقش و جایگاه ویژه‌ای دارد به طوری که در نهایت با استفاده از این ابزار همه کتابخانه‌های کشور به یک متادیتای سریع‌تر، به‌روزتر و با کیفیت بالاتری دسترسی خواهند داشت.

او گفت: یک پروژه موازی دیگر با این امر نیز برای فهرست‌نویسی تحلیلی با کمک استارتاپ‌ها و شرکت‌های فناوری در سازمان اسناد و کتابخانه ملی ایران در حال انجام است که در نهایت سامانه با کمک هوش مصنوعی با بررسی متن کتاب ارائه‌شده پیشنهاد رده‌بندی کتاب را بر اساس استاندارد کتابخانه کنگره به متخصصان فهرست‌نویس ما پیشنهاد می‌دهد و فهرست‌نویسان سازمان اسناد و کتابخانه ملی ایران این پیشنهادات را ارزیابی و انتخاب می‌کنند.

او ادامه داد: سازمان اسناد و کتابخانه ملی ایران در راستای خدماتی که از شرکت‌های فناور می‌گیرد در تلاش است خدمات مورد نیاز این شرکت‌ها را نیز تامین کند، چرا که یکی از دلایل عدم توسعه هوش مصنوعی در زبان فارسی نبود بیگ دیتا در زبان فارسی است؛ داده‌های کتابخانه ملی به مثابه یک فلز گران‌بها در معدن است که برای بهره‌برداری فناوران نیاز به استخراج و آماده‌سازی دارد.

معاون توسعه مدیریت و منابع سازمان اسناد و کتابخانه ملی ایران خاطرنشان کرد: نگاه سازمان اسناد و کتابخانه ملی ایران تا به امروز سرویس‌دهی و ارائه خدمات به پژوهشگران بوده اما امروز در تلاش است داده‌های موجود در این سازمان را به فعالان عرصه هوش مصنوعی کشور نیز ارائه دهد تا این عزیزان بتوانند خدمات متنوعی را به کشور و جامعه فارسی‌زبان ارائه دهند.

همچنین مهدی محمدی، دبیر ستاد توسعه فناوری‌های اقتصاد دیجیتال و هوشمندسازی معاونت علمی و فناوری ریاست جمهوری گفت: تحول فناورانه در سازمان اسناد و کتابخانه ملی ایران برای فعالان حوزه هوش مصنوعی غنیمت است و می‌تواند نقش ویژه‌ای را برای شکل‌گیری تکنولوژی‌های جدید توسط استارتاپ‌ها ایفا کند.

دبیر ستاد توسعه فناوری‌های اقتصاد دیجیتال و هوشمندسازی معاونت علمی و فناوری ریاست جمهوری ادامه داد: در حال حاضر فرصت‌ها در حوزه هوشمندسازی کوتاه است و هیچ یک از کشورها فرصت عقب ماندگی و تقلید را ندارند. کشورها باید از این امکان تا سال ۲۰۳۵ بهره لازم را برده باشند و حرفی برای گفتن داشته باشند.

محمدی سپس با بیان این‌که بهره‌مندی از هوش مصنوعی امروزه برای کشورها انتخاب نیست بلکه یک ضرورت است گفت: بهره‌مندی از دیتا در هوش مصنوعی به منزله امکانی ویژه در دنیای امروز است. سازمان‌هایی که دیتا دارند امروز ثروتمند هستند و نمونه بارز این امر سازمان اسناد و کتابخانه ملی ایران است. این سازمان به‌خوبی در مسیر بهره‌مندی از دیتاهای موجود خود قرار گرفته است و تصمیم ندارد تا انباشتی از داده درست کند و این اطلاعات را نگاه دارد.

او خاطرنشان کرد: بهره‌مندی از این دیتاها زمینه ظهور و بروز استارتاپ‌های مختلف را فراهم می‌کند به طوری که حتی این مهم می‌تواند برای سازمان اسناد و کتابخانه ملی ایران ثروت به همراه باشد.

در ادامه این مراسم بهروز مینایی، دانشیار گروه هوش مصنوعی و رباتیک دانشگاه علم و صنعت با اشاره به اهمیت راه‌اندازی سامانه پردازش خودکار گفت: ارتباط سازمان اسناد و کتابخانه ملی ایران با دنیای هوش مصنوعی و فناوری متحول شده است.

مینایی به اهمیت و جایگاه هوش مصنوعی در جهان امروز اشاره کرد و افزود: هم‌اکنون بسیاری از کشورهای دنیا از جمله آلمان حمایت‌های ویژه‌ای را از استارتاپ‌ها به منظور پیشبرد فرآیندهای هوش مصنوعی صورت می‌دهند.

او همچنین بیان کرد: سازمان اسناد و کتابخانه ملی ایران غنی‌ترین جایگاه برای کتاب، سند و تاریخ شفاهی است ضمن این‌که این سازمان منبعی برای فعالیت‌های هوش مصنوعی به شمار می‌رود؛ با استفاده از ابراطلاعاتی که سازمان اسناد و کتابخانه ملی ایران از اسناد سال‌های متمادی به وجود می‌آورد می‌توان مجموعه‌ای غنی ایجاد کرد، این مجموعه بی‌تردید سرچشمه بسیاری از پروژه‌های کلیدی کشور خواهد بود و کمک می‌کند صدها دانش جدید از متون وب ایجاد شود.

علیرضا نوروزی، دانشیار گروه علم اطلاعات و دانش‌شناسی دانشگاه تهران نیز گفت: سازمان اسناد و کتابخانه ملی ایران می‌تواند در حوزه هوش مصنوعی پیشگام باشد، اقدام امروز سازمان اسناد و کتابخانه ملی ایران با رویکرد استخراج اطلاعات کتاب‌شناسی با استفاده از سیستم‌های هوش مصنوعی هدایت‌شده قابل تحسین است.

او ضمن اعلام خوش‌بینی به اجرا و تداوم این پروژه، ادامه داد: امید است در آینده نزدیک شاهد اجرای طرح‌ها و پروژه‌های دیگر با بهره‌مندی از گنجینه اسناد سازمان اسناد و کتابخانه ملی ایران باشیم. با توجه به حضور و فعالیت تیم جوان در سازمان اسناد و کتابخانه ملی ایران در حوزه هوش مصنوعی به آینده این سازمان امیدوار هستم.

دانشیار گروه علم اطلاعات و دانش‌شناسی دانشگاه تهران خاطرنشان کرد: در حوزه داده‌های پیوندی سازمان اسناد و کتابخانه ملی ایران می‌تواند همانند کتابخانه کنگره آمریکا و دیگر کشورها پیشگام باشد و از هوش مصنوعی و لینک‌دیتا بهره‌مند شود.

انتهای پیام

منبع خبر "خبرگزاری ایسنا" است و موتور جستجوگر خبر تیترآنلاین در قبال محتوای آن هیچ مسئولیتی ندارد. (ادامه)
با استناد به ماده ۷۴ قانون تجارت الکترونیک مصوب ۱۳۸۲/۱۰/۱۷ مجلس شورای اسلامی و با عنایت به اینکه سایت تیترآنلاین مصداق بستر مبادلات الکترونیکی متنی، صوتی و تصویری است، مسئولیت نقض حقوق تصریح شده مولفان از قبیل تکثیر، اجرا و توزیع و یا هرگونه محتوای خلاف قوانین کشور ایران بر عهده منبع خبر و کاربران است.