به گزارش ایکنا از اصفهان، نشست «تاریخگذاری سورههای قرآن با هوش مصنوعی» عصر روز گذشته، ۲۹ آبانماه به همت هسته پژوهشی تاریخگذاری قرآن و حدیث دانشگاه اصفهان بهصورت برخط برگزار شد.
محمدعلی طباطبایی، عضو هیئت علمی پژوهشگاه علوم انسانی و مطالعات فرهنگی در این نشست ابتدا درباره تاریخگذاری قرآن بهوسیله یادگیری با نظارت و بدون نظارت اظهار کرد: روش اول یا یادگیری نظارتشده عبارت است از واردکردن تعدادی داده همراه برچسب آن در سیستم؛ از این طریق سیستم با کشف الگوهای مشابه میان تصاویری که برچسب همنام دارند، کمکم قدرت پیدا میکند تا وقتی تصویری میبیند، ماهیت آن را به درستی اعلام کند.
وی با طرح این پرسش که چرا به این روش، یادگیری نظارتشده میگویند، افزود: دلیل این نامگذاری این است که نخست خودمان به دادهها برچسب میدهیم. یادگیری نظارتشده روشهای گوناگونی برای پیادهسازی دارد، مانند رگرسیون خطی، رگرسیون لجستیک و شبکههای عصبی.
عضو هیئت علمی پژوهشگاه علوم انسانی و مطالعات فرهنگی در توضیح روش دوم بیان کرد: یادگیری بدون ناظر به این صورت است که ورودیها را به سیستم عرضه میکنیم؛ اما برچسب نمیدهیم. سیستم تفاوت میان اطلاعات گوناگون و شباهت میان اطلاعات همسان را پیدا و آنها را دستهبندی یا خوشهبندی میکند. در یادگیری بدون ناظر، تحلیل مؤلفههای خوشهای یا اصلی انجام میشود که کار من براساس تحلیل مؤلفههای PCA است. یکسری داده در فضای N بُعدی وجود دارد و تحلیل اطلاعات در آن فضا کار دشواری است. برای حل این مشکل از روشهای کاهش ابعاد استفاده میشود که روش خوبی برای دستهبندی است.
وی با بیان اینکه مسئله ما تاریخگذاری سورههای قرآن است، ادامه داد: ما میخواهیم بدانیم که از ۱۱۴ سوره قرآن، سوره اول، دوم، سوم و... به ترتیب نزول کداماند؟ این از مسائل مطالعات قرآنی مدرن است. در تاریخگذاری سنتی و مدرن یکسری ملاکها وجود دارد، نظیر سبک بلاغی که در سورههای مکی و مدنی متفاوت است یا انتخاب واژگان که در این دو دسته فرق دارد، یا محتوای بسیاری از آیات که حاوی اشارات تاریخی هستند و یا از مقایسه آیات با سیره پیامبر(ص) میتوان تاریخی برای بخشهایی از قرآن مشخص کرد.
طباطبایی تصریح کرد: در چند دهه گذشته، مهندس بازرگان تلاش کرد تا روش جدیدی براساس محاسبات ریاضی ارائه کند و آن محاسبه میانگین طول آیات بود که نشان داد با این روش میتوان نه فقط سورههای قرآن، بلکه قطعات کوچکتری از قرآن را مرتب کرد. پس از او، بهنام صادقی کار بازرگان را با روش سبکسنجی ترکیب و نرخ تکرار کلمات را وارد محاسبات کرد و به نتایج تازهای رسید.
وی با بیان اینکه در یادگیری نظارتشده از شبکه عصبی برای حل مسئله استفاده میشود، اضافه کرد: انتخاب ورودی ما برای یک شبکه عصبی، نوعی الهامگرفتن از کار آقای صادقی، یعنی نرخ تکرار کلمات است. به عبارتی ما به دنبال این هستیم که ببینیم نرخ تکرار برای کلمات خاصی که انتخاب کردهایم، چقدر است؟ برای مثال نرخ تکرار کلمه «الله» در سوره اخلاص، دو بار و تعداد کل کلمات سوره توحید، ۱۷ واژه است. دو را به ۱۷ تقسیم میکنیم که حدوداً برابر با ۱۱ صدم میشود. شبیه این کار را درباره تک تک کلمات قرآن میتوان انجام داد.
عضو هیئت علمی پژوهشگاه علوم انسانی و مطالعات فرهنگی با بیان اینکه با انجام این کار به چندین نمودار دست پیدا میکنیم که وقتی کنار هم میگذاریم، ماتریسی بزرگ به ما نشان میدهد، گفت: بسته به اینکه چند کلمه را انتخاب کنیم، آدرس ما تعیین میشود؛ برای مثال اگر ۱٠٠ کلمه را در نظر بگیریم، آدرس ما میشود ۱٠٠ در ۱۱۴ کلمه؛ پس ما اینگونه خوراک هوش مصنوعی را به دست میآوریم.
وی درباره اینکه خروجی یا برچسب در این روش چیست، گفت: من تمام جدولهای ترکیب سوری را که محققان پیش از این پیشنهاد کردهاند، جمع آوری و از آنها میانگین گرفتم؛ سپس آن را بهمثابه برچسب یادگیری ماشین استفاده کردم. وقتی میخواهیم دادهها را انتخاب و سیستم را براساس دادههای ورودی تغذیه کنیم، بسیار مهم است که این اطلاعات تا حد ممکن دقیق باشد.
طباطبایی با بیان اینکه ما در اینجا سورههایی نظیر سوره اعلی را انتخاب میکنیم که واریانس میان اعداد گوناگونش حداقل باشد، افزود: به این انحراف معیار میگویند. من در ۱۱۴ سوره قرآن، انحراف معیار را محاسبه و براساس کمینه به بیشینه مرتب کردم. در اینجا ۲۷ سورهای که انحراف معیار کمتر از ۱۴ دارد، مشخص میشود.
وی اضافه کرد: این ۲۷ سوره، بهترین انتخابها بهمثابه ورودی برای آموزش شبکه عصبی هستند؛ مثلاً برای سوره توبه که همه مطمئن هستند آخرین یا یکی مانده به آخرین سوره است، بهمثابه سورهای که سنگ محکی برای بقیه سورهها محسوب میشود، فوقالعاده است یا سوره قریش که همه اتفاق نظر دارند از اولین سورههاست و دادهها هم این موضوع را نشان میدهد.
عضو هیئت علمی پژوهشگاه علوم انسانی و مطالعات فرهنگی گفت: کار من با ۱۱۹ کلمه منتخب، نظیر «الله، الرحمن، الرحیم و...» و درآوردن نرخ تکرار آنهاست. در هر بار آموزش، نرخ تکرار این ۱۱۹ کلمه را به ورودی این شبکه عصبی میدهیم. سیستم در لایه دوم، عملیات انجام میدهد و سپس اطلاعات را به لایه دوم پنهان میفرستد و خروجی به دست میآورد. سیستم الگوهای پنهان در روابط میان کلمات متعدد در سورهها و ارتباط آنها با ترکیب تاریخیشان را اجمالاً یاد میگیرد و از اینجا مرحله آزمون فرا میرسد؛ یعنی سورههایی غیر از ۲۷ سوره اولیه را به سیستم میدهیم و پیشبینیاش را درباره آن سوره خاص بررسی میکنیم.
وی درباره چگونگی ارزیابی خروجی سیستم بیان کرد: ما از معیاری استفاده میکنیم که میزان انطباق دو مقوله متوالی را حساب میکند. با چنین طراحی اولیه در هوش مصنوعی و روش یادگیری نظارتشده، به همبستگی رتبهای ۷۴ درصدی میرسیم و هر چقدر پارامترها را دقیقتر کنیم، این عدد هم دقیقتر میشود.
طباطبایی به حل همین مسئله از طریق یادگیری بدون نظارت پرداخت و توضیح داد: پایه کار ما در این روش نیز همان مقاله آقای صادقی، یعنی روش ترکیبسنجی برای پیداکردن ترتیب سورههای قرآن است که تحقیق فوقالعاده ارزشمندی محسوب میشود.
وی ادامه داد: روش صادقی نیز مبتنی بر کار بازرگان است. بازرگان قرآن را در ۱۹۴ بلوک شکست و آنها را براساس میانگین طول آیات مرتب و با یکسری ملاحظات غیرآماری ویرایش و پیشنهاد کرد. صادقی برای حذفکردن نکات غیرآماری در کار بازرگان، متوجه شد به قطعات بزرگتری از سورهها نیاز دارد که برای رفع این مشکل، ۱۹۴ بلوک را در ۲۲ گروه ادغام کرد و نشان داد که در این ۲۲ گروه همچنان طول آیات صعودی است.
عضو هیئت علمی پژوهشگاه علوم انسانی و مطالعات فرهنگی با توضیحات بیشتر درباره روش صادقی تأکید کرد: من کار صادقی را با هوش مصنوعی و روش بدون نظارت بازسازی کردم و این کار را در چهار گام انجام دادم. گام اول این است که میخواهیم روی قطعات قرآن pCA بزنیم و من از ۱۱۴ سوره قرآن شروع و از PIDF یا فهرستی از کلمات با نرخ تکرار آن استفاده کردم. نسبت همبستگی نتایج من با روایات ابنعباس، ۳۶ درصد بود.
وی درباره گام دوم توضیح داد: در این گام، PIDF را بر ۱۹۴ قطعه بازرگان زدم که نتیجه آن ۷۱۱ هزارم شد. سیستم نتایج را به نحو دیگری از کار بازرگان مرتب کرد. در گام سوم هم ۲۲ گروهی را که صادقی تشکیل داد، در نظر گرفتم. من از PIDF تککلمات و PIDF بر مبنای جفت کلمات استفاده کردم. نرخ تکرار کلمات در قرآن را گرفتم و در نهایت بردارسازی دیگری از کلمات به نحوی که در هوش مصنوعی بسیار استفاده میشود و طوری طراحی شده که روابط معنایی میان کلمات را کشف میکند، با روش صادقی شباهت پیدا کرد.
طباطبایی در پایان درباره گام چهارم اظهار کرد: کار صادقی تا اینجا تأیید شد. کمی out layer را جابجا میکنیم؛ برای مثال جای گروه 6 و 7 یا 8 با 11 و... را عوض میکنیم. در نمودار جدید out layer کمتر و همواری بیشتر میشود. نتیجه میگیریم که چه بسا نیاز داشته باشیم دادههایمان را در ۲۲ گروه ادغام کنیم و میتوان کار را بر همان ۱۱۴ سوره تنظیم کرد.
زهراسادات محمدی
انتهای پیام