کد خبر: 4249451
تاریخ انتشار : ۳۰ آبان ۱۴۰۳ - ۱۵:۰۶
در نشستی بررسی شد

تاریخ‌گذاری سوره‌های قرآن با هوش مصنوعی

عضو هیئت علمی پژوهشگاه علوم انسانی و مطالعات فرهنگی با بیان اینکه در یافتن ترتیب نزول سوره‌های قرآن با کمک هوش مصنوعی می‌توان از دو روش یادگیری با نظارت و بدون نظارت استفاده کرد، گفت: تفاوت این دو روش در این است که در یادگیری نظارت‌شده، داده‌ها با برچسب وارد سیستم می‌شود، ولی در یادگیری بدون نظارت به ورودی‌های سیستم برچسب داده نمی‌شود.

قرآن و هوش مصنوعیبه گزارش ایکنا از اصفهان، نشست «تاریخ‌گذاری سوره‌های قرآن با هوش مصنوعی» عصر روز گذشته، ۲۹ آبان‌ماه به همت هسته پژوهشی تاریخ‌گذاری قرآن و حدیث دانشگاه اصفهان به‌صورت برخط برگزار شد.

محمدعلی طباطبایی، عضو هیئت علمی پژوهشگاه علوم انسانی و مطالعات فرهنگی در این نشست ابتدا درباره تاریخ‌گذاری قرآن به‌وسیله یادگیری با نظارت و بدون نظارت اظهار کرد: روش اول یا یادگیری نظارت‌شده عبارت است از واردکردن تعدادی داده همراه برچسب آن در سیستم؛ از این طریق سیستم با کشف الگوهای مشابه میان تصاویری که برچسب هم‌نام دارند، کم‌کم قدرت پیدا می‌کند تا وقتی تصویری می‌بیند، ماهیت آن را به درستی اعلام کند.

وی با طرح این پرسش که چرا به این روش، یادگیری نظارت‌شده می‌گویند، افزود: دلیل این نام‌گذاری این است که نخست خودمان به داده‌ها برچسب می‌دهیم. یادگیری نظارت‌شده روش‌های گوناگونی برای پیاده‌سازی دارد، مانند رگرسیون خطی، رگرسیون لجستیک و شبکه‌های عصبی.

عضو هیئت علمی پژوهشگاه علوم انسانی و مطالعات فرهنگی در توضیح روش دوم بیان کرد: یادگیری بدون ناظر به این صورت است که ورودی‌ها را به سیستم عرضه می‌کنیم؛ اما برچسب نمی‌دهیم. سیستم تفاوت میان اطلاعات گوناگون و شباهت میان اطلاعات همسان را پیدا و آن‌ها را دسته‌بندی یا خوشه‌بندی می‌کند. در یادگیری بدون ناظر، تحلیل مؤلفه‌های خوشه‌ای یا اصلی انجام می‌شود که کار من براساس تحلیل مؤلفه‌های  PCA  است. یک‌سری داده در فضای N بُعدی وجود دارد و تحلیل اطلاعات در آن فضا کار دشواری است. برای حل این مشکل از روش‌های کاهش ابعاد استفاده می‌شود که روش خوبی برای دسته‌بندی است.

وی با بیان اینکه مسئله ما تاریخ‌گذاری سوره‌های قرآن است، ادامه داد: ما می‌خواهیم بدانیم که از ۱۱۴ سوره قرآن، سوره اول، دوم، سوم و... به ترتیب نزول کدام‌اند؟ این از مسائل مطالعات قرآنی مدرن است. در تاریخ‌گذاری سنتی و مدرن یک‌سری ملاک‌ها وجود دارد، نظیر سبک بلاغی که در سوره‌های مکی و مدنی متفاوت است یا انتخاب واژگان که در این دو دسته فرق دارد، یا محتوای بسیاری از آیات که حاوی اشارات تاریخی هستند و یا از مقایسه آیات با سیره پیامبر(ص) می‌توان تاریخی برای بخش‌هایی از قرآن مشخص کرد. 

تاریخ‌گذاری سوره‌ها با محاسبات ریاضی

طباطبایی تصریح کرد: در چند دهه گذشته، مهندس بازرگان تلاش کرد تا روش جدیدی براساس محاسبات ریاضی ارائه کند و آن محاسبه میانگین طول آیات بود که نشان داد با این روش می‌توان نه فقط سوره‌های قرآن، بلکه قطعات کوچکتری از قرآن را مرتب کرد. پس از او، بهنام صادقی کار بازرگان را با روش سبک‌سنجی ترکیب و نرخ تکرار کلمات را وارد محاسبات کرد و به نتایج تازه‌ای رسید.

وی با بیان اینکه در یادگیری نظارت‌شده از شبکه عصبی برای حل مسئله استفاده می‌شود، اضافه کرد: انتخاب ورودی ما برای یک شبکه عصبی، نوعی الهام‌گرفتن از کار آقای صادقی، یعنی نرخ تکرار کلمات است. به عبارتی ما به دنبال این هستیم که ببینیم نرخ تکرار برای کلمات خاصی که انتخاب کرده‌ایم، چقدر است؟ برای مثال نرخ تکرار کلمه «الله» در سوره اخلاص، دو بار و تعداد کل کلمات سوره توحید، ۱۷ واژه است. دو را به ۱۷ تقسیم می‌کنیم که حدوداً برابر با ۱۱ صدم می‌شود. شبیه این کار را درباره تک تک کلمات قرآن می‌توان انجام داد.

عضو هیئت علمی پژوهشگاه علوم انسانی و مطالعات فرهنگی با بیان اینکه با انجام این کار به چندین نمودار دست پیدا می‌کنیم که وقتی کنار هم می‌گذاریم، ماتریسی بزرگ به ما نشان می‌دهد، گفت: بسته به اینکه چند کلمه را انتخاب کنیم، آدرس ما تعیین می‌شود؛ برای مثال اگر ۱٠٠ کلمه را در نظر بگیریم، آدرس ما می‌شود ۱٠٠ در ۱۱۴ کلمه؛ پس ما این‌گونه خوراک هوش مصنوعی را به دست می‌آوریم.

وی درباره اینکه خروجی یا برچسب در این روش چیست، گفت: من تمام جدول‌های ترکیب سوری را که محققان پیش از این پیشنهاد کرده‌اند، جمع آوری و از آن‌ها میانگین گرفتم؛ سپس آن را به‌مثابه برچسب یادگیری ماشین استفاده کردم. وقتی می‌خواهیم داده‌ها را انتخاب و سیستم را براساس داده‌های ورودی تغذیه کنیم، بسیار مهم است که این اطلاعات تا حد ممکن دقیق باشد.

انتخاب ۲۷ سوره‌ با واریانس حداقلی

طباطبایی با بیان اینکه ما در اینجا سوره‌هایی نظیر سوره اعلی را انتخاب می‌کنیم که واریانس میان اعداد گوناگونش حداقل باشد، افزود: به این انحراف معیار می‌گویند. من در ۱۱۴ سوره قرآن، انحراف معیار را محاسبه و براساس کمینه به بیشینه مرتب کردم. در اینجا ۲۷ سوره‌ای که انحراف معیار کمتر از ۱۴ دارد، مشخص می‌شود.

وی اضافه کرد: این ۲۷ سوره، بهترین انتخاب‌ها به‌مثابه ورودی برای آموزش شبکه عصبی هستند؛ مثلاً برای سوره توبه که همه مطمئن هستند آخرین یا یکی مانده به آخرین سوره است، به‌مثابه سوره‌ای که سنگ محکی برای بقیه سوره‌ها محسوب می‌شود، فوق‌العاده است یا سوره قریش که همه اتفاق نظر دارند از اولین سوره‌هاست و داده‌ها هم این موضوع را نشان می‌دهد.

عضو هیئت علمی پژوهشگاه علوم انسانی و مطالعات فرهنگی گفت: کار من با ۱۱۹ کلمه منتخب، نظیر «الله، الرحمن، الرحیم و...» و درآوردن نرخ تکرار آن‌هاست. در هر بار آموزش، نرخ تکرار این ۱۱۹ کلمه را به ورودی این شبکه عصبی می‌دهیم. سیستم در لایه دوم، عملیات انجام می‌دهد و سپس اطلاعات را به لایه دوم پنهان می‌فرستد و خروجی به دست می‌آورد. سیستم الگوهای پنهان در روابط میان کلمات متعدد در سوره‌ها و ارتباط آن‌ها با ترکیب تاریخی‌شان را اجمالاً یاد می‌گیرد و از اینجا مرحله آزمون فرا می‌رسد؛ یعنی سوره‌هایی غیر از ۲۷ سوره اولیه را به سیستم می‌دهیم و پیش‌بینی‌اش را درباره آن سوره خاص بررسی می‌کنیم.

وی درباره چگونگی ارزیابی خروجی سیستم بیان کرد: ما از معیاری استفاده می‌کنیم که میزان انطباق دو مقوله متوالی را حساب می‌کند. با چنین طراحی اولیه در هوش مصنوعی و روش یادگیری نظارت‌شده، به همبستگی رتبه‌ای ۷۴ درصدی می‌رسیم و هر چقدر پارامترها را دقیق‌تر کنیم، این عدد هم دقیق‌تر می‌شود.

طباطبایی به حل همین مسئله از طریق یادگیری بدون نظارت پرداخت و توضیح داد: پایه کار ما در این روش نیز همان مقاله آقای صادقی، یعنی روش ترکیب‌سنجی برای پیداکردن ترتیب سوره‌های قرآن است که تحقیق فوق‌العاده ارزشمندی محسوب می‌شود.

وی ادامه داد: روش صادقی نیز مبتنی بر کار بازرگان است. بازرگان قرآن را در ۱۹۴ بلوک شکست و آن‌ها را براساس میانگین طول آیات مرتب و با یک‌سری ملاحظات غیرآماری ویرایش و پیشنهاد کرد. صادقی برای حذف‌کردن نکات غیرآماری در کار بازرگان، متوجه شد به قطعات بزرگتری از سوره‌ها نیاز دارد که برای رفع این مشکل، ۱۹۴ بلوک را در ۲۲ گروه ادغام کرد و نشان داد که در این ۲۲ گروه همچنان طول آیات صعودی است.

عضو هیئت علمی پژوهشگاه علوم انسانی و مطالعات فرهنگی با توضیحات بیشتر درباره روش صادقی تأکید کرد: من کار صادقی را با هوش مصنوعی و روش بدون نظارت بازسازی کردم و این کار را در چهار گام انجام دادم. گام اول این است که می‌خواهیم روی قطعات قرآن pCA بزنیم و من از ۱۱۴ سوره قرآن شروع و از PIDF یا فهرستی از کلمات با نرخ تکرار آن استفاده کردم. نسبت همبستگی نتایج من با روایات ابن‌عباس، ۳۶ درصد بود.

وی درباره گام دوم توضیح داد: در این گام، PIDF را بر ۱۹۴ قطعه بازرگان زدم که نتیجه آن ۷۱۱ هزارم شد. سیستم نتایج را به نحو دیگری از کار بازرگان مرتب کرد. در گام سوم هم ۲۲ گروهی را که صادقی تشکیل داد، در نظر گرفتم. من از PIDF تک‌کلمات و PIDF بر مبنای جفت کلمات استفاده کردم. نرخ تکرار کلمات در قرآن را گرفتم و در نهایت بردارسازی دیگری از کلمات به نحوی که در هوش مصنوعی بسیار استفاده می‌شود و طوری طراحی شده که روابط معنایی میان کلمات را کشف می‌کند، با روش صادقی شباهت پیدا کرد.

طباطبایی در پایان درباره گام چهارم اظهار کرد: کار صادقی تا اینجا تأیید شد. کمی out layer را جابجا می‌کنیم؛ برای مثال جای گروه 6 و 7 یا 8 با 11 و... را عوض می‌کنیم. در نمودار جدید out layer کمتر و همواری بیشتر می‌شود. نتیجه می‌گیریم که چه بسا نیاز داشته باشیم داده‌های‌مان را در ۲۲ گروه ادغام کنیم و می‌توان کار را بر همان ۱۱۴ سوره تنظیم کرد.

زهراسادات محمدی

انتهای پیام
captcha