روش‌های یادگیری خودکار هستی‌نگاشت‌ها در حوزۀ مفاهیم قرآنی: مطالعۀ مروری دامنه‌ای

نوع مقاله : مقاله پژوهشی

نویسندگان

1 استادیار گروه اشاعۀ اطلاعات و تبادل دانش، پژوهشگاه علوم و فرهنگ اسلامی، قم، ایران

2 استادیار گروه علم اطلاعات و دانش‌شناسی، دانشگاه اصفهان، اصفهان، ایران

3 دانشجوی دکتری علم اطلاعات و دانش‌شناسی، دانشگاه شهید چمران اهواز، اهواز، ایران

4 دانشجوی دکتری کتابداری و اطلاع‌رسانی پزشکی، دانشگاه علوم پزشکی و خدمات درمانی ایران، تهران، ایران

چکیده

مقدمه: امروزه فناوری‌های معنایی رویکرد جدیدی را در پردازش و بازنمون معارف قرآنی با هدف ارائۀ اطلاعات معنادار ارائه می‌دهند. هستی‌نگاشت‌ها به‌عنوان یکی از فناوری‌های معنایی، ابزاری جهت بیان رسمی مفاهیم و روابط موجود در حوزۀ خاصی بوده که توسعه و کاربرد آن جهت استخراج معارف و علوم قرآنی مورد توجه قرار گرفته است. یادگیری هستی‌نگاشت‌ها و روش‌های آن به‌صورت خودکار جهت استخراج مفاهیم از مباحث مهم در حوزۀ وب معنایی و فناوری‌های آن است. به‌تازگی توسعه و کاربرد یادگیری هستی‌نگاشت‌ها جهت استخراج مفاهیم قرآنی مورد توجه قرار گرفته است. ازاین‌رو، هدف پژوهش حاضر، بررسی جامع یادگیری خودکار هستی‌نگاشت‌ها در حوزۀ استخراج مفاهیم قرآنی به‌منظور شفاف‌سازی وضعیت فعلی و آینده است. معیارهای مورد بررسی مجموعه داده‌ها، روش‌های یادگیری، روش‌های ارزیابی، نتایج و پیشنهاد‌های آتی پژوهش‌ها در حوزۀ یادگیری خودکار هستی‌نگاشت‌های قرآنی بود.
روش‌شناسی: روش بررسی پژوهش حاضر، مرور دامنه‌ای بر اساس دستورالعمل‌های پریزما و بر اساس رویۀ استفاده‌شده توسط آرکسی و امالی (2005) است. این فرآیند پروتکلی را به‌منظور تطبیق نتایج پژوهش موجود با سؤالات و معیارهای تحقیق توصیف می‌کند. پنج مرحلۀ پیشنهادی آرکسی و امالی عبارت‌اند از: 1. شناسایی و طراحی سؤال(ها) پژوهش، 2. انجام استراتژی‌های جستجو برای استخراج مطالعات مرتبط از طریق انتخاب واژه‌های کلیدی مناسب و عملگرهای بولی، 3. انتخاب نهایی پژوهش‌های مرتبط با تعیین معیارهای ورود و خروج، 4. خلاصه‌سازی و گزارش یافته‌ها و درنهایت، 5. گزارش و بحث پیرامون نتایج حاصل. جستجوی منابع در هفت پایگاه دادۀ علمی مشتمل برEmerald, Science Direct, IEEE Xplore Digital Library, Google Scholar, Web of Science, Scopus انجام شد. فرایند جستجو در فروردین 1402 صورت گرفت. تعداد 811 مقاله، بدون توجه به محدودۀ زمانی، مورد ارزیابی و انتخاب قرار گرفت. به‌منظور سازماندهی مقالات بازیابی‌شده، از نرم‌افزار مدیریت منابع اطلاعاتی اندنوت استفاده شد و پس از تطبیق عناوین در پایگاه‌های اطلاعاتی مختلف، تعداد 317 مقاله تکراری حذف گردید. پس از بررسی چکیده‌ها، معیارهای ورود و خروج و کیفیت مقالات اعمال گردید. همچنین به‌منظور جلوگیری از سوگیری در انتخاب مقالات، طی بررسی تصادفی مجددی، توسط دو پژوهشگر مستقل در حوزۀ یادگیری خودکار هستی‌نگاشت نیز ارزیابی صورت گرفت و درنهایت تعداد 25 اثر به‌عنوان ملاک مرور انتخاب گردید.
یافته­ها: یافته‌ها نشان داد اغلب پژوهش‌ها در حوزۀ مجموعۀ داده‌های قرآنی به زبان‌های انگلیسی و عربی بودند و بخش عمده آنها نیز از ترجمۀ انگلیسی قرآن الهلالی و خان استفاده کرده‌اند. استفاده از مجموعه داده‌های بسیار محدود، مهم‌ترین محدودیت پژوهش‌های انجام شده بود. بخش عمدۀ پژوهش‌ها از روش‌های نرمال‌سازی، خوشه‌بندی و دسته‌بندی متن، خلاصه‌سازی متن، استخراج اطلاعات، تشابه و یافتن موجودیت‌های نامدار استفاده کرده‌اند. البته در برخی پژوهش‌ها، روش‌های هوش مصنوعی نظیر شبکۀ عصبی نیز به کار گرفته شده است. علاوه بر این، یافته‌ها نشان داد که الگوریتم‌های داده‌کاوی مبتنی بر روش‌های آمار و احتمال برای یادگیری و ساخت هستی‌نگاشت‌های خودکار در میان محققان با محبوبیت روبرو شده است. همچنین از روش‌های محاسبۀ دقت، فراخوانی و معیار F برای ارزیابی نتایج کاربرد الگوریتم‌های یادگیری خودکار در هستی‌نگاشت‌های قرآنی استفاده کرده‌اند. پژوهش‌هایی که از روش‌های هوش مصنوعی بهره‌برداری کرده‌اند، با تحلیل معنایی، استنتاج، مدل‌سازی و تأیید اعتبار داده‌های استنتاج‌شده به نتایجی مانند تشخیص صوت برای آموزش قرائت قرآن، تشخیص آرایه‌های ادبی و ایجاد ارتباط‌های موضوعی در مفاهیم قرآنی و همچنین ایجاد ارتباط بین این مفاهیم با مفاهیم سایر ادیان نائل شده‌اند. ارزیابی‌ روش‌های ارائه‌شده برای یادگیری خودکار هستی‌نگاشت‌های قرآنی نشان می‌دهد استفاده توأمان از روش‌های داده‌کاوی و هوش مصنوعی نتایج بهتری را به‌همراه دارد. بخش عمدۀ نتایج این حوزه در دو دسته کلی قرار دارد. دستۀ اول مبتنی بر به‌کارگیری روش‌های داده‌کاوی، متن‌کاوی و یادگیری ماشین جهت استخراج خودکار مفاهیم و ابعاد سه‌گانه (فعل، فاعل، مفعول) به‌همراه روابط معنایی از متن قرآن بود. دستۀ دیگر به مقایسه عملکرد روش‌ها و الگوریتم‌های مبتنی بر آمار و مشابهت‌یابی نظیر TF، TF-IDF، AVE-TF، Ridf، TIM، N-gram، FREyA، Pos Taggin، Levenshtein، Log Likelihod، هِرسِت، و جز این‌ها در استخراج مفاهیم خودکار جهت ساخت هستی‌نگاشت قرآنی پرداخته‌اند. یافته‌های حاصل از بررسی کارهای آینده نشان از علاقۀ محققان به الگوریتم‌های هوش مصنوعی و استفاده در یادگیری هستی‌نگاشت و توسعۀ خودکار و نیمه‌خودکار هستی‌نگاشت‌های قرآنی دارد. فقدان مجموعه داده‌های صحیح، دلیل عجز سامانه‌های هوش مصنوعی پیشرفتۀ دنیا مانند جی‌پی‌تی 4 است که در آینده باید به این مهم پرداخته شود.
نتیجه‌گیری: نتایج این مطالعه می‌تواند به جهت‌دهی پژوهش‌های آتی درباره بهترین روش‌ها در توسعۀ خودکار هستی‌نگاشت‌های قرآنی کمک کند. این مسئله می‌تواند با طراحی هستی‌نگاشت جامع قرآنی که تمام موضوعات و مفاهیم را با توجه به بافت قرآن، پوشش دهد، مدنظر قرار گرفته و با ایجاد هستی‌نگاشتی جامع از مفاهیم قرآن، کاربران را به‌سمت بازیابی دانش قرآنی رهنمون سازد. همچنین بهره‌برداری بیشتر از روش‌های هوش مصنوعی و پردازش زبان طبیعی نظیر جی.پی.تی. به‌عنوان مدل یادگیری ماشینی برای تولید متن به زبان طبیعی با استفاده از شبکۀ عصبی عمیق، در توسعۀ خودکار هستی‌نگاشت‌های قرآنی ضروری به نظر می‌رسد. با توجه به اینکه یادگیری ماشین مستلزم وجود داده‌های کلان در حوزۀ قرآن است، ساخت مجموعه داده‌های استاندارد ازجمله کارهای آتی محققان است.

کلیدواژه‌ها

موضوعات


Al-Khalifa, H. S., Al-Yahya, M., Bahanshal, A., Al-Odah, I., & Al-Helwah, N. (2010). An
approach to compare two ontological models for representing quranic words
Proceedings of the 12th International Conference on Information Integration and Web-
based Applications & Services, Paris, France.
https://doi.org/10.1145/1967486.1967593
Al-Zamil, M. G. H., & Al-Radaideh, Q. (2014). Automatic extraction of ontological relations
from Arabic text. Journal of King Saud University - Computer and Information
Sciences, 26(4), 462-472. https://doi.org/https://doi.org/10.1016/j.jksuci.2014.06.007
Alrehaili, S. M., Alqahtani, M., & Atwell, E. (2018, 12-14 March 2018). A Hybrid Methods
of Aligning Arabic Qur’anic Semantic Resources. 2018 IEEE 2nd International
Workshop on Arabic and Derived Script Analysis and Recognition (ASAR),
Alshammeri, M., Atwell, E., & Alsalka, M. a. (2021). Detecting Semantic-based Similarity
Between Verses of The Quran with Doc2vec. Procedia Computer Science, 189, 351-
358. https://doi.org/https://doi.org/10.1016/j.procs.2021.05.104
Baqai, S., Basharat, A., Khalid, H., Hassan, A., & Zafar, S. (2009). Leveraging semantic web
technologies for standardized knowledge modeling and retrieval from the Holy Qur'an
and religious texts Proceedings of the 7th International Conference on Frontiers of
Information Technology, Abbottabad, Pakistan.
https://doi.org/10.1145/1838002.1838050
Bentrcia, R., Zidat, S., & Marir, F. (2018). Extracting semantic relations from the Quranic
Arabic based on Arabic conjunctive patterns. Journal of King Saud University -
Computer and Information Sciences, 30(3), 382-390.
https://doi.org/https://doi.org/10.1016/j.jksuci.2017.09.004
Castro-Schez, J. J., Jennings, N. R., Luo, X., & Shadbolt, N. R. (2004). Acquiring domain
knowledge for negotiating agents: a case of study. International Journal of Human-
Computer Studies, 61(1), 3-31.
47پژوﻫﺶﻧﺎﻣﻪکﺘﺎﺑﺪاریواﻃﻼعرﺳﺎﻧی،داﻧﺸگﺎهﻓﺮدوﺳیﻣﺸﻬﺪدوره13،ﺷﻤﺎره2،ﺳﺎل1402
https://doi.org/https://doi.org/10.1016/j.ijhcs.2003.09.006
Corcho, O., Fernandez-Lopez, M., & Gomez-Perez, A. (2007). Ontological engineering:
what are ontologies and how can we build them? In Semantic web services: Theory,
tools and applications (pp. 44-70). IGI Global.
Elkhammash, E., & Abdessalem, W. B. (2019). A Holy Quran Ontology Construction with
Semi-Automatic Population. Bioscience Biotechnology Research Communications,
12(1), 229-234. https://doi.org/http://dx.doi.org/10.21786/bbrc/12.1/26
Etzioni, O., Fader, A., Christensen, J., Soderland, S., & Mausam, M. (2011). Open
information extraction: the second generation Proceedings of the Twenty-Second
international joint conference on Artificial Intelligence - Volume Volume One,
Barcelona, Catalonia, Spain.
Gruber, T. R. (1993). A translation approach to portable ontology specifications. Knowledge
Acquisition, 5(2), 199-220. https://doi.org/https://doi.org/10.1006/knac.1993.1008
Gulla, J. A., Borch, H. O., & Ingvaldsen, J. E. (2007). Ontology Learning for Search
Applications. In R. Meersman & Z. Tari, On the Move to Meaningful Internet Systems
2007: CoopIS, DOA, ODBASE, GADA, and IS Berlin, Heidelberg.
Husin, M. Z., Saad, S., & Noah, S. A. M. (2017, 25-27 Nov. 2017). Syntactic rule-based
approach for extracting concepts from quranic translation text. 2017 6th International
Conference on Electrical Engineering and Informatics (ICEEI),
Irwanto, Y., Bijaksana, M. A., & Adiwijaya. (2018). Semantic text relatedness on Al-Qur’an
translation using modified path based method. Journal of Physics: Conference Series,
971(1), 012047. https://doi.org/10.1088/1742-6596/971/1/012047
Ismail, R., Abd Rahman, N., & Abu Bakar, Z. (2016, 10-12 Oct. 2016). Identifying concept
from English translated Quran. 2016 IEEE Conference on Open Systems (ICOS),
Ismail, R., Abd Rahman, N., & Abu Bakar, Z. (2017). A Pattern for Concept Identification
from English Translated Quran. MATEC Web Conf., 135, 00067.
https://doi.org/10.1051/matecconf/201713500067
Ismail, R., Abd Rahman, N., & Abu Bakar, Z. (2018). Single Term Concepts from English
Translated Qur’an Using Statistical Methods. International Journal of Engineering &
Technology, 7(2.14), 13-16.
Ismail, R., Abd Rahman, N., Abu Bakar, Z., & Makhtar, M. (2018, 3-5 May 2018). Concepts
extraction in ontology learning using language patterns for better accuracy. 2018 4th
International Conference on Computer and Technology Applications (ICCTA),
Ismail, R., Abu Bakar, Z., & Abd Rahman, N. (2015). EXTRACTING KNOWLEDGE
FROM ENGLISH TRANSLATED QURAN USING NLP PATTERN. Jurnal
Teknologi, 77(19). https://doi.org/10.11113/jt.v77.6515
Jalali, R., & Mohammadi, M. (2021). Scoping review, missing loop in chain of review
articles: Letter to the Editor [Original Article]. Tehran University Medical Journal,
78(10), 710-711. http://tumj.tums.ac.ir/article-1-10938-fa.html. [In Persian]
Kadir, R., & Yauri, R. (2017). Resource description framework triples entity formations
using statistical language model. Journal of Fundamental and Applied Sciences, 9(4S),
710-729.
Khazani, M. M. M., Mohamed, H., Sembok, T. M. T., Yusop, N. M. M., Wani, S., Gulzar,
Y., Halip, M. H. M., Marzukhi, S., & Yunos, Z. (2021). Semantic graph knowledge
representation for Al-Quran verses based on word dependencies. Malaysian Journal of
Computer Science, 132-153.
دوره13،ﺷﻤﺎره2،ﺳﺎل1402روشﻫﺎیﯾﺎدگﯿﺮیﺧﻮدکﺎرﻫﺴﺘیﻧگﺎﺷﺖﻫﺎدر...48
Maedche, A., & Staab, S. (2001). Ontology learning for the semantic web. IEEE Intelligent
systems, 16(2), 72-79.
Mahmoud, M., & Hassan, I. (2013, 22-25 Dec. 2013). Artificial Intelligence Techniques for
Extracting Individuals Recitation of the Holy Quran from Its Combinations. 2013
Taibah University International Conference on Advances in Information Technology
for the Holy Quran and Its Sciences,
Mirarab, A., Tabatabai Amiri, F. S., Dehghanisanij, S., & HosseinKhalili, N. (2023).
Development of quranic ontologies: A domain review study. International Journal of
Information Science and Management, 21(3), 229-241. [In Persian]
https://doi.org/https://doi.org/10.22034/ijism.2023.1977928.0
Petiwala, A. J., & Sathya, S. S. (2011, 7-9 Sept. 2011). A multi-agent system to learn
literature ontology: An experiment on English Quran corpus. 2011 2nd International
Conference on Intelligent Agent & Multi-Agent Systems,
Saad, S., Noah, S. A. M., Salim, N., & Zainal, H. (2013, 22-25 Dec. 2013). Rules and Natural
Language Pattern in Extracting Quranic Knowledge. 2013 Taibah University
International Conference on Advances in Information Technology for the Holy Quran
and Its Sciences,
Saber, Y. M., Abdel-Galil, H., & El-Fatah Belal, M. A. (2022). Arabic ontology extraction
model from unstructured text. Journal of King Saud University - Computer and
Information Sciences, 34(8, Part B), 6066-6076.
https://doi.org/https://doi.org/10.1016/j.jksuci.2022.02.007
Sánchez, D., & Moreno, A. (2008). Learning non-taxonomic relationships from web
documents for domain ontology construction. Data & Knowledge Engineering, 64(3),
600-623. https://doi.org/https://doi.org/10.1016/j.datak.2007.10.001
Shamsfard, M., & Abdollahzadeh Barforoush, A. (2003). The state of the art in ontology
learning: a framework for comparison. The Knowledge Engineering Review, 18(4), 293-
316. https://doi.org/10.1017/S0269888903000687
Shannon, S. (2002). Critical appraisal of systematic reviews. Canadian Association of
Radiologists Journal, 53(4), 195.
Sharaf, A.-B., & Atwell, E. (2012, May). QurAna: Corpus of the Quran annotated with
Pronominal Anaphora.Proceedings of the Eighth International Conference on
Language Resources and Evaluation (LREC’12) Istanbul, Turkey.
Tomás, V. R., & García, L. A. (2005). Agent-Based Management of Non Urban Road
Meteorological Incidents. In M. Pěchouček, P. Petta, & L. Z. Varga, Multi-Agent
Systems and Applications IV Berlin, Heidelberg.
Uren, V., Cimiano, P., Iria, J., Handschuh, S., Vargas-Vera, M., Motta, E., & Ciravegna, F.
(2006). Semantic annotation for knowledge management: Requirements and a survey
of the state of the art. Journal of Web Semantics, 4(1), 14-28.
https://doi.org/https://doi.org/10.1016/j.websem.2005.10.002
Utomo, F. S., Suryana, N., & Sanusi Azmi, M. (2019). New instances classification
framework on Quran ontology applied to question answering system. TELKOMNIKA
Indonesian Journal of Electrical Engineering, 17, 139-146.
https://doi.org/10.12928/TELKOMNIKA.v17i1.9794
Utomo, F. S., Suryana, N., & Sanusi Azmi, M. (2020). STEMMING IMPACT ANALYSIS
ON INDONESIAN QURAN TRANSLATION AND THEIR TAFSIR
CLASSIFICATION FOR ONTOLOGY INSTANCES. IIUM Engineering Journal,
49پژوﻫﺶﻧﺎﻣﻪکﺘﺎﺑﺪاریواﻃﻼعرﺳﺎﻧی،داﻧﺸگﺎهﻓﺮدوﺳیﻣﺸﻬﺪدوره13،ﺷﻤﺎره2،ﺳﺎل1402
21(1), 33 -50. https://doi.org/10.31436/iiumej.v21i1.1170
Varghese, N., & Punithavalli, M. (2019). Lexical and semantic analysis of sacred texts using
machine learning and natural language processing. International Journal of Scientific
& Technology Research, 8(12), 3133-3140.
Weaam, T., & Saad, S. (2016). Ontology population from quranic translation texts based on
a combinationof linguistic patterns and association rules. 86, 250-257.
Wimalasuriya, D. C., & Dou, D. (2010). Ontology-based information extraction: An
introduction and a survey of current approaches. Journal of Information Science, 36(3),
306-323. https://doi.org/10.1177/0165551509360123
CAPTCHA Image