مرور نظام‌مند پژوهش‌های حوزه گسترش پرس‌وجو در زبان فارسی

نوع مقاله : مقالات پژوهشی

نویسندگان

1 دانشگاه تهران

2 دانشگاه تبریز

3 پژوهشگاه علوم و فناوری اطلاعات (ایرانداک)

چکیده

مقدمه: یکی از عوامل عدم موفقیت در بازیابی اطلاعات، ارائه نیاز اطلاعاتی کاربران در پرس‌وجوهای کوتاه و مبهم به نظام‌های اطلاعاتی است. گسترش پرس‌وجو با افزودن اصطلاحات مناسب به پرس‌وجوهای کاربران، راه‌حلی مناسب برای حل این مشکل است. هدف پژوهش حاضر مرور نظام‌مند متون پژوهشی گسترش پرس‌وجو در زبان فارسی است.
روش‌شناسی: فارسی و انگلیسی منابع اطلاعات علمی با کلیدواژه‌های مرتبط، تعداد 35 اثر به زبان فارسی و 18 اثر به زبان انگلیسی شناسایی شد. سپس با اعمال پالایش اولیه، معیارهای ورود و خروج از مطالعه و کنترل توسط متخصصان، تعداد شش اثر فارسی و هشت اثر انگلیسی برای ورود به مرور نظام‌مند انتخاب شدند. با طراحی کاربرگی، استخراج اطلاعات از آثار صورت پذیرفت. در ادامه، یافته‌های مرور نظام‌مند در پی دستیابی به چهار هدف پژوهش تحلیل شدند: شناسایی روش­ها؛ شناسایی منابع دانشی؛ شناسایی مجموعه آزمون‌ها؛ و شناسایی شکاف­‌های پژوهشی و ارائه پیشنهادهایی برای پژوهش‌­های آینده در گسترش پرس‌وجوی زبان فارسی.
یافته‌ها: مرور پژوهش­ها نشان داد 14 اثر به گسترش پرس­وجوی زبان فارسی پرداخته‌اند. این آثار براساس منابع دانشی اصطلاحات گسترش به چهار دسته تقسیم شدند: مبتنی بر ربط (هشت اثر)؛ مبتنی بر ساختارهای دانش (دو اثر)، مبتنی بر اطلاعات وب (دو اثر)، و مبتنی بر منابع ترکیبی (دو اثر). اغلب این پژوهش­ها بر روی اسناد خبری انجام شده‌اند و از مجموعه آزمون روزنامه همشهری در نیمی از پژوهش­ها به‌عنوان منبع دانشی اصطلاحات گسترش و نیز مجموعه آزمون استفاده شده است.
نتیجه‌گیری: تحقیقات حوزه گسترش پرس‌وجو در زبان فارسی نیازمند توسعه کمی با استفاده از روش‌های متنوع و به‌ویژه روش‌های مبتنی بر منابع ترکیبی است. منابع دانشی مختلف به‌ویژه هستی‌شناسی‌ها و منابع وب می‌بایست برای گسترش پرس‌وجو در زبان فارسی مورد توجه و استفاده قرار گیرند. همچنین استفاده از مجموعه آزمون‌های استاندارد برای پژوهشگران این امکان فراهم می‌کند که بتوانند روش‌های مختلف را با هم مقایسه کنند.

کلیدواژه‌ها


خالقی، مرتضی، و مینایی، بهروز (1394). چهارچوبی مستقل از زبان برای گسترش پرس‌وجو. سومین کنفرانس بین‌المللی پژوهش‌های کاربردی در مهندسی کامپیوتر و فن‌آوری اطلاعات.
خسروی، عبدالرسول، فتاحی، رحمت‌الله، پریرخ، مهری و دیانی، محمدحسین (1392). بررسی کارآمدی کلیدواژه‌ها و عبارت‌های پیشنهادی موتور کاوش گوگل در بسط جستجو و افزایش ربط از دیدگاه دانشجویان تحصیلات تکمیلی. پژوهش‌های نظری و کاربردی در علم اطلاعات و دانش‌شناسی، 3(1)، 133-150.
دیانت، روح‌الله، علی‌احمدی، مرتضی، اخلاقی، محمدیحیی و باباعلی، باقر (1395). ارائه یک روش جدید بازیابی اطلاعات مناسب برای متون حاصل از بازشناسی گفتار. پردازش علائم و داده‌ها، 4(3). 93-108.
ساعدی، سیامک (1390). گسترش پرس‌وجو در موتورهای جستجوی فارسی. پایان‌نامه کارشناسی ارشد رشته مهندسی فناوری اطلاعات- شبکه‌های کامپیوتری. دانشگاه یزد، دانشکده مهندسی برق و کامپیوتر.
شبان‌زاده حبیب‌آبادی، مژگان (1389). گسترش معنایی پرس‌وجو. پایان‌نامه کارشناسی ارشد دانشگاه اصفهان، دانشکده فنی و مهندسی.
عبدالحسینی، زهرا (1392). بسط پرس‌وجوی کاربر با بهره‌گیری از روش‌های استنتاج روابط معنایی در بانک‌های اطلاعاتی متنی. پایان‌نامه کارشناسی ارشد، دانشکده فنی، دانشگاه الزهرا.
کریسانی، پیام (1390). گسترش پرس‌وجوهای فارسی در موتورهای جستجو. پایان‌نامه کارشناسی ارشد رشته کامپیوتر- گرایش نرم‌افزار. دانشگاه تهران، دانشکده مهندسی برق و کامپیوتر.
ملبوس‌باف، رامین و عزیزی، فریدون (1389). مرور سیستماتیک "Systematic Review" چیست و چگونه نگاشته می‌شود؟. پژوهش در پزشکی، 34(3)، 203-207.
Abdelmgeid Amin, A. (2008). Using a query expansion technique to improve document retrieval. Information Technologies and Knowledge, 7(2), 343-345.
Agichtein, E., & Cucerzan, S. (2005). Predicting Extraction Performance Using Context Language Models. In the SIGIR 2005 Workshop on Methodologies and Evaluation of Lexical Cohesion Techniques in Real-World Applications, 2005.
AleAhmad, A., Amiri, H., Darrudi, E., Rahgozar, M., & Oroumchian, F. (2009). Hamshahri: A standard Persian text collection. Knowledge-Based Systems, 22(5), 382-387.
AleAhmad, A., Hakimian, P., Mahdikhani, F., & Oroumchian, F. (2007, February). N-gram and local context analysis for persian text retrieval. In Signal Processing and Its Applications, 2007. ISSPA 2007. 9th International Symposium on (pp. 1-4). IEEE.
Atwan, J., & Mohd, M. (2017). Arabic Query Expansion: A Review. Asian Journal of Information Technology, 16(10), 754-770.
Azad, H. K., & Deepak, A. (2019). Query expansion techniques for information retrieval: a survey. Information Processing & Management, 56(5), 1698-1735.
Baeza-Yates, R., & Ribeiro-Neto, B. (1999). Modern information retrieval. Addison-Wesley Harlow, England.
Bendersky, M., & Croft, W. B. (2008, July). Discovering key concepts in verbose queries. In Proceedings of the 31st annual international ACM SIGIR conference on Research and development in information retrieval (pp. 491-498). ACM.
Bhogal, J., MacFarlane, A., & Smith, P. (2007). A review of ontology based query expansion. Information processing & management, 43(4), 866-886.
Dolamic, L., & Savoy, J. (2009, September). Ad hoc retrieval with the Persian language. In Workshop of the Cross-Language Evaluation Forum for European Languages (pp. 102-109). Springer, Berlin, Heidelberg.
Efthimiadis, E. N. (1996). Query Expansion. Annual review of information science and technology (ARIST), 31, 121-87.
Farhoodi, M., Mahmoudi, M., Bidoki, A. Z., Yari, A., & Azadnia, M. (2009). Query expansion using persian ontology derived from Wikipedia. World Applied Sciences Journal, 7(4), 410-417.
Hakimian, P., & Taghiyareh, F. (2007, December). Tuning Local Context Analysis for Farsi Documents. In Semantic Media Adaptation and Personalization, Second International Workshop on (pp. 116-121). IEEE.
Hakimian, P., & Taghiyareh, F. (2008, December). Customizing local context analysis for farsi information retrieval by using a new concept weighting algorithm. In 2008 Third International Workshop on Semantic Media Adaptation and Personalization (pp. 45-51). IEEE.
Harman, D., & Buckley, C. (2004, July). The NRRC reliable information access (RIA) workshop. In Proceedings of the 27th annual international ACM SIGIR conference on Research and development in information retrieval (pp. 528-529). ACM.
Hashemi, H. B., & Shakery, A. (2014). Mining a Persian–English comparable corpus for cross-language information retrieval. Information Processing & Management, 50(2), 384-398.
Karisani, P., Rahgozar, M., & Oroumchian, F. (2016). A query term re-weighting approach using document similarity. Information Processing & Management, 52(3), 478-489.
Lavrenko, V., & Croft, W. B. (2017, August). Relevance-based language models. In ACM SIGIR Forum (Vol. 51, No. 2, pp. 260-267). ACM.
Lee, K. S., Croft, W. B., & Allan, J. (2008, July). A cluster-based resampling method for pseudo-relevance feedback. In Proceedings of the 31st annual international ACM SIGIR conference on Research and development in information retrieval (pp. 235-242). ACM.
Mehdi, M., Okoli, C., Mesgari, M., Nielsen, F. Å., & Lanamäki, A. (2017). Excavating the mother lode of human-generated text: A systematic review of research that uses the wikipedia corpus. Information Processing & Management, 53(2), 505-529.
Okoli, C., & Schabram, K. (2010). A guide to conducting a systematic literature review of information systems research. Sprouts, 10-26.
Phan, N., Bailey, P., & Wilkinson, R. (2007, July). Understanding the relationship of information need specificity to search query length. In Proceedings of the 30th annual international ACM SIGIR conference on Research and development in information retrieval (pp. 709-710). ACM.
Robertson, S. E., & Jones, K. S. (1976). Relevance weighting of search terms. Journal of the American Society for Information science, 27(3), 129-146.
Rocchio, J. J. (1971). Relevance feedback in information retrieval. The SMART retrieval system: experiments in automatic document processing, 313-323.
Saboori, F., Bashiri, H., & Oroumchian, F. (2012). Assessment of query reweighing, by rocchio method in farsi information retrieval. International Journal of Information Science and Management (IJISM), 6(1), 9-16.
Salton, G., Wong, A., & Yang, C. S. (1975). A vector space model for automatic indexing. Communications of the ACM, 18(11), 613-620.
Shamsfard, M., Hesabi, A., Fadaei, H., Mansoory, N., Famian, A., Bagherbeigi, S., ... & Assi, S. M. (2010). Semi automatic development of farsnet; the persian wordnet. In Proceedings of 5th global WordNet conference, Mumbai, India (Vol. 29).
Spink, A., Wolfram, D., Jansen, M. B. J., & Saracevic, T. (2001). Searching the web: The public and their queries. Journal of the American Society for Information Science and Technology, 52(3), 226-234.
Wollersheim, D. (2005). Dynamic query expansion for information retrieval of imprecise medical queries. La Trobe University.
Zhang, H. (2013). Query enhancement with topic detection and disambiguation for robust retrieval. Indiana University.
CAPTCHA Image