پیاده‌سازی مدل بازیابی خبرگان با استفاده از روش تحلیل معنای نهان و گراف زمان‌دار

نوع مقاله : مقالات پژوهشی

نویسندگان

1 دانش‌آموخته دکتری علم اطلاعات و دانش‌شناسی، دانشگاه تهران، تهران، ایران.

2 دانشیار، علم اطلاعات و دانش‌شناسی، دانشگاه تهران، تهران، ایران

3 استادیار، مدیریت فناوری اطلاعات، دانشگاه تهران، تهران، ایران.

چکیده

مقدمه: خبره­یابی شناسایی افراد با دانش و مهارت کافی در زمینه‌ای خاص و معرفی آنها به‌عنوان خبره در آن زمینه است. بازیابی افراد خبره زیرمجموعه‌ای از بازیابی اطلاعات است که هدف آن ارائه رتبه‌بندی از افرادی است که دارای دانش درزمینۀ خاصی هستند. کار خبره­یابی خودکار به‌دلیل فراوان‌بودن اطلاعات خبرگی و منابع داده چالش‌برانگیز است. هدف این پژوهش مقایسه عملکرد خبره‌یابی مدل بازیابی اطلاعات تحلیل معنای نهان و نیز گراف زمان­دار با مدل پایه بود.
روش‌شناسی: روش پژوهش تجربی است و در کنار آن از روش کتابخانه­ای نیز استفاده شده است. روشی که در پژوهش حاضر برای بازیابی مقالات استفاده می‌شود ال‌اس‌ای یا بازیابی معنای نهان است که بر روی مقالات مجموعه آزمون تهیه‌شده از وب‌آو‌ساینس پیاده شد. این اسناد شامل مقالات انگلیسی علم اطلاعات و دانش­شناسی است که از 1989 تا 2018 در پایگاه وب‌آوساینس در ذیل مقوله علم اطلاعات و دانش‌شناسی نمایه شده است. تعداد کل این مقالات 126924، پرس­وجوهای ساخته‌شده توسط کاربران به همه این مقالات عرضه شد. اسناد بازیابی‌شده مورد قضاوت ربط قرار گرفتند و پس از انجام قضاوت ربط اسناد توسط شرکت‌کنندگان در پژوهش، عملکرد مدل‌ بازیابی اطلاعات توسط سنجه‌های ارزیابی نظام‌های بازیابی اطلاعات اندازه‌گیری شد. سنجه‌های ارزیابی که در پژوهش حاضر مورداستفاده قرار گرفتند عبارت‌اند از میانگین متوسط دقت، میانگین معکوس رتبه، و دقت در سطح پنج نتیجه اول بازیابی شده. حاصل سنجه­های محاسبه‌شده با مقدار هر یک از این سنجه‌ها در مدل پایه مقایسه شد. برای دخالت دادن عامل زمان از گراف زمان­دار استفاده گردید. پس از دخالت دادن عامل زمان نویسندگانی که بیشترین کار مرتبط و نیز شاخص خرد شبکه اجتماعی‌ آنها بیشتر بود به‌عنوان خبره معرفی گردید. سپس ده پرس‌وجو از مدل پژوهش حاضر و مدل پایه به‌طور تصادفی ساده انتخاب گردید و برای قضاوت در اختیار هشت نفر از افرادی که توسط جامعه دوم معرفی گردید قرار گرفت و نتایج حاصل باهم مقایسه گردید.
یافته‌ها: میزان به‌دست‌آمده از هر یک از سنجه­های بازیابی اطلاعات یعنی میزان دقت در سطح پنج نتیجه اول، میانگین متوسط دقت (MAP) و میانگین معکوس رتبه (MRR) به‌ترتیب با مقدار 895/0، 839/0 و 909/0، مدل بازیابی تحلیل معنای نهان عملکرد بهتری نسبت به مدل پایه داشت؛ و این امر به‌دلیل بهتربودن عملکرد بازیابی به‌روش کاهش ابعاد نسبت به تطابق کلیدواژه‌ای است. چون در این روش از نمایه‌سازی معنای نهان استفاده می­شود که نوعی نمایه‌سازی مفهومی است و از روش آماری حداقل مربعات بهره می­برد و نمایه‌سازی ذکرشده با به‌کارگیری این روش آماری استخراج می­شود طبق تعریف پژوهشگران، خبره کسی است که بیشترین کار مرتبط با مجموع پرس­وجوها در ده سال اخیر را داشته و دارای بالاترین مقدار در مرکزیت درجه­ای، نزدیکی، بینابینی و بردار ویژه باشد. تعداد 10 پرس‌وجو از هر پژوهش به‌طور مجموع 20 پرس­وجو به‌صورت اتفاقی انتخاب گردید و به خبرگان مشخص‌شده هر پژوهش توسط جامعه آماری سوم نمره صفر یا یک داده شد. مجموع نمرات برای هرکدام نشان می­دهد دخالت‌دادن عامل زمان و استفاده از گراف زمان‌دار ازنظر نفر اول به میزان 3 نمره و ازنظر نفر دوم نیز به‌اندازه 3 نمره و ... از مدل پایه پیشی گرفته است.
نتیجه‌گیری: نتایج نشان دادند که مدل ال‌اس‌ای در مقایسه با مدل پایه جهت بازیابی اسناد مرتبط عملکرد بهتری داشته است و نیز استفاده از گراف زمان­دار نسبت به مدل پایه عملکرد بهتری را نشان داده است.
 

کلیدواژه‌ها

موضوعات


Baeza-Yates, R. & Ribeiro-Neto, B. (1999). Modern Information Retrieval. Addison-Wesley, Wokingham, UK, [In Persian]
Atapour, H. (2016). Investigating the improvement of expert authors finding model on the basis of persons-documents associations. (Unpublished Phd's thesis), University of Tehran. Faculty of Information Science and Knowledge Studie. Retrieved on 12/11/2017 from https://ganj.irandoc.ac.ir/viewer/55cff892e865583a5b67c568a357516b?sample=1 [In Persian]
Nazari, M., Habibi, M. (2016). Review of novel methods LDA, LSA and PLSA in Textmining. The First International Conference on new vistas in Electrical and Computer Engineering. retrieved on 5/20/2023 from https://civilica.com/doc/555595
Sarmad, Z., Bazargan, A. & Hejazi. E. (2011). Research methods in behavioral sciences. Tehran. Agah.
Askari, A., Verberne, S. & Pasi, G. (2022). Expert Finding in Legal Community Question Answering.ArXiv.2202.07667V3[cs.IR].
https://doi.org/10.48550/arXiv.2201.07667
Balog, K. (2008). People search in the enterprise. PhD thesis, University of Amsterdam. https://doi.org/10.1145/1480506.1480526
Berry, M.W., Dumais, S.T., O’Brien, G.W. (1995). Using Linear Algebra for Intelligent Information Retrieval. SIAM Review. Vol.37. No.4. pp. 575-595. https://doi.org/10.1137/1037127
Berry, M.W., Dumais, S.T. & Shippy, A.T (1995). A case study of latent semantic indexing. Tech. Rep CS-95-271, University of Tennessee, Knoxville, January http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.48.1929
Bogers, T., Kox, K., & Van Den Bosch, A. (2008). Using Citation Analysis for Finding Expert in Workgroups. In Proc. DIR, pp. 21-28. Retrieved on 10/02/2019 from     https://www.semanticscholar.org
Campell, C.S., Maglio, P.P., Cozzi, A., & Down, B. (2003). Expertise identification using email communications. In Proceedings of twelfth international conference on Information and knowledge management. pp. 528-531. ACM https://doi.org/10.1145/956863.956965
Chen, C.M., Paul, R.L. (2001). Visualizing a Knowledge domain’s intellectual Structure. IEEE Computer, vol. 34. No.3. 67-71. Retrieved on 25/10/2018 from http://www.pages.drexel.edu/~cc345/papers/ieeecomputer2001.pdf
Cheng, B. (2005). Towards Understanding Latent Semantic Indexing. 25/10/2018 from: http://www.cs.ualberta.a/TechReports/2003/TR03-03/TE03-03.pdf
Daud, A., Li, J., Zhou, L., Muhammad, F. (2010). Temporal Expert Finding through Generalized Time Topic Modeling. Knowledge-Based System. Pp.615-625. https://doi.org/10.1016/j.knosys.2010.04.008
Deerwester, S., Dumais, s. T. Furnas, G. W., Landauer, T. K. (1990). Indexing by Latent Sematic Analysis. Journal of the American Society of Information Science. Vol. 4. No.6. pp. 391-407. Retrieved on 25/10/2018 from http://lsa.colorado.edu/papers/JASIS.lsi.90.pdf
Evangelopoulos, Nicholas, E. (2013). Latent Semantic analysis. WIREs Cogn Sci, 4: 683-692. https://doi.org/10.1002/wcs.1254
Ehrlich, K., Lin, C. Y., & Griffiths-Fisher, V. (2007). Searching for experts in the enterprise: combining text and social network analysis. In Proceedings of the 2007 international ACM conference on supporting group work (pp. 117-126). ACM. Retrieved on 25/10/2018 from http://www.sciweavers.org/publications/searching-experts-enterprise-combining-text-and-social-network-analysis.
Fang, H. and Zhai, C. (2007). Probabilistic models for expert finding. In ECIR, pages 418–430 DOI: 10.1007/978-3-540-71496-5_38
Fu, Y., Xiang, R., Zhang, M., Liu, Y., & Ma, Sh. (2006). A PDD-Based searching Approach for Expert Finding in International Information Management. In AIRS, LNCS 482, pp. 43-53. DOI: 10.1007/11880592_4
Li, J., Tang, J., Zhang, J., Luo, Q., Liu, Y., & Hong, M. (2007). Eos: expertise oriented search using social networks. In Proceedings of the 16th international conference on World Wide Web (pp. 1271-1272). ACM. DOI:10.1145/1242572.1242803
Lightenberg, Wouter, Pei, Yulong. (2017). Introduction to Temporal. Benchmark.ArXiv: 1703.02852[cs.sl. https://doi.org/10.48550/arXiv.1703.02852
Kanhabua, N, Nøvag, K. (2010). Determining Time of Queries for Re-ranking Search Results. Retrieved on 25/10/2018 from at: https://pdfs.semanticscholar.org/be2b/eae7c24866b270ea1d583ac8d2daa8e91770.pdf
Macdonald, C. (2009). The voting model for people search. PhD thesis. University of Glasgow. Retrieved on 25/10/2018 from: https://theses.gla.ac.uk/609/
Magerman, T.; Looy, B.V. & Song, X. (2010). Exploring the feasibility and accuracy of Latent Semantic Analysis based text-mining techniques to detect similarity between patent and scientific publications. Scientometrics, Vol. 82, No. 2, 289-306. https://doi.org/10.1007/s11192-009-0046-6
 Mathews, L., Kanmani, S.D. (2012). A Survey on Temporal Information Retrieval Systems. International Journal of Computer Applications. Vol. 58. No. 4. pp. 24-28 Retrieved on 25/10/2018 from https://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.736.6511&rep=rep1&type=pdf
Michail, O. (2015). An Introduction to Temporal Graphs: An Algorithmic Prospective. Retrieved on 29/12/2018 from: https:arixv.org
 Omidvar, A., Garakani, M., & Safarpour, R. (2014). Context based user rankig in forums for expert finding using WordNet dictionary and social network analysis. Inf Techno Manag. 15: 51-63. https://doi.org/10.1007/s10799-013-0173-x
Salton, G., Yang, C., &, Wong, A. (1975). A Vector Space Model for Automatic Indexing. Communication of the ACM. Vol. 18, No. 11, pp. 613-620 https://doi.org/10.1145/361219.361220.
Sanderson, M. (2010). Test Collection based evaluation of Information retrieval systems. Foundation and Trends in Information retrieval. 4(4), 247-37. Retrieved on 27/10/2018 from: https://www.ccs.neu.edu/home/vip/teach/IRcourse/IR_surveys/FnTIR.pdf 5
Schwartz, M. F. & Wood, D. C. M. (1993). Discovering shared interests using graph analysis. Commun. ACM, 36(8), 78–89. https://doi.org/10.1145/163381.163402
Serdyukov, P. & Hiemstra, D. (2008). Modeling Documents as Mixtures of Person for Expert Finding. In ECIR, LNCS 4956, pp. 309-320. DOI: 10.1007/978-3-540-78646-7_29
Zhang, J., Ackerman, M. S., & Adamic, L. (2007). Expertise networks in online communities: structure and algorithms. In Proceedings of the 16th international conference on World Wide Web (pp. 221-230). ACM. https://doi.org/10.1145/1242572.1242603
Zhang, J. Tang, J & Li, J. (2007). Expert Finding in a Social Network. In DASFAA, LNCS 4443, pp. 1066-1069. DOI: 10.1007/978-3-540-71703-4_106
 Zhang J. Tang, J., Liu, L., & Li, J. (2008). A Mixture for Expert Finding. PAKDD, LANI 5012. Pp. 466-478. DOI: 10.1007/978-3-540-68125-0_41
Zhou, D., Orshanskiy, S., Zha, H., & Giles, C.L. (2007). Co-Rankig Authors and Documents in a Heterogeneous Network. IEEE Computer Society. pp. 739-744. DOI 10.1109/ICDM.2007.57
 
CAPTCHA Image