بررسی مشکلات جستجو و بازیابی تصاویر در موتورهای کاوش برگزیده مبتنی بر ویژگی‌های نگارشی زبان فارسی

نوع مقاله : مقالات پژوهشی

نویسندگان

دانشگاه قم

چکیده

هدف: پژوهش حاضر با هدف تعیین مشکلات جستجو و بازیابی تصاویر در موتورهای کاوش برگزیده مبتنی بر ویژگی‌های نگارشی زبان فارسی انجام شد.
روش: این پژوهش از نوع کاربردی است و برای پاسخ‌گویی به سؤالات پژوهش از روش ارزیابی با مشاهده مستقیم استفاده شد. جامعه آماری پژوهش شامل سه موتور کاوش گوگل، یاهو و بینگ است. برای گردآوری داده‌ها، از سیاهه محقق ساخته استفاده شد و تجزیه و تحلیل داده‌ها در دو سطح آمار توصیفی و استنباطی صورت گرفت.
یافته‌ها: نتایج پژوهش نشان داد که موتورهای کاوش گوگل، بینگ و یاهو بسیاری از ویژگی‌های نوشتاری و معنایی زبان فارسی را در هنگام جستجو و بازیابی تصاویر نادیده می‌گیرند. همچنین مشکلات مربوط به نگارش واژگان مشتق، مشتق- مرکب، انواع جمع‌های فارسی و مکسر عربی، همزه بدون کرسی و استفاده از زبان محاوره در بخش نوشتاری؛ و چند معنایی در بخش معنایی از مشکلات عمده زبان فارسی در جستجو و بازیابی تصاویر از این موتورهای کاوش به‌شمار می‌آیند. به‌علاوه، در بخش معنایی و نوشتاری، قابلیت‌های گوگل در انطباق با زبان فارسی نسبت به همتایانش بیشتر است.

کلیدواژه‌ها


عنوان مقاله [English]

Survey of Image Search and Retrieval Problems in Selected Search Engines based on the Persian Writing Styles

نویسندگان [English]

  • Yaghoub Norouzi
  • Hoda Homavandi
University of Qom
چکیده [English]

Purpose: The purpose of the present study is to investigate the image search and retrieval problems in selected search engines in relation to the Persian writing style challenges.
Methodology: This study is an applied one. In orderto answer the questions an evaluative method and direct observation were used. The aim of the research is to explore the morphological and semantic problems of Persian language in connection with the image search and retrieval among the three major and widespread search engines: Google, Yahoo, and Bing. These search engines can also support Persian language. In order to collect data, a checklist designed by the researcher was used and then the data were analyzed by descriptive and inferential statistics.
Findings: TheResults indicated that Google, Yahoo, and Bing search engines do not pay enough attention to the morphological and semantic features of Persian language during image search and retrieval. This research reveals that seven groups of Persian language features are the major problems in this area. In addition, the results suggested that Google is the best search engine of all in terms of its compatibility with Persian language features.

کلیدواژه‌ها [English]

  • Information retrieval
  • Image retrieval
  • Search engine
  • Writing styles
  • Persian language
اسلامی، محرم (1381). «دشواری‌های پردازش رایانه‌ای خط فارسی». فصلنامه نشر دانش، 17(3)، 32-28.
اکبری نژاد، سعید (1376). «فاصله خالی میان واژه‌ها در ذخیره و بازیابی رایانه‌ای اطلاعات». فصلنامه کتاب، 8(1)،49- 56.
آخیشک، سمیه سادات؛ فتاحی، رحمت‌الله (1391). «تحلیل چالش‌های پیوسته‌نویسی و جدانویسی واژگان فارسی در ذخیره و بازیابی اطلاعات در پایگاه‌های اطلاعاتی». فصلنامه کتابداری و اطلاع‌رسانی، دوره شانزدهم، شماره سوم، 9- 30.
حری، عباس (1372) «کامپیوتر و رسم‌الخط فارسی».فصلنامه تحقیقات اطلاع‌رسانی و کتابخانه‌های عمومی، 3(1)، 6- 11.
حسینی بهشتی، ملوک‌السادات (1386). «معنی‌شناسی واژگانی فرااصطلاحنامه و بازیابی اطلاعات». کتاب ماه کلیات مجموعه اطلاع‌رسانی و کتابداری، 10 (10) ، 30- 37.
داورپناه، محمدرضا (1387). جستجوی اطلاعات علمی و پژوهشی در منابع چاپی و الکترونیکی. تهران: چاپار؛ دبیزش.
راثی ساربانقلی، محمد (1385). «مشکلات جستجو و بازیابی اطلاعات به زبان فارسی در اینترنت، مطالعۀ موردی: کاربران مرکز اینترنت دانشگاه اسلامی واحد شبستر». فصلنامه کتاب، کتابداری و اطلاع‌رسانی، 17(3)، 179- 196.
ستوده، هاجر؛ هنرجویان، زهره (1391). «مروری بر دشواری‌های زبان فارسی در محیط دیجیتال و تأثیرات آنها بر اثربخشی پردازش خودکار متن و بازیابی اطلاعات»، کتابداری و اطلاع‌رسانی، 15(4)، 92-59.
عبدالهی نورعلی، محمدصادق؛ جوکار، عبدالرسول (1388). « چالش‌های شیوه نگارش زبان فارسی در بازیابی اطلاعات از موتورهای کاوش وب». مطالعات تربیتی و روانشناسی، 10(2) ، 67- 90.
گل‌تاجی، مریم؛ بذرگر، سعیده (1389). «بررسی مشکلات ریخت‌شناسی زبان فارسی در سه پایگاه اطلاعاتی مرکز منطقه‌ای اطلاع‌رسانی علوم و فناوری، پژوهشگاه اطلاعات و مدارک علمی ایران و جهاد دانشگاهی»، کتابداری و اطلاع‌رسانی، 13(2)،222-199.
مرتضائی، لیلا (1380). «مسائل زبان و خط فارسی در ذخیره‌سازی و بازیابی اطلاعات». علوم و فناوری اطلاعات، 17(1) ، 24- 29.
نوتس، گری (1382). «راهبردها و شیوه‌های جستجو در اینترنت»، ترجمه سیمین نیازی، فصلنامه کتاب، کتابداری و اطلاع‌رسانی، 14(3)، 126-133.
نوروزی، علیرضا؛ ولایتی، خالید (1389). نمایه‌سازی موضوعی: نمایه‌‌سازی مفهومی. تهران: چاپار.
Hammo, B. (2009). Towards enhancing retrieval effectiveness of search engines for diacritisized Arabic documents. Information Retrieval, 12(3), 300-323. Available at: http://link.springer.com/article/10.1007/s10791-008-9081-9 Accessed (2012 July 19).
Internet world stats: Usage and population statistics, 2015 May 31. http://www.internetworldstats.com/stats7.htm, Accessed (2014 March 25).
Lazarinis, F. (2007, C). At the sharp END evaluating the searching capabilities of commerce websites in a non-English language A Greek case study. Online Information Review, 31(6), 881-891. Available at: http://www.emeraldinsight.com/journals.htm?articleid=1640585. Accessed (2012 July 17).
Lazarinis, F. (2007, A). Web retrieval systems and the Greek language: do they have an understanding? Journal of information science, 33(5), 622-636.
Lazarinis, F. (2008, B). Improving concept-based web image retrieval by mixing semantically similar Greek queries. Program: electronic library and information systems, 42(1), 56-67. Available at: http://www.emeraldinsight.com/journals.htm?articleid=1674242. Accessed (2012 July 17).
Lewandowski, D. (2008). Problems with the use of Web search engines to find results in foreign languages. Online Information Review, 32(4), 668 – 672. Available at: http://www.emeraldinsight.com/journals.htm?articleid=1747662 . Accessed (2012 June 15).
Liu,Y. & et al. (2007). A survey of content-based image retrieval with high-level semantics. Pattern Recognition, 40(1), 262–282. Available at: http://www.sciencedirect.com/science/article/pii/S0031320306002184. Accessed (2012 January 1).
Moukdad, H., Large, A. (2001). Information Retrieval from Full-Text Arabic Databases: Can Search Engines Designed for English Do the Job? Libri, 51(3), 63- 74. Available at: www.librijournal.org/pdf/2001-2pp63-74.pdf. Accessed (2014 May 4)
Notess, G.R. (1997). Internet Search Techniques and Strategies. Online, 21(4), 63-66. Available at: http://www.questia.com/library/1G1-19545628/internet-search-techniques-and-strategies. Accessed (2013 December 11).
TASI (Technical Advisory Service for Images), 2008 January 25, Review of Image Search Engines, Accessed 2013 April 20, available http://www.jiscdigitalmedia.ac.uk/guide/review-of-image-search- engines/
Tawileh, W., Mandl, Th. and Griesbaum, J. (2010). Evaluation of five web search engines in Arabic language. 10th International Conference on Intelligent Systems Design and Applications, 2010, Cairo, Egypt, retrieved 2013 August 6, available at: www.kde.cs.uni-kassel.de/conf/lwa10/.../ir1.pdf.
Zachary, J., Lyengar, s. s. and Barhen, J. (2001). Content based image Accessed and information theory: a general approach. Journal of the American society for information science and technology, 52(10), 840-852. Available at: http://onlinelibrary.wiley.com/doi/10.1002/asi.1138/pdf. Retrieved 2013 January 02.
Zhang, J., Lin, S. (2007). Multiple language supports in search engines. Online Information Review, 31(4),516-532. Available at: http://www.emeraldinsight.com/journals.htm?articleid=1621798 . Accessed (2012 July 13).
CAPTCHA Image