نوع مقاله : مقالات پژوهشی

نویسندگان

1 دانشگاه علامه طباطبایی تهران

2 دانشگاه شهید بهشتی تهران

چکیده

هدف: پژوهش حاضر با هدف تعیین میزان دقت در بازیابی منابع شنیداری با استفاده از روش خوشه بندی و به کارگیری الگوریتم کی- مینز انجام شده است.
روش: پژوهش حاضر از نوع کاربردی و روش پژوهش نیمه تجربی و از طریق مشاهده مستقیم است. به منظور بررسی میزان دقت در بازیابی منابع شنیداری، مجموعه ای شامل 23 آلبوم منتشر شده در تابستان سال 1391 انتخاب شد. ابتدا پیشینه های موجود در هر آلبوم براساس استاندارد فراداده ای پی.بی.کور فهرست نویسی شد. در گام بعدی هر یک از عناصر فراداده مزبور به عنوان یک خوشه و توضیحگرهای آن به عنوان متغیر در نظر گرفته شده و الگوریتم کی- مینز در محیط نرم افزاری اس. پی. اس. اس بر روی داده ها اجرا شد و فاصله هر پیشینه تا مرکز خوشه به دست آمد.
یافته ها: با توجه به میزان فاصله هر پیشینه تا مرکز خوشه و ملاک قرار دادن این مقدار به عنوان میزان دقت در بازیابی منابع، پیشینه هایی که بیشترین شباهت به مرکز هر خوشه را دارند در کمترین فاصله، و پیشینه هایی که کمترین شباهت با مرکز خوشه را دارند در بیشترین فاصله با آن قرار گرفتند و میزان دقت برای هر خوشه و توضیحگر محاسبه گردید.

کلیدواژه‌ها

عنوان مقاله [English]

The Rate of the Precision in the Audio Visual Retrieval Resource by K-Means Algorithm

نویسندگان [English]

  • Tahereh Abolghasem Mosalman 1
  • Esmat Momeni 1
  • Mohsen Haji Zeinolabedini 2

1 Allameh tabatabaee university

2 Shahid Beheshti University

چکیده [English]

Purpose: The aim of this paper is to survey the rate of the precision in the audio and visual material retrieval by clustering techniques and k- means algorithm.
Methodology: The type of the research method is experimental. For the purpose of this paper, twenty- three albums are studied directly through observation. Albums published in summer 1391(solar). Songs catalogs according to PBCore metadata and one of the elements in this metadata choose instead of variable. In the next step, k- means algorithm in SPSS software was performed. Finally, the distance between any records with cluster center was calculated.
Finding: After performing k- means algorithm, the cluster center for the four clusters of intellectual content, intellectual property, instantiation, and extensions were determined. Due to the distance between each record and the center of the cluster this value is measured as the precision of the resource retrieval records. The closer to the center of each cluster the shorter the distance would be. However, the record-with the highest similarity to the center of the cluster has the greatest distance. The precision is calculated at 99 percent.

کلیدواژه‌ها [English]

  • Precision
  • Audio and visual material
  • PBCore metadata
  • Clustering
  • K- means algorithm
بخشی، مریم، فیضی درخشی، محمدرضا (1389). مطالعه و بررسی الگوریتم های خوشه بندی مناسب برای یافتن پیشینه های تکراری در پایگاه داده ها. مقاله ارائه شده در سومین همایش ملی مهندسی کامپیوتر و فناوری اطلاعات، همدان.
حسینی، سید مهدی (1390). بررسی عناصر و مؤلفه های رابط کاربر در نظام های بازیابی اطلاعات مبتنی بر خوشه بندی. پژوهشگاه علوم و فناوری اطلاعات ایران، 26 (3)، 625-653.
طاهریان فرد، الهه (1389). ارائه روشی جدید در خوشه بندی اطلاعات با استفاده از ترکیب الگوریتم کشورهای استعماری و کی- مینز. پایان نامه کارشناسی ارشد، دانشکده آموزش های الکترونیکی دانشگاه شیراز، شیراز.
عامری، فاطمه، ولدان زوج، محمدجواد، مختارزاده، مهدی (1386). بررسی تکنیک های مختلف خوشه بندی به روش نظارت نشده. مقاله ارائه شده در همایش ژئوماتیک 86، تهران.
کرمانی حبیب آبادی، آناهیتا (1390). ارزیابی تأثیر واژگان عناوین استنادی در مقایسه با استفاده از اشتراک استنادی در خوشه بندی پروانه های ثبت اختراع. پایان نامه کارشناسی ارشد، دانشگاه شهید بهشتی، تهران.
قاسمی، محمد سعید (1388). خوشه بندی زیر کلمات دستنویس فارسی. پایان نامه کارشناسی ارشد، دانشگاه اراک، دانشکده فنی و مهندسی، اراک.
قدیمی، علی (1387). مطالعه فراداده دیداری شنیداری. بازیابی در 20 آبان، 1391، از http://ali2ghadimi.blogfa.com/post-33.aspx
Byrd, Donald, Crawford, Tim, (2001). Problems of music information retrieval the real world. information processing and management, 38, 249-272.
Clarskson, Brian, Pentland, Alex(1999). Unsupervised clustering of ambulatory audio and video. Perceptual computing MIT media lab, 6, 3037-3040.
Diekreoger, Danny (20012). Can song lyrics predict genre?. Avalible http://cs229.stanford.edu/proj2012/Diekroeger-CanSongLyricsPredictGenre.pdf
Geraci, Filippo, (2008). Fast clustering for web information retrieval. "unpublished thesis phd", university of studi di siena, cicilo.
Iso 1999:2013. (n.d). Acoustics—Estination of noise-induced hearing loss. Retrived March 28,2013, from http://www.iso.org/iso/catalogue_detail.htm?csnumber=45103.
Johnson A. Richard, & Wichern Dean w. (2007). Applied musltivariate statistical analysis. Pearson:united state.
Liu, Peiyu, Zhu, Zhenfang, Zhao, Lina (2009). Research on information retrieval system based on Ant clustering algorithm. Journal of software, 9, 1033- 1038.
Lucky U, Oghenetega, Amugen, Sarah, (2014). Availability and use of audiovisual resources in two selected tertiary institutions of Nigeria." IOSR journal of humanities and social science,19, 88-92.
Panagaksi, Benetos. (2008). Music genre classification: a multilinear approach. Available at: http://developer.echonest.com/docs/v4/_static/AnalyzeDocumentation.pdf
R.Peterson Angela. Visual data mining: using parallel coordinate plots with K-means clustering and color to find correlations in a multidimensional dataset [‌thesis]. Pennsylvania: the department of computer science, 2009.
Sen, Abhishek (2014). Automatic music clustering using audio attributes. International journal of computer science engineering,6, 307-312.
Shindler, Michael (2011). Clustering for information analysis and retrieval: algorithms and application. " unpublished thesis phd", university of California, Los Angeles
Torra, Vicenc, Lanau, Sergi, Miyamoto, Sadaaki, (2010). Fuzzy clustering for indexing in the Gambal information retrieval system. Retrieval in 20 january 2013 available: www. Psu.edu
Tzanetakis, George, Cook, Perry (2012). Musical genre classification of audio signals. IEEE Transactions on Speech and Audio processing,10,293-302.