[صفحه اصلی ]   [Archive] [ English ]  
:: صفحه اصلي :: درباره نشريه :: آخرين شماره :: تمام شماره‌ها :: جستجو :: ثبت نام :: ارسال مقاله :: تماس با ما ::
:: دوره 21، شماره 1 - ( 3-1394 ) ::
دوره 21 شماره 1 صفحات 13-40 برگشت به فهرست نسخه ها
مدل دو مرحله ای شکاف- گلچین برای نمایه سازی خودکار متون فارسی
محمد توکلی زاده راوری*
استادیار دانشگاه یزد ، tavakoli@yazd.ac.ir
چکیده:   (2048 مشاهده)
هدف: به علت خاص بودن برخی از مسائل زبانی، لازم است که مدل‎‎های بومی نمایهسازی خودکار را با توجه به ویژگیهای هر زبان طراحی کرد. این مدلها باید بهگونهای طراحی شود که جامعیت و مانعیت نمایهسازی مورد توجه باشد. هدف این مقاله معرفی و سنجش توانمندی مدل دو مرحلهای شکاف گلچین برای نمایهسازی خودکار مقالات فارسی است. ابتدا الگوریتم کار به تفصیل توضیح داده میشود و سپس همخوانی نتایج حاصل از این الگوریتم با کلیدواژههای نویسنده سنجیده خواهد شد.
روش: مدل نمایهسازی خودکار فارسی بههمراه توضیح مراحل و مسائل مرتبط با آن معرفی خواهد شد. ارزیابی مدل از طریق شاخص دربردارندگی انجام می‌شود که برای تعیین درصد همخوانی بین نمایهسازان مورد استفاده قرار میگیرد. برای این کار، میزان همخوانی اصطلاحات نمایه‌ای که از پیادهسازی الگوریتم این مدل حاصل شدهاند، با کلیدواژههای نویسندگان مقالات بررسی میگردد.
یافته‌ها: یافتهها نشان داد که در 90 درصد از موارد، اصطلاحی که این مدل در یک مقاله بهعنوان پروزنترین اصطلاح تشخیص داده است، مشابه اولین کلیدواژۀ نویسنده آن مقاله است. در کل، بین نتایج این مدل و کلیدواژههای نویسندگان 76 درصد همخوانی وجود داشت که در مقایسه با کارهای قبلی، قابل قبول به نظر میرسد.
اصالت/ارزش: ارزش اولیۀ این کار پرداختن به نمایهسازی خودکار با توجه به ویژگیهای زبان فارسی است. برای پیادهسازی مدل ارائه شده، فرض بر استفاده از زبان عبارات الگودار است که توسط بسیاری از زبانهای برنامهنویسی پشتیبانی میشود و نیاز به نصب و استفاده از جدولهای بانک اطلاعاتی را برای پردازش متن کاهش میدهد. همچنین، مشکل تعیین آستانۀ بالایی اصطلاحات اصلی را حل میکند. علاوه بر آن، با الگوریتمی خاص، حد پایینی را نیز تعیین میکند؛ بهگونهای که دیگر تعداد اصطلاحات گلچین شده به طول متن بستگی ندارد. این امکان، جامعیت و مانعیت نمایهسازی را تضمین میکند.
 
واژه‌های کلیدی: نمایه‎سازی خودکار، زبان فارسی، مدل شکاف – گلچین.
متن کامل [PDF 1442 kb]   (697 دریافت)    
نوع مطالعه: كمّي | موضوع مقاله: نمايه‌سازي و چكيده‌نويسي
دریافت: ۱۳۹۲/۸/۳ | پذیرش: ۱۳۹۴/۳/۱۶ | انتشار: ۱۳۹۴/۳/۱۶
ارسال پیام به نویسنده مسئول

ارسال نظر درباره این مقاله
نام کاربری یا پست الکترونیک شما:

کد امنیتی را در کادر بنویسید >


XML   English Abstract   Print


Download citation:
BibTeX | RIS | EndNote | Medlars | ProCite | Reference Manager | RefWorks
Send citation to:

Tavakolizadeh-Ravari M. Two Steps Break-Cull Model for Automatic Indexing of Persian Texts. تحقيقات اطلاع رساني و كتابخانه هاي عمومي. 2015; 21 (1) :13-40
URL: http://publij.ir/article-1-966-fa.html

توکلی زاده راوری محمد. مدل دو مرحله ای شکاف- گلچین برای نمایه سازی خودکار متون فارسی. تحقيقات اطلاع‌رساني و كتابخانه‌هاي عمومي. 1394; 21 (1) :13-40

URL: http://publij.ir/article-1-966-fa.html



دوره 21، شماره 1 - ( 3-1394 ) برگشت به فهرست نسخه ها
تحقیقات اطلاع‌رسانی و کتابخانه‌های عمومی Research on Information Science and Public Libraries
iranpl
Persian site map - English site map - Created in 0.09 seconds with 32 queries by YEKTAWEB 3705