دوره و شماره : قابل انتشار
نویسندگان : سینا دامی * و کامران تاجیک

چکیده :
در زمینه سازمان‌دهی متون پزشکی، فعالیت‌های پژوهشی محدودی انجام شده که هرکدام با رویکردهای متفاوتی سعی در بهبود سازماندهی دسترسی به این متون را داشته‌اند. با این وجود یک شکاف مهم درپژوهش‌های انجام شده در این حوزه ملاحظه شده و آن این است که بهره‌گیری چندانی از تحلیل‌های معنایی برای سازماندهی اسناد پزشکی صورت نگرفته است. در این پژوهش به منظور رفع این شکاف تحقیقاتی به ارایه روشی برای سازماندهی معنایی اسناد پزشکی با استفاده از رویکرد معنایی مبتنی بر هستان‌شناسی پرداخته شد که توانست سازماندهی اسناد پیچیده پزشکی را با تکنیک‌های معنایی بطور موثرتر و کارآمدتر به انجام برساند. برای بخش داده‌های متنی مورد نیاز این پژوهش از مجموعه داده متنی پزشکی MeDAL استفاده شده است. مجموعه داده متنی پزشکی MeDAL، یک مجموعه داده آموزشی بزرگ برای استفاده در پردازش زبان طبیعی است که برای درک زبان طبیعی پیش از آموزش در حوزه پزشکی طراحی شده است. برای سنجش نتایج حاصله برحسب متریکهای ارزیابی از مقایسه روش پیشنهادی با سه روش دیگر مبتنی بر خوشه‌بندی FCM بدون آنتولوژی و الگوریتم خوشه‌بندی EM با/ بدون آنتولوژی استفاده شده است. نتایج تجربی نشان داد که روش پیشنهادی در بیشتر حالت‌های آزمون با متریک‌های صحت، دقت و معیار-F از سایر روش‌های مورد مقایسه بهتر عمل کرده و تنها در بخش کوچکی از آزمایشات، همپای سایر روش‌ها یا اندکی ضعیف‌تر عمل کرده است؛ اما بطور میانگین مشاهده شد که روش پیشنهادی دارای برتری قابل ملاحظه‌ای نسبت به روش‌های مورد مقایسه بوه است.

کلمات کلیدی :
پردازش زبان طبیعی، زبان شناسی رایانشی، خوشه‌بندی اسناد پزشکی، تحلیل معنایی متن، هستان‌شناسی


مشاهده مقاله
35