جلسه دفاع از پایان‌نامه: آقای سعید سربازی آزاد، گروه مهندسی کامپیوتر

خلاصه خبر: یک الگوریتم تطبیقی جهت انتخاب خصیصه در دادههای بیان ژن با استفاده از معیارهای پیچیدگی

  • عنوان: یک الگوریتم تطبیقی جهت انتخاب خصیصه در دادههای بیان ژن با استفاده از معیارهای پیچیدگی
  • ارائه‌کننده: سعید سربازی آزاد
  • استاد راهنما: دکتر محمد صنیعی
  • استاد ناظر داخلی اول: دکتر مهدی آبادی
  • استاد ناظر خارجی اول: دکتر حسن نادری (دانشگاه: علم و صنعت )
  • استاد مشاور اول: دکتر سعید جلیلی
  • مکان: کلاس 01/6
  • تاریخ: 97/11/15
  • ساعت: 16:00

چکیده: تشخیص به‌موقع و صحیح بیماری تأثیر زیادی در میزان کمک به فرد بیمار و جامعه دارد. یکی از انواع مهم داده در تشخیص بیماری‌هایی همچون سرطان، داده‌های میکرو آرایه بیان‌ژن است. مهم‌ترین ویژگی داده‌های میکرو آرایه تعداد ابعاد بسیار زیاد و در مقابل تعداد کم نمونه‌ها است. طبق تحقیقات انجام‌شده بسیاری از خصیصه‌های موجود در این داده‌ها کمک شایانی به حل مسئله و تشخیص بیماری نمی‌کنند. از طرفی در برخی داده‌ها وجود این ابعاد باعث ابهام و پیچیدگی بیشتر مسئله می‌شود. به‌همین‌خاطر در دو دهه اخیر پژوهشگران زیادی درصدد کاهش ابعاد این مسائل با روشهای مختلف برآمده‌اند. انتخاب خصیصه‌ها یکی از روش‌های کاهش ابعاد است که در آن خصیصه‌های بااهمیت را انتخاب و بقیه را حذف می‌کنند. پژوهشگران در تحقیقات انجام‌شده تابه‌حال توانسته‌اند تعداد خصیصه‌ها را به‌خوبی کاهش دهند، اما در برخی مجموعه‌داده‌ها هنوز جای افزایش دقت وجود دارد. تابحال محققانی که از معیارهای پیچیدگی داده برای کاهش ابعاد استفاده کرده‌اند، از آنجایی که این فراویژگی‌ها همبستگی و وابستگی بین خصیصه‌ها را در نظر نمی‌گیرند، در برخی موارد دقت بالایی حاصل نشده‌است. از طرف دیگر در مواردی که از الگوریتم ژنتیک استفاده‌شده، فراویژگی‌ها در نظر گرفته نشده‌اند و از این رو، دقت پایین و زمان اجرای بالایی دارند. در این پژوهش، روشی برای انتخاب خصیصه‌ها بر اساس میزان پیچیدگی مجموعه‌داده ارائه می‌شود. روش پیشنهادی از یک الگوریتم تکاملی که ایده اولیه آن از الگوریتم کلونی مورچه‌ها گرفته شده‌است، استفاده می‌کند. دانش اولیه یا پیش‌پردازش مسئله شامل اعمال فراویژگی‌ها روی مجموعه‌داده و ایجاد یک بردار رای یا باور بر اساس میزان اهمیت هر خصیصه است. هدف از بکارگیری معیارهای پیچیدگی داده، تبدیل ورودی، به مسئله‌ای جدید با حداقل میزان ابهام و پیچیدگی است. برای انتخاب خصیصه‌ها الگوریتم ژنتیک به‌نحوی پیاده‌سازی شده که خصیصه‌هایی با اهمیت بیشتر (بر اساس بردار رای) ترجیحا در دنباله‌ژن انتخابی حضور داشته باشند. پنج مورد از داده‌های باینری با نام‌های Gli85, Colon, DLBCL, CNS, SMK مورد آزمایش قرار گرفته‌اند. نتایج حاصل از اعمال روش نشان می‌دهد دقت بدست‌آمده به استثنای داده SMK، بهترین دقت و میزان آن 100 درصد است. قابل‌ذکر است که روش ارزیابی 5-flod cross validation می باشد.
کلمات کلیدی: انتخاب خصیصه، کاهش ابعاد، بیان‌ژن، میکرو آرایه، پیچیدگی داده، فراویژگی


14 بهمن 1397 / تعداد نمایش : 1571