0% Complete
صفحه اصلی
/
یازدهمین كنفرانس بين المللی مهندسی صنايع و سيستم ها
ترکیب روشهای نمونهگیری مجدد و تصمیمگیری چندمعیاره برای بهبود تشخیص دیابت در دادههای نامتوازن
نویسندگان :
علی اُمّی
1
عباس فروزانفر
2
1- دانشگاه صنعتی شریف
2- دانشگاه صنعتی شریف
کلمات کلیدی :
دادههای نامتوازن،بیش نمونهگیری،کم نمونهگیری،یادگیری ماشین،طبقهبندی،تصمیمگیری چندمعیاره
چکیده :
در این تحقیق، چالشهای طبقهبندی دادههای نامتوازن، بهویژه در زمینه دادههای پزشکی مانند تشخیص دیابت، موردبررسی قرار گرفته است. این مطالعه تأثیر روشهای مختلف نمونهگیری مجدد، شامل بیش نمونهگیری و کم نمونهگیری، در بهبود عملکرد مدلهای طبقهبندی را ارزیابی میکند. این پژوهش با ترکیب گسترده روشهای بیش نمونهگیری (چهار روش) و کم نمونهگیری (چهار روش) و بهکارگیری چارچوب تصمیمگیری چندمعیاره برای وزندهی معیارها و رتبهبندی، یک چارچوب یکپارچه و عملی برای انتخاب بهینه روشهای نمونهگیری مجدد در تشخیص دیابت از مجموعهداده بزرگ BRFSS ارائه میدهد. الگوریتمهای یادگیری ماشین مانند XGBoost و ماشین بردار پشتیبان (SVM) بهکارگرفتهشده و تأثیر این روشها بر دقت مدلها ارزیابی شده است. نتایج نشان میدهند که به طور میانگین، معیار حساسیت در تمام روشهای نمونهگیری مجدد بهبود داشته و به طور متوسط %87.32 افزایش یافته است. این افزایش بهویژه در روش XGBoost بیشترین سهم را داشته است. همچنین، در تمامی روشها معیار F1-score نیز بهبود قابلتوجهی نشان داده است. اگرچه معیار AUC تغییرات چندانی نداشت، اما این نتایج نشاندهنده بهبود عملکرد مدلها در شناسایی کلاس اقلیت (افراد دیابتی) هستند. برای انتخاب بهترین روشهای نمونهگیری، از روش تصمیمگیری چندمعیاره (MCDM) شامل تحلیل سلسه مراتبی (AHP) برای وزن دهی به معیارها و روش MAIRCA برای رتبه بندی و تعیین اولویت میان روشهای طبقهبندی و نمونهگیری مجدد استفاده شده است.
لیست مقالات
لیست مقالات بایگانی شده
طراحی زنجیره تامین دارو: رویکرد یکپارچه
زهرا خوجه - طوبی درویش محمدی - محمد مهاجر تبریزی
برنامهریزی و زمانبندی زنجیرهتامین دارویی با رویکرد اقتصاد چرخشی
فریما پورحسین دیگه سرا - سعید امامی - ابراهیم اسدی گنگرج
طراحی زنجیره تأمین انرژی تجدید پذیر مبتنی بر پسماند تحت شرایط عدم قطعیت
مرتضی گفتی - پروانه مهری - فاطمه صبوحی - سیدفرید قادری
بهره وری سبز و تاثیر آن در صنعت (مطالعه موردی: کارخانه کاغذ کرمان)
فهیمه تنهایی - هدیه عرب پور - سید داود احمدی مطلق
انتخاب بهترین ترتیب استفاده از قطعات ذخیره در مسائل تخصیص افزونگی با قطعات غیریکسان
هادی قلینژاد - رمضان خسروی
مروری نظاممند بر راهبردهای پلاتوئینگ در طراحی شبکههای لجستیکی صنعت خودرو با رویکرد ارتقاء رقابتپذیری
حدیث گرجعلی بردشاهی - فاطمه بنی اسدی - میلاد صلواتی پور
ارزیابی تطبیقی روش ترکیبی موجک-فوریه و تکنیک های مرجع برای تشخیص خطای مبتنی بر تصویر در کنترل کیفیت صنعتی
زهرا خدادادی چمگردانی - مرتضی رجب زاده
یک مدل ریاضی دوهدفه برای بازیافت پسماندهای پلاستیکی با اهداف زیستمحیطی و اقتصادی
ندا خسروی فرد - ناعمه زرین پور - مرتضی کاظمی
کاهش مصرف انرژی در شبکه های حسگر بی سیم: بهره گیری از الگوریتم ژنتیک برای خوشه بندی گره های حسگر
حمید کریمی
The Impact of Individual Entrepreneurial Characteristics on Project Performance: A Machine Learning-Based Predictive Framework
Narges Ghobadi - Amin Jamili - Mohammad Fattah
بیشتر
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 43.7.0