0% Complete
صفحه اصلی
/
یازدهمین كنفرانس بين المللی مهندسی صنايع و سيستم ها
ترکیب روشهای نمونهگیری مجدد و تصمیمگیری چندمعیاره برای بهبود تشخیص دیابت در دادههای نامتوازن
نویسندگان :
علی اُمّی
1
عباس فروزانفر
2
1- دانشگاه صنعتی شریف
2- دانشگاه صنعتی شریف
کلمات کلیدی :
دادههای نامتوازن،بیش نمونهگیری،کم نمونهگیری،یادگیری ماشین،طبقهبندی،تصمیمگیری چندمعیاره
چکیده :
در این تحقیق، چالشهای طبقهبندی دادههای نامتوازن، بهویژه در زمینه دادههای پزشکی مانند تشخیص دیابت، موردبررسی قرار گرفته است. این مطالعه تأثیر روشهای مختلف نمونهگیری مجدد، شامل بیش نمونهگیری و کم نمونهگیری، در بهبود عملکرد مدلهای طبقهبندی را ارزیابی میکند. این پژوهش با ترکیب گسترده روشهای بیش نمونهگیری (چهار روش) و کم نمونهگیری (چهار روش) و بهکارگیری چارچوب تصمیمگیری چندمعیاره برای وزندهی معیارها و رتبهبندی، یک چارچوب یکپارچه و عملی برای انتخاب بهینه روشهای نمونهگیری مجدد در تشخیص دیابت از مجموعهداده بزرگ BRFSS ارائه میدهد. الگوریتمهای یادگیری ماشین مانند XGBoost و ماشین بردار پشتیبان (SVM) بهکارگرفتهشده و تأثیر این روشها بر دقت مدلها ارزیابی شده است. نتایج نشان میدهند که به طور میانگین، معیار حساسیت در تمام روشهای نمونهگیری مجدد بهبود داشته و به طور متوسط %87.32 افزایش یافته است. این افزایش بهویژه در روش XGBoost بیشترین سهم را داشته است. همچنین، در تمامی روشها معیار F1-score نیز بهبود قابلتوجهی نشان داده است. اگرچه معیار AUC تغییرات چندانی نداشت، اما این نتایج نشاندهنده بهبود عملکرد مدلها در شناسایی کلاس اقلیت (افراد دیابتی) هستند. برای انتخاب بهترین روشهای نمونهگیری، از روش تصمیمگیری چندمعیاره (MCDM) شامل تحلیل سلسه مراتبی (AHP) برای وزن دهی به معیارها و روش MAIRCA برای رتبه بندی و تعیین اولویت میان روشهای طبقهبندی و نمونهگیری مجدد استفاده شده است.
لیست مقالات
لیست مقالات بایگانی شده
کاربرد قانون بنفورد در تحلیل بازارهای مالی: شواهد تجربی از بازار بورس تهران
مرضیه اسعدی - افسانه دلشاد
شناسایی و اولویتبندی موارد ارزشآفرینی افقی در شرکتهای چندکسب و کاره با استفاده از روشهای MCDM
محمّدرضا اخوان انوری - کامیار رئیسیفر
مسیریابی و جانمایی بهینه خودرو همراه با کمینه سازی هزینه لجستیکی در سیستم حمل و نقل بین شهری
مروارید زاهدی فرد - علی میرشاهی - سمیر قربانی - رضا طهماسبی - سید فرزام رحیمی رهبر
طراحی اقتصادی نمودار کنترلی X ̅ با اندازه نمونه متغیر و اعمال تابع زیان خطی
مسعود توکلی
Risk Management of Knowledge Management Implementation Project in an Organization under the Corona Virus (COVID-19) Situation – Case Study of Dena Holding
Iman Naderi - Abbas Afrazeh - Maryam Ashrafi
توسعه مدل ریاضی زمانبندی پروژه با تخصیص نیرویانسانی چندمهارته تحت شرایط عدم قطعیت فازی
سیده زهرا جلالی - سید میثم موسوی - محمدجواد برزگری
شبیهسازی تخصیص کامیون به بیل در معادن روباز با رویکرد یادگیری تقویتی
عرفان مزینانی - نسیم نهاوندی
مدل برنامه ریزی آرمانی برای زمان بندی شیفت های کاری پرستاران (مطالعه موردی: بیمارستان امام حسن(ع) بجنورد)
فهیمه تنهایی - نسترن زحمتکش
تحلیل شناسایی نوع کار شهروندان مراجعه کننده به ادارات شهرداری منطقه یک شهرداری تهران با استفاده از روش داده کاوی
رضا رحمانی - پروین بحرایی
قدرت بازار، بهرهوری و سهم نیروی کار بخشی در کشورهای منتخب اروپایی
نسیم فتح الهی ننه کران - رحیم تقی زاده
بیشتر
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 43.7.0