
مدل رگرسیون لوجستیک اصلاح شده برای پیشبینی دیابت با یکپارچهسازی تکنیکهای PCA و میانگین K
دیابت باعث مرگ و میر در افراد بیشتر در هر سال میشود که وضعیت سلامتی خود را زودتر تشخیص نمیدهند. در این تحقیق روش دادهکاوی را برای تشخیص اولیه و پیشبینی دیابت با استفاده از پایگاه دادهای دیابت pima Indians معرفی میکنیم. اگر چه میانگین K ساده بوده و میتوان برای انواع دادهها استفاده کرد ولی به وضعیت اولیه مراکز خوشه حساس است که نتیجه خوشه نهایی را تعیین میکند و مجموعه دادهای خوشهبندی شده کافی را برای مدل رگرسیون لوجستیک فراهم آورده و میزان دادهای اندکی را در نتیجه خوشهبندی نادرست مجموعه دادهای اولیه نتیجه داده و عملکرد مدل رگرسیون لوجستیک را کاهش میدهد. هدف ما تعیین روشهای ارتقا نتایج درستی رگرسیون لوجستیک و خوشهبندی میانگین K میباشد. مدل شامل آنالیز مولفه اصلی PCA، میانگین K و الگوریتم رگرسیون لوجستیک است. نتایج آزمایش نشان میدهند که PCA الگوریتم خوشهبندی میانگین K و دقت دستهبندیکننده رگرسیون لوجستیک را در مقابل نتایج مطالعات دیگر با خروجی میانگین K با 25 داده دستهبندی شده درست و دقت و درستی رگرسیون لوجستیک 98/1% بالاتر ارتقاء میدهد. مدل برای پیشبینی دیابت با استفاده از دادههای سلامت الکترونیک سودمند میباشد. آزمایش بیشتر با مجموعه دادهای جدید قابلیت اعمال پایگاه دادهای را برای پیشبینی دیابت نشان داد.