شکل ۱- مدل فرایند CRISP-DM برای کاربردهای داده کاوی]۹[ ۲۱
شکل (۲-۱): معماری سیستم مبتنی بر داده کاوی [۴۲]. ۵۹
شکل (۲-۲): تغییر میزان آنتروپی را برای مجموعهای با دو کلاس. ۶۳
شکل (۲-۳): توابع نرمال سازی [۴۰] ۶۷
نمودار(۲-۱): تقریب خطی ۷۳
شکل(۳-۱): صفحه نخست نرم افزار Rapid Miner 5. 62
شکل ۳-۲: خروجی شیها ۶۳
شکل ۳-۳: خروجی قسمت مدل (شبکه عصبی) ۶۳
شکل ۳-۴: خروجی قسمت اطلاعات ۶۴
شکل (۴-۱): متدولوژی CRISP-DM. 67
شکل (۴-۲): نحوه افزودن فایل دادهای به برنامه. ۷۰
شکل (۴-۳): نحوه انتخاب نوع سطر. ۷۱
شکل(۴-۴): آدرس عملگر درخت تصمیم. ۷۱
شکل(۴-۵): آدرس عملگر Set Role. 72
شکل(۴-۶): آدرس عملگر Select Attribute. 72
شکل(۴-۷): آدرس عملگر Discretize by Frequency. 72
شکل(۴-۸): نحوه اتصال عملگرها ۷۳
شکل(۴-۹): درخت حاصل از داده های آموزشی با تابع هدف نسبت بهره اطلاعاتی ۷۴
شکل(۴-۱۰): درخت حاصل از داده های آموزشی با تابع هدف آنتروپی ۷۵
شکل (۴-۱۱): درخت حاصل از داده های آموزشی با تابع هدف پراکندگی جمعیت(جینی) ۷۵

شکل(۴-۱۲): آدرس عملگر Apply model. 76
شکل(۴-۱۳): اتصالات تب پردازش در مرحله اعمال مدل. ۷۶
نمودار (۴-۱): پیشبینی حاصل از الگوهای درخت تصمیم با تابع هدف نسبت بهره اطلاعاتی ۷۷
نمودار(۴-۲): پیشبینی حاصل از الگوهای درخت تصمیم با تابع هدف آنتروپی ۷۷
نمودار(۴-۳): پیشبینی حاصل از الگوهای درخت تصمیم با تابع هدف پراکندگی جمعیت(جینی) ۷۸
شکل (۴-۱۵): اتصالات عملگرها جهت تشکیل مدل شبکه عصبی ۷۹
شکل(۴-۱۶): ساختار شبکه عصبی ۸۰
نمودار (۴-۴): نتیجه تشخیص شبکه عصبی ۸۰
نمودار(۴-۶): نتایج حاصل از اجرای شبکه عصبی بر داده های خرابی پیشبینی شده توسط درخت تصمیم ۸۲مطلب دیگر :
فهرست جداولجدول (۲-۱): مقایسه آنالیز آماری و داده کاوی . ۵۳
جدول (۲-۲) کلاس های پیش بینی . ۶۹
جدول (۲-۳): ماتریس تداخل. ۷۰
جدول(۲-۴): مجموعه اعتبار سنجی ۷۴
جدول) ۳-۱(: داده های مورد استفاده در تشخیص کنتورخراب ۶۸
جدول (۴-۳): نتایج حاصل از ارزیابی نتایج درختهای تصمیم ایجاد شده. ۷۸
جدول (۴-۳): مقادیر پارامترهای عملگر شبکه عصبی ۷۹
فصل اولکلیات تحقیق
این فصل به تعریف مسأله و راهکار کلی میپردازد. در ابتدا سعی میشود که مسأله تعریف شود. سپس اهمیت و ضرورت مسأله، اهداف و فرضیهها شرح داده میشود و در نهایت ساختار این پژوهش، توضیح داده میشود.
۱-۱ بیان مسأله
ظرفیت ذخیره سازی داده های دیجیتال در سراسر جهان هر نه ماه برای حداقل یک دهه دو برابر شده است، در صورتی که در دو برابر مدت مشابه طبق پیش بینی قانون مور[۱]
قدرت محاسباتی و سرعت رشد می کند]۱[. داده کاوی نشان دهنده یک گام در فرایند کشف دانش در پایگاه داده ها[۲] میباشد]۲[ که میتوان آن را یک نیاز اساسی در دنیای امروز دانست. بنا بر اعلام دانشگاه MIT امروزه مرز و محدودیتی برای دانش داده کاوی در نظر گرفته نشده و دامنه کاربرد آن را از اعماق اقبانوسها تا بی کران فضا میدانند]۳[. تلاش برای الگوهای موجود در داده ها مدت زمان طولانی در بسیاری از زمینه ها، از جمله آمار، الگوشناسی[۳] ، و تجزیه و تحلیل داده های اکتشافی مورد مطالعه قرار گرفته شده است]۴[.
داده کاوی به عنوان یک ابزار مهم برای کسب دانش از پایگاه داده های پدید آمده است]۵[ از این رو میتوان به اهمیت الگوریتمهای داده کاوی پی برد که شبکه های عصبی و درخت تصمیم از جملهی این الگوریتمها میباشد. درخت تصمیم یک راه طبیعی برای ارائه یک فرایند تصمیم گیری میباشد، چرا که درک آنها برای هر کسی ساده و آسان است
]۶[ همچنین