داده کاوی و الگوریتم های داده کاوی
تعداد صفحات : 40 با فرمت ورد و قابل ویرایش
عموماً
data mining )که برخي مواقع بازيافت داده يا دانش
گفته مي شود) فرايندي ازآناليز داده از ديدهاي مختلف وسپس خلاصه کردن آنها به صورت
اطلاعات مفيد مي باشد . اطلاعات بدست آمده براي بالا بردن بازده، کاهش قيمت يا
هردوبه کار مي رود. نرم افزارdata mining يکي
از ابزارهاي متعدد آناليز براي آناليز کردن داده مي باشد و به کاربراجازه مي دهد
که داده را از زوايا يا ديمانسيونهاي مختلفي آناليز کند. سپس
آنها را دسته بندي کند و نهايتاً ارتباطات شناخته شده را خلاصه وجمع بندي کند. از
لحاظ تکنيکي، data mining فرايندي
ازجستجوي همبستگي يا طرح بين مجموعه بسيارزيادي ازفيلدها درپايگاه داده هاي رابطه
اي بزرگ مي باشد .Data Mining درگير
به کارگيري ابزارهاي آناليز داده براي يافتن و نمايش ناشناخته هاي قبلي، ارتباطات
و طرحهاي معتبر در مجموعه داده اي بزرگ مي باشد.
Data
Mining در بخشهاي عمومي و خصوصي به صورت رايج
به کار برده مي شود. صنايعي نظير دارو ، اقتصاد،بانک و ... از
Data Mining براي کاهش هزينه ها، بالابردن کيفيت و
بالا بردن فروش استفاده مي کنند. در بخش عمومي، نيز در وهله اول به عنوان ارزيابي
زيان و ضرر و منفعت به کار برده مي شود.
براي
مثال يک سبزي فروشي زنجيره اي ازخاصيت data mining درنرم
افزار اوراکل براي آناليز طرحهاي خريد محلي استفاده نمود. آنها به اين واقعيت پي
بردند که زماني که افراد درروزهاي شنبه و سه شنبه سيب زميني مي خرند،تمايل به خريد
پياز هم دارند. آناليزهاي بعدي نشان داد که خريداران معمولاً خريد هفتگي خودرا در
روزهاي شنبه انجام مي دهند و در روزهاي سه شنبه تنها مقدار کمي خريد مي کنند.
از ديد برخي متخصصين ، Data Mining به
عنوان يک گام در يک فرايند شناخت بزرگتر با نام Knowledge
discovery database (KDD) مطرح مي شود.
مي توان در يک دسته بندي کلي گامها در فرايند
KDD ، به ترتيب پيشرفت ،را به صورت زير برشمرد
:
1. Data Cleaninig
2. Data Integration
3. Data Selection
4. Data Transformation
5. Data Mining
6. Pattern Evaluation
7. Knowledge Presentation
|
|
فصل اول : داده
کاوی چيست؟
|
|
|
|
1-1-Data mining چيست؟
|
|
1-2- داده،اطلاعات و دانش
|
|
1-3-Data warehouses
|
|
فصل دوم : کارکردن با Data
Mining
|
|
|
|
2-1- Data Mining چگونه کار مي کند چه کاري انجام مي دهد (
آشنایی با قوانین آن ) ؟
|
|
2-2- 1- عناصر Data Mining
|
|
2-2-2- متدهاي درخت تصميم
|
|
2-2-3- پارامترهاي Data Mining
|
|
2-2-4- وظايف داده کاوي
|
|
2-5- يافتن درخت تصميم از Training
Set
|
|
2-6- قوانین DataMining
|
|
2-6- 1- قوانین کلاس بندی و رگرسیون
|
|
2-6-2- قوانین با ساختار درختی
|
|
فصل سوم : ساختار الکوریتم ها در Data
Mining
|
|
|
|
3-1- تصمیم گیری
|
|
3-1-1 درختان تصمیم گیری
|
|
3-1-2- الگوریتمی برای ساختن درختان تصمیم
|
|
3-2- clustering
|
|
3-2- 1- کلاستر بندی
|
|
3-2- 2- یک نمونه الگوریتم کلاستربندی انحصاری : BIRCH
|
|
3-3- ترتیب ها
|
|
3-3- 1- جستجوی تشابه روی ترتیب ها
|
|
3-3- 2- الگوریتمی برای پیدا کردن ترتیب های مشابه
|
|
3-4- اهداف clustering
|
|
3-5- کلاستربندی سلسله مراتبی
|
|
3-5- 1- الگوریتم کلاستربندی سلسله مراتبی
|
|
3-5- 2- یک مثال از الگوریتم کلاسترینگ سلسله مراتبی
|
|
3-5- 3- معایب الگوریتم کلاسترینگ سلسله مراتبی
فصل چهارم : مدل ها و الگوریتم های داده کاوی
4 – 1 مدل ها و الگوریتم های داده کاوی
4-1 -1 شبکه های عصبی
4-2-1 Decision trees
4-3 – 1 Multivariate
Adaptive Regression Splines(MARS)
4-4 – 1 Rule induction
4-5 – 1 K-nearest
neibour and memory-based reansoning(MBR)
4-6 – 1 رگرسیون منطقی
4-7 – 1 تحلیل تفکیکی
4-8 – 1 مدل افزودنی کلی (GAM)
4 -9 – 1 Boosting
4- 2 سلسله مراتب انتخابها
نتیجه گیری
فهرست منابع
|
|
برچسب ها:
داده کاوی و الگوریتم های داده کاوی پایان نامه داده کاوی و الگوریتم های داده کاوی Multivariate Adaptive Regression Decision trees درخت تصمیم رگرسیون داده کاوی شبکه های عصبی کلاسترینگ BIRCH Data Mining انبار داده Boosting chaid کلاس بند