کاوش قوانین وابستگی در جریانات سریع داده
تعداد صفحات : 60 با فرمت ورد و قابل ویرایش
1-1 مقدمه 2
1-2- فرضیات و محدودیت های مسئله 4
1-3- ضرورت انجام تحقیق 6
1-4- سرفصل مطالب 8
2-بیان مساله 22
2-2- مقدمه 22
2-2-1- مسئلهی کشف قوانین وابستگی 22
2-2-2- مدل سازی مسئله 23
2-3- مدلهای پردازش و كاوش جریانهای داده 27
3-بررسی ادبیات موضوع 29
3-1- مقدمه 29
3-2- انواع روشهای حل مسئله 29
3-2-1- روش های مبتنی بر پنجره نشانه 31
3-2-1-1- الگوریتم شمارش پر اتلاف 31
3-2-1-2- الگوریتم DSM-FI 33
3-2-2- روش های مبتنی بر پنجره زوال 35
3-2-2-1- الگوریتم استدک 35
3-2-3- روش های مبتنی بر پنجره کشویی 41
3-3- الگوريتم استماكس 45
3-4- الگوریتم (FastARM) 48
3-5- كاوش مجموعه هاي داد هاي با ابعاد بالا و كاوش الگوهاي متناوب بسيار بزرگ 51
3-6- كاوش الگوهاي ساختاري: گراف، درخت و شبكه 52
3-7- الگوريتم دي. اس. تري 53
3-8- جمع بندی 56
فهرست منابع و مآخذ 57
امروزه حجم بسیار زیادی از دادهها در پایگاه های داده ای ذخیره گردیدهاند. برای شناسایی بسیاری از الگوهای پنهان شده در این دادهها، نیازمند ابزار و تکنیکهای جدیدی میباشیم. در این راستا داده کاوی(Data Mining) به عنوان علمی نوین جهت کاوش الگوهای مفید از حجم زیاد دادهها معرفی گردیده است.کشف قوانین وابستگی (Association Rule) یکی از پرکاربردترین الگوهایی است که توسط داده کاوی استخراج میگردند و به معنای یافتن همه قوانین موجود در مشاهده اقلام مجمو عه های داده ای است بطوریکه این قوانین حجم قابل انتظاری از دادهها را تحت پوشش قرار میدهند. مهمترین فاز یافتن قوانین وابستگی، یافتن الگوهای پرتکرار می باشد.
پیشرفت علم و متعاقب آن تکنولوژی نوع جدیدی از دادهها را معرفی نموده است که بسیار پر تکرار، سریع و در عین حال نامحدود میباشند که این نوع دادهها جریان داده(Data Stream) نامیده میشوند. با توجه به ماهیت جریان داده ای، امکان ذخیره سازی داده های ورودی و مرور دوباره آنها وجود نداشته و می بایست به جای جواب های دقیق به دنبال جواب های نسبی باشیم که تا حد امکان به جواب های دقیق نزدیک باشند.
به دلیل این محدودیت ها، در سال های جدید به جای یافتن همه الگوهای پرتکرار به دنبال زیرمجموعه ای از آنها هستیم که در عین حال جزء جذاب ترین آنها نیز باشند.
در این الگوریتم های ازائه شده برای کاوش الگوهای پرتکرار را بررسی می نماییم وطی ارزیابی های انجام گرفته کارایی الگوریتم معرفی شده های در مقایسه با یکدیگر قرار می گیرند.
برچسب ها:
کاوش قوانین وابستگی در جریانات سریع داده پایان نامه کاوش قوانین وابستگی در جریانات سریع داده کشف قوانین وابستگی کشق الگوهای پرتکرار جریان سریع داده داده کاوی FastARM data mining ds3 big data الگوريتم استماكس داده با ابعاد بالا