فهرست مطالب
عنوان ................................................................................................ صفحه
فصل اول: معرفی نامه
1-1- معرفی فصل دوم پایان نامه............................................................................................ 2
1-2- معرفی فصل سوم پایان نامه............................................................................................ 7
فصل دوم:روش های متفاوت تقسیم بندی صفحات وب
2-1- تقسيم بندي صفحات وب بطور مختصر............................................................................ 9
2-1-1-1- روش خلاصه سازي تعديل شده Luhn............................................................... 10
2-1-1-2 – روش تحليل معنايي نهفته (LSA)....................................................................... 12
- 2-1-1-3- شناسايي مضمون بدنه اصلي توسط تجزيه و تحليل لايهاي.................................. 13
- 2-1-1-4- خلاصه سازي نظارت شده................................................................................... 15
2-1-1-5- يك دسته بندي كلي از خلاصه سازي................................................................... 17
2-1-2-
آزمايشات..............................................................................................................
18
2-1-2-1- مجموعه ی داده.................................................................................................. 18
2-1-2-2- دسته كننده ها.................................................................................................... 19
2-1-2-3- مقياس ارزيابي.................................................................................................... 21
2-1-2-4- نتايج و تحليل هاي تجربي................................................................................... 22
2-1-2-5 مورد پژوهش....................................................................................................... 29
2-1-3- نتیجه گیری و عملکرد آینده.................................................................................... 31
2-2- تقسیم بندی صفحات وب با استفاده از الگوریتم اجتماع مورچه ها................................... 32
2-2-1- پیش پردازش متنی وابسته به زبان شناسی و استخراج وب......................................... 32
2-2-2- الگوريتم Ant- Miner......................................................................................... 36
2-2-3- نتايج محاسباتي...................................................................................................... 39
2-2-3-1- تنظيم بصورت عملي........................................................................................... 39
2-2-3-2- نتايج تأثير تكنيك های پيش پردازش متنی وابسته به زبان شناسی.............................. 40
2-2-4- بحث و تحقيقات آينده............................................................................................ 43
2-3- تقسيم بندي صفحات وب براساس ساختار پوشهاي......................................................... 44
2-3-1 الگوريتم هاي تقسيم بندي صفحات وب...................................................................... 45
2-3-2- روش مبتني بر ساختار.............................................................................................. 47
2-3-3- يك كاربرد خاص.................................................................................................. 47
2-3-3-1- استخراج مهمترين خصوصيات.............................................................................. 48
2-3-3-2- عمل دسته بندي.................................................................................................. 50
2-3-4
نتايج.......................................................................................................................
51
2-3-5- نتيجه گيري و عملكرد آينده..................................................................................... 53
فصل سوم : جستجوي وب با استفاده از طبقه بندي خودكار
3-1-
معماري
....................................................................................................................
57
3-1-1- دسته كنندهي خودكار ............................................................................................ 57
3-1-2-واسط جستجو......................................................................................................... 58
3-2- آزمایش معتبر سازي.................................................................................................... 59
3-2-2- برپایی آزمایش ...................................................................................................... 60
3-2-2- نتایج تجربي........................................................................................................... 61
3-3- فهرست لغات هر دسته................................................................................................. 64
3-3-1- تشخیص هرزنامۀ¹ وب............................................................................................. 66
3-3-2- تأثیرات تبعیضات.................................................................................................... 67
3-4- عملکردهای بعدی 68
برچسب ها:
تقسیم بندی و طبقه بندی صفحات وب روش خلاصه سازي تعديل شده Luhn الگوريتم Ant Miner استفاده از الگوریتم اجتماع مورچه ها تكنيك های پيش پردازش متنی وابسته به زبان شناسی الگوريتم هاي تقسيم بندي صفحات وب تشخیص هرزنامه وب جستجوي وب با استفاده از طبق