فرمت فایل اصلی : doc در قالب 190 صفحه
چکیده
ماهیت پویای شبکه جهانی و ابعاد رو به رشد آن، بازیابی دقیق اطلاعات را دشوار ساخته است. پاسخ های نادرست برگشت داده شده به وسیله ی موتورهای جستجو، خصوصا برای عبارات پرسوجو با معانی مختلف، باعث نارضایتی کاربران وب شدهاست که نیاز به پاسخ های دقيق برای تقاضاهای اطلاعاتی خود دارند. امروزه موتورهای جستجو تلاش میکنند تا درخواست کاربران را از طریق مطالعه سابقه جستجو و یا حتی شرکت دادن کاربران در فرایند جستجو به منظور روشن ساختن آنچه که آنها واقعا نیاز دارند، دريابند. این روند بخشی از تلاش موتورهای جستجو برای شخصیسازی است.
یکی از موتورهای جستجوی شخصیسازی شده ی خوش تعريف و خوش ساخت، اسنکت[1] است که از مشارکت کاربر برای فرایند شخصیسازی استفاده میکند. در این تحقیق بر اساس الگوریتم شخصیسازی شده اسنکت، یک معماری از موتور جستجوی شخصیسازی شده جديد پيشنهاد شده به نام PSEFiL ارائه شدهاست که با دخالت دادن کاربر و فيلتر سازی لینک ها پاسخ هایی با کمترین ميزان یا عدم وجود انحراف موضوع به منظور غنی سازی مجموعه جواب، به کاربران تحویل میدهد. علاوه بر این، مجموعه جواب مستحکم است زیرا هر لینک موجود در مجموعه نتایج، يا دارای رتبه بالایی از ساير موتورهای جستجو است و یا کمترین انحراف موضوع را با یک فرایند اسکن دستی دقيق داراست. بعلاوه هر لینک به روشنی برای هر معنی ذهنی موجود از یک عبارت پرسوجو طبقهبندی شدهاست. یکی از اهداف PSEFiL، آماده سازی و تحويل پاسخ های دقیق است نه تحويل مجموعه پاسخی با لینک های بیشتر که ممکن است محتوایشان دقت کم داشته و یا دقیق نباشند.
کلمات کلیدی
موتور جستجو، بهینه سازی موتور جستجو، شخصیسازی موتور جستجو، ساختارکاوی وب, محتوا کاوی وب
فهرست مطالب
چکیده
فصل اول(کلیات)
- مقدمه
- بیان مسئله و اهمیت آن
- اهمیت و ضرورت انجام تحقیق
- ساختار
- فصل دوم(مبانی و مفاهیم پایه
۲-۱ مقدمه
۹ ۲-۲ وبکاوی
۲-۳ تکامل تاریخی از وبکاوی
۲-۴ مشکلات کاربران در استفاده ازوب
۲-۵ شباهت ها و تفاوت های وبکاوی و داده کاوی
۲-۶ الگوریتم های وبکاوی
۲-۷ دسته بندی وبکاوی
۲-۷-۱ محتوا کاوی وب
۲-۷-۱-۱ دیدگاه های محتوا کاوی وب
۲-۷-۱-۲ دادههای محتوا کاوی وب
۲-۷-۱-۳ رويکردها و تکنيک هاي محتواکاوی وب
۲-۷-۱-۴ انواع محتواکاوی وب
۲-۷-۲ ساختارکاوی وب
۲-۷-۲-۱ دسته های ساختار کاوی وب بر اساس نوع داده ساختاری
۲-۷-۲-۲ مدل هاي بازنمايي ساختار وب
۲-۷-۲-۳ کاربردهاي ساختارکاوی وب
۲-۷-۳ کاربردکاوی وب
۲-۷-۳-۱ فازهای کاربرد کاوی وب
۲-۷-۳-۲ انواع دادههاي کاربردکاوی
۲-۷-۳-۳ کاربردهاي کاربردکاوی وب
۲-۸ کاربردهای وبکاوی
۲-۹ چالش هاي وب کاوي
۲-۱۰ موتور جستجو
۲- ۱۱ تاریخچه موتورهای جستجو
۲-۱۲ موتورهاي جستجو را از لحاظ پشتیبانی هاي مالی و نیروي انسانی
۲-۱۲-۱ موتورهاي جستجوي آزمایشی
۲-۱۲-۲ موتورهاي جستجوي تجاري
۲-۱۳ معماري کلی موتورهاي جستجو و کارکرد آنها
۲-۱۳-۱ درون کاو(خزنده )
۲-۱۳-۲ کنترل درون کاو
۲-۱۳-۳ انباره ي صفحات
۲-۱۳-۴ ماجول شاخص دهی
۲-۱۳-۵ ماجول Collection Analysis
۲-۱۳-۶ Utility Index
۲-۱۳-۷ موتور پرسوجو
۲-۱۳-۸ ماجول رتبه بندي
۲-۱۴ اهمیت موتورهاي جستجو
۲-۱۵ مشکلات موتورهاي جستجو در ارائه نتایج
۲-۱۶ بهینه سازی موتور جستجو
۲-۱۷ هدف SEO
۲-۱۸ مزیت بهینه سازی وب سایت برای موتورهای جستجو
۲-۱۹ فرآیند بهینه سازی موتورهای جستجو
۲-۲۰ نتیجه گیري
فصل سوم(شخصی سازی موتورهای جستجو)
۳-۱ مقدمه
۳-۲ علت شخصیسازی موتور جستجو
- تعریف شخصیسازی
- مراحل شخصیسازی
۳-۴-۱ شناخت کاربر
۳-۴-۱-۱ روشهای کمک به کاربران در جستجو در وب
۳-۴-۱-۱-۱ خوشهبندی کد آماده- وب
۳-۴-۱-۱-۲ شخصیسازی فهرست رتبهبندی شده- مسطح از نتایج پرسوجو
۳-۴-۱-۲ راه حل های مشکل خوشهبندی کد آماده وب
۳-۴-۱-۲-۱ خوشه بندي مسطح
۳-۴-۱-۲-۱-۱ کلمات تنها و خوشه بندي مسطح
۳-۴-۱-۲-۱-۲ جملات و خوشه بندي مسطح
۳-۴-۱-۲-۲ خوشهبندی سلسله مراتبی
۳-۴-۱-۲-۲-۱ کلمات تنها و خوشهبندی سلسله مراتبی
۳-۴-۱-۲-۲-۲ جملات و خوشهبندی سلسله مراتبی
۳-۴-۱-۳ معرفی اسنکت
۳-۴-۱-۴ شرح معماری اسنکت
۳-۴-۱-۴-۱ انتخاب جمله و رتبهبندی
۳-۴-۱-۴-۲ خوشه بندي سلسله مراتبی
۳-۴-۱-۴-۳ شخصیسازی نتایج جستجو
۳-۴-۱-۵ مرور اسناد سلسله مراتب براي استخراج اطلاعات
۳-۴-۱-۶ مرور اسناد سلسله مراتب براي انتخاب نتايج
۳-۴-۱-۷ اصلاح پرسوجو
۳-۴-۱-۸ رتبهبندی شخصیسازی شده
۳-۴-۱-۹ واسطه شخصیسازی شده وب
۳-۴-۱-۱۰ نتایج تجربی
۳-۵-۱-۱۰-۱ پيمايش هاي کاربران
۳-۴-۱-۱۰-۲ مجموعه داده اسنکت و شواهد حكايتي
۳-۴-۱-۱۰ -۳ ارزیابی اسنکت
۳-۴-۱-۱۰ -۳ – ۱ مزایای استفاده از DMOZ….
۳-۴-۱-۱۰ -۳ -۲ مزایای استفاده از شاخص محکم متن
۳-۴-۱-۱۰ -۳ -۳ مزایای استفاده از موتورهای چندگانه
۳-۴-۱-۱۰ -۳ -۴ مزایای استفاده از جملات فاصله دار به عنوان برچسبهای پوشه
۳-۴-۱-۱۰ -۳ -۵ تعداد کدهای آماده وب موجود در پوشهها
۳-۴-۲ مدل سازی کاربر
۳-۴-۲-۱ مدل سازی صريح کاربر
۳-۴-۲-۲ مدل سازی ضمنی کاربر
۳-۴-۲-۲-۱ Caption Nemo
۳-۴-۲-۲ -۱-۱ فضاهای جستجوی شخصی
۳-۴-۲-۲ -۱-۱-۱ مدل شخصی بازیابی
۳-۴-۲-۲ -۱-۱-۲ سبک ارائه شخصی
۳-۴-۲-۲ -۱-۱-۳ موضوع مورد نظر شخصی
۳-۴-۲-۲ -۱-۲ پیاده سازی سیستم
۳-۴-۲-۲ -۱-۲ -۱ رتبهبندی
۳-۴-۲-۲ -۱-۲-۲ طبقهبندی سلسله مراتبی صفحات وب بازيابي شده
۳-۴-۲-۲ -۱-۳ مطالعه کاربر
۳-۴-۲-۲ -۱-۳ -۱ آزمایش
۳-۴-۲-۲ -۱-۳ -۲ آزمایش ۲
۳-۴-۲-۲ -۳ شخصیسازی الگوریتم رتبهبندی صفحه
۳-۴-۲-۲ -۴ الگوریتم LTIL.
۳-۴-۲-۲ -۵ روش IA.
۳-۴-۳ اجرای سیستم شخصیسازی
۳-۴-۳-۱ روش قطعی
۳-۴-۳-۲ روش فازی
۳-۴-۳-۳ شخصیسازی موتورهای جستجو با استفاده از شبکه های مفهومی فازی و ابزارهای داده کاوی
۳-۴-۳-۳ -۱ پیش زمینه
۳-۵-۳-۳ -۲ روش پیشنهادی
۳-۴-۳-۳ -۳ ارزیابی سیستم و بررسی نتایج بهدست آمده
۳-۵ نتیجه گیري
فصل چهارم(مدل پیشنهادی برای شخصیسازی موتورجستجوونتایج بدست آمده از آزمایش ها)
۴-۱ مقدمه
۴-۲ شرح آزمایشها و تجزیه مسئله.
۴-۳ نتیجه گیری
فصل پنجم(رابط کاربری موتور جستجو)
۵-۱ مقدمه
۵-۲ رابط کاربری موتور جستجوی شخصیسازی شده PSEFiL
۵-۳ اهمیت موتور جستجوی شخصیسازی شده PSEFiL
۵-۴ نتیجه گیری
فصل ششم(نتیجه گیری)
۶-۱ مقدمه
۶-۲ مروری بر فصول گذشته
۶-۳ موتور جستجوی پیشنهادی شخصیسازی شده PSEFiL
۶-۴ نتیجه گیری
۶-۵ پیشنهادات و مطالعات آتی
مقالات مستخرج
فهرست منابع
چکیده انگلیسی