داده کاوی و وب - فصل اول

داده کاوی و وب

داده کاوی و وب - فصل اول

تعداد بازدید: 4264
کد مطلب: 13486
تاریخ انتشار: 10:48 30 آبان 1391
تاریخ آخرین ویرایش : 15:13 15 آبان 1392
 
 

پیشگفتار:

در عصر حاضر Web Mining محیط اینترنت جهانی را تبدیل به محیطی کاربردی تر کرده است که کاربران میتوانند سریعتر و راحتتر اطلاعات مورد نیازشان را پیدا کنند که شامل :کشف و تحلیل داده ، مستندات وmulti media  از محیط اینترنت جهانی میباشد. ,Web Mining  از جزئیات سند و محتویات سند و ساختار Hyper Link  برای کمک به کاربر جهت مشاهده اطلاعات مورد نیازش استفاده میکند.

وب و موتورهای جستجو خودشان شامل اطلاعات ارتباطی درباره ی مستندات هستند و Web Mining   این ارتباطات را کشف میکند و به سه بخش تقسیم بندی مینماید.

  • در اولین بخش Web Content Mining، موتورهای جستجو محتویات را با کلمات کلیدی تعریف میکنندومی شناسند.پیدا کردن کلمات کلیدی محتوا و پیدا کردن یک ارتباط بین محتوای صفحه ی وب و محتوای سوال کاربر، Content Mining  گفته میشود.
  • Hyper Linksاطلاعاتی را درباره ی سایر مستندات روی وب که در سند دیگری مهم هستند تهیه میکند.این لینکها عمقی را به سند اضافه میکنند و حالت چند بعدی که از خصوصیات وب است ایجاد میکنند. کاوش این ساختار لینک دومین بخش یعنی   Web Structure Mining   است.
  • در نهایت ارتباطی با سایر مستندات روی وب  که بوسیله ی جستجوی قبلی شناخته شده اند، وجود دارد. این ارتباط در صفحه های جستجو  (log) و دستیابی ذخیره میشود. کاوش این Log ها سومین بخش یعنی Web Usage Mining  را تشکیل میدهد.

درک کاربر اغلب یک بخش مهم از  Web Mining  است. تحلیل جستجوهای قبلی کاربر ،شکلی که کاربر ترجیح میدهد اطلاعات پیدا شده را ببیندو سرعت در پاسخ ممکن است در پاسخ دادن به پرس و جوی کاربر موثر باشد.

Web Mining  در ماهیت نظم خاصی دارد.پل زدن بین فیلدهایی مثل اطلاعات بازگشتی ،پردازش زبانهای طبیعی، استخراج اطلاعات ،Machine Learning، پایگاه داده ،داده کاوی ،ذخیره ی داده ، طراحی رابط کاربر و Visual  کردن .

تکنیکهای Web Mining  کاربردهای عملی در M-commerce ،E-commerce ، E-Government ،E-learning ، آموزش از راه دور ، آموزش سازمانی،تشکیلات مجازی ، مدیریت دانش و کتابخانه ی دیجیتال دارد.

در این تحقیق ما به بررسی جنبه های مختلف Web Data Mining  می پردازیم.

مقدمه

 

در این قسمت از تماس و تاثیرWeb data mining  روی تکنولوژی­های پشتیبانی صحبت خواهیم کرد. در این فصل یک دید کلی از داده­کاوی فراهم می­سازیم و به توضیح کاربردها و ابزارهای آن می پردازیم. توسط اطلاعات روی وب، امکان استخراج داده و دستیابی به اطلاعات برای کاربران بسیار آسان و مطلوب شده است وعمل جستجو روی اینترنت را برای کاربران خیلی آسانتر خواهد ساخت. بنابراین بهره­های زیادی در Webminnig  وجود دارد، از جمله کاوش پایگاه داده­ها روی وب یا کاوش الگوهای مورد استفاده را می­توان نام برد تا اطلاعات مفید برای کاربران تامین شوند .داده­کاوی و وب به عنوان تکنولوژی مستقل در اواسط 1990  توسعه یافت.زمان زیادی از هنگامی که پژوهشگران به صورت جدی شروع به فکر کردن در مورد Webminnig  کردند نگذشته است. کارگاه Webminnig  در جریان کنفرانس کشف دا نش پایگاه داده در 1999 یکی از اولین تجربه­ها بود.

Stivastava و cooley  یک طبقه بندی برای Webminnig تعیین کرده­اند آنها در ابتدا Webminnig  را به دو قسمت تقسیم کردند:

  • بدست آوردن الگوها از داده­ های وب
  • بدست آوردن ثبت وقایع وب

سپس طبقه­بندی به سه قسمت گسترش یافت که شامل Web content mining ، Web usage mining و Web structure mining  می­باشد.

 Web content mining استخراج داده­ای است که شامل متن، ویدئو و ... روی وب می­باشد. اساساWeb content mining  زیر مجموعه داده کاوی می­باشد.

Web usage mining  کاوش اطلاعات درباره دسترسی به صفحات وب و شامل تحلیل click stream  می­شود.

Web structure mining  در مورد کاوش URL ها و دیگر لینک­های وب برای دستیابی به ساختار آنهاست.