داده کاوی و وب

plus  0  

[ویرایش]
 

پیشگفتار:

در عصر حاضر Web Mining محیط اینترنت جهانی را تبدیل به محیطی کاربردی تر کرده است.که کاربران میتوانند سریعتر و راحتتر اطلاعات مورد نیازشان را پیدا کنند که شامل :کشف و تحلیل داده ، مستندات وmulti media از محیط اینترنت جهانی میباشد ,Web Mining  از جزئیات سند و محتویات سند و ساختار Hyper Link برای کمک به کاربر جهت مشاهده اطلاعات مورد نیازش استفاده میکند.

وب و موتورهای جستجو خودشان شامل اطلاعات ارتباطی درباره ی مستندات هستند و Web Mining  این ارتباطات را کشف میکند و به سه بخش تقسیم بندی مینماید.

  • در اولین بخش Web Content Mining، موتورهای جستجو محتویات را با کلمات کلیدی تعریف میکنندومی شناسند.پیدا کردن کلمات کلیدی محتوا و پیدا کردن یک ارتباط بین محتوای صفحه ی وب و محتوای سوال کاربر، Content Mining  گفته میشود.
  • Hyper Linksاطلاعاتی را درباره ی سایر مستندات روی وب که در سند دیگری مهم هستند تهیه میکند.این لینکها عمقی را به سند اضافه میکنند و حالت چند بعدی که از خصوصیات وب است ایجاد میکنند. کاوش این ساختار لینک دومین بخش یعنی   Web Structure Mining  است.
  • در نهایت ارتباطی با سایر مستندات روی وب  که بوسیله ی جستجوی قبلی شناخته شده اند، وجود دارد. این ارتباط در صفحه های جستجو  (log) و دستیابی ذخیره میشود. کاوش این Log ها سومین بخش یعنی Web Usage Mining را تشکیل میدهد.

درک کاربر اغلب یک بخش مهم از  Web Mining است. تحلیل جستجوهای قبلی کاربر ،شکلی که کاربر ترجیح میدهد اطلاعات پیدا شده را ببیندو سرعت در پاسخ ممکن است در پاسخ دادن به پرس و جوی کاربر موثر باشد.

Web Mining در ماهیت نظم خاصی دارد.پل زدن بین فیلدهایی مثل اطلاعات بازگشتی ،پردازش زبانهای طبیعی، استخراج اطلاعات ،Machine Learning، پایگاه داده ،داده کاوی ،ذخیره ی داده ، طراحی رابط کاربر و Visual کردن .

تکنیکهای Web Mining کاربردهای عملی در M-commerce ،E-commerce ، E-Government ،E-learning ، آموزش از راه دور ، آموزش سازمانی،تشکیلات مجازی ، مدیریت دانش و کتابخانه ی دیجیتال دارد.

در این تحقیق ما به بررسی جنبه های مختلف Web Data Mining میپردازیم.

مقدمه

در این قسمت از تماس و تاثیرWeb data mining روی تکنولوژی­های پشتیبانی صحبت خواهیم کرد. در این فصل یک دید کلی از داده­کاوی فراهم می­سازیم و به توضیح کاربردها و ابزارهای آن می پردازیم. توسط اطلاعات روی وب، امکان استخراج داده و دستیابی به اطلاعات برای کاربران بسیار آسان و مطلوب شده است وعمل جستجو روی اینترنت را برای کاربران خیلی آسانتر خواهد ساخت. بنابراین بهره­های زیادی در Webminnig وجود دارد، از جمله کاوش پایگاه داده­ها روی وب یا کاوش الگوهای مورد استفاده را می­توان نام برد تا اطلاعات مفید برای کاربران تامین شوند .داده­کاوی و وب به عنوان تکنولوژی مستقل در اواسط 1990 توسعه یافت.زمان زیادی از هنگامی که پژوهشگران به صورت جدی شروع به فکر کردن در مورد Webminnig کردند نگذشته است. کارگاه Webminnig در جریان کنفرانس کشف دا نش پایگاه داده در 1999 یکی از اولین تجربه­ها بود.

Stivastava و cooley یک طبقه بندی برای Webminnigتعیین کرده­اند آنها در ابتدا Webminnig را به دو قسمت تقسیم کردند:

  • بدست آوردن الگوها از داده­ های وب
  • بدست آوردن ثبت وقایع وب

سپس طبقه­بندی به سه قسمت گسترش یافت که شامل Web content mining ، Web usage mining و Web structure mining می­باشد.

 Web content mining استخراج داده­ای است که شامل متن، ویدئو و ... روی وب می­باشد. اساساWeb content mining زیر مجموعه داده کاوی می­باشد.

Web usage mining کاوش اطلاعات درباره دسترسی به صفحات وب و شامل تحلیل click stream می­شود.

Web structure mining در مورد کاوش URL ها و دیگر لینک­های وب برای دستیابی به ساختار آنهاست.


 
 



رفتن به فهرست
کلمات کلیدی :
پیشگفتار , Web Mining ,
 



 
 

به wikipg در گوگل امتیاز بدهید