خوشه بندی در داده کاوی
خوشه بندی در دیتا کاوی
امروزه با اشاعه سیستم های پایگاهی و حجم بالای دیتا ها ی ذخیره شده در این سیستم ها ، نیاز به ابزاری است الی بتوان دیتا های ذخیره شده را پردازش کردواطلاعات حاصل از این پردازش را در اختیار کاربران قرار داد .
با به کارگیری پرسش های ساده در SQL و ابزارهای گوناگون گزارش گیری معمولی ، می نا اطلاعاتی را در اختیار کاربران پیمان عدل لغایت بتوانند به نتیجه گیری در باره داده ها و روابط منطقی میان آنها بپردازند ولی وقتی که حجم دیتا ها بالا باشد ، کاربران هر چند زبر دست و با تجربه باشند نمی توانند الگوهای مفید را در میان حجم انبوه دیتا ها تشخیص دهند و یا اگر قادر به این شغل هم با شند ، هزینه عملیات از نظر نیروی انسانی و مادی بسیار بالا است .
از سوی دیگر کاربران معمولا فرضیه ای را مطرح می کنند و سپس بر اساس گزارش ها تماشا شده به پابرجا کردن یا رد فرضیه می پردازند ، در حالی که امروزه نیاز به روشهایی است که اصطلاحا به کشف دانش بپردازند یعنی با کمترین دخالت کاربر و به چهره اتوماتیک الگوها و رابطه های منطقی را بیان نمایند .
داده کاوی یکی از مهمترین این روشها است که به وسیله آن الگوهای مفید در دیتا ها با حداقل دخالت کاربران شناخته می شوند و اطلاعاتی را در اختیار کاربران و تحلیل گران قرار می دهند الی طبق آنها تصمیمات مهم و حیاتی در سازمانها اتخاذ شوند .
در دیتا کاوی از بخشی از دانش آمار به اسم تحلیل اکتشافی دیتا ها استفاده می شود که در آن بر کشف اطلاعات بالقوه و ناشناخته از داخل حجم انبوه داده ها تاکید می شود . علاوه بر این داده کاوی با هوش مصنوعی و یادگیری ماشین نیز ارتباط تنگاتنگی دارد ، بنابراین می طاقت گفت در دیتا کاوی تئوریهای پایگاه داده ها ، هوش مصنوعی یادگیری ماشین و علم شمردن را در هم می آمیزند الی زمینه کاربردی فراهم شود .
باید توجه داشت که اصطلاح داده کاوی زمانی به پیشه اسیر می شود که با حجم بزرگی از دیتا ها ، در بی گمان مگا یا ترابایت ، روبرو باشیم . در تمامی منابع داده کاوی بر این مطلب تاکید شده است .
هر چه حجم دیتا ها بیشتر و روابط میان آنها پیچیده تر باشد دسترسی به اطلاعات خفته در میان دیتا ها مشکلتر می شود و نقش داده کاوی به عنوان یکی از روشهای کشف دانش ، صریح تر می گردد .
این پروژه حائز سه فصل است که در فصل اول درباره تاریخچه و مفاهیم کلی داده کاوی پرداخته ام و در فصل دوم به مراحل فرایند کشف فرهنگ از پایگاه داده ها پرداخته ام و در فصل سوم به طور کلی به نتیجه گیری دسته بندی در دیتا کاوی پرداخته ام.
به چهره فایل word قابل ویرایش