داده کاوی (Data Mining (Data Analytics
داده کاوی یا DATA MINING یکی از بهترین ابزارهای مهندسی صنایع می باشد و همچنین کاربرد بسیاری در بازار کار مهندسی صنایع دارد. آموزش داده کاوی یکی از مهمترین سرفصل ها در دوره های آموزشی مهندسی صنایع می باشد.
فرآیند مرتب سازی در مجموعه ای از داده های بزرگ برای شناسایی الگوها و مشخص کردن روابط برای حل مشکلات آنالیز داده ها است. ابزارهای داده کاوی این امکان را برای شرکتها فراهم میسازد تا روند آینده خود را پیشبینی کنند.
انواع متعددی از داده ها را میتوان در پایگاههای داده جمع آوری نمود و باتوجه به رشد روزافزون داده ها روشهای سنتی دیگر برای آنالیز پاسخگو نیستند. درحال حاضر داده کاوی مهمترین فناوری برای استخراج دانش از این مقدار حجیم داده است.
داده کاوی رشته جدیدی است که با تحقیقات در رشته های علوم کامپیوتر، آمار، مدیریت پایگاه داده و یادگیری ماشین ایجاد شده است. تعاریف متعددی برای داده کاوی ارائه شده است که به چند مورد اشاره مینماییم.
داده کاوی به معنتی جستجو کردن در پایگاههای داده جهت پیدا کردن الگو در میان داده ها است. همچنین به معنی تحلیل و تجزیه روابط میان داده هایی است که قابل مشاهده هستند. در جایی دیگر داده کاوی فرایندی معرفی شده است که از ابزارهای مختلف تحلیل برای پیدا کردن روابط بین داده ها و الگوها استفاده میکند.
داده کاوی استخراج دانش موجود در موضوعات مورد بررسی است و میتواند انواع متفاوتی داشته باشد. الگوهای پیدا شده معمولا نشان دهنده روابط میان ویژگیهای یک سیستم هستند.
انواع روشهای داده کاوی معمولا از تکنیک آموزش براساس استنتاج استفاده میکنند.
برخی منابع اصطلاح کشف دانش در پایگاه داده (Knowledge Discovery in DB (KDD را جایگزین داده کاوی کرده اند. دراصل KDD یکی از روشهای داده کاوی است که مراحل مختلفی دارد در مرحله اول داده ها تهیه و استخراج میگردند و در مرحله دوم درخصوص کاری که باید انجام شود تصمیم گیری میشود.
مراحل مختلف داده کاوی
-
اطلاعات گذشته شناسایی میشوند.
-
پردازش اولیه بر روی داده ها و اطلاعات انجام میگردد، خطاهای داده ها و اطلاعات مشخص شده و تصحیح میگردند و پس از آن اطلاعات درست با داده های اشتباه جایگزین میشوند. این مرحله زمان زیادی از داده کاوی را به خود اختصاص میدهد.
-
به طور کلی داده ها از منابع مختلفی گردآوری میشوند و برای انجام بهتر داده کاوی باید آنها را بطور مناسب در یک مجموعه انبار نمود که به آن یکپارچه سازی داده ها گفته میشود.
-
در این مرحله با توجه به هدف داده کاوی داده های مناسب انتخاب میگردند.
-
ایجاد و یافتن ویژگیهای مناسب در داده ها و نمایش داده ها به نحوی که بتوان داده کاوی را انجام داد.
-
عملیات داده کاوی شامل طبقه بندی، پیشبینی و… انتخاب میگردد.
-
در این مرحله روش مناسب برای داده کاوی نتخاب میگردد. روشی مانند درخت تصمیم و یا روش شبکه های عصبی
-
عملیات داده کاوی و پیدا کردن الگوی مناسب شروع میشود.
-
پس از بدست آمدن الگوها عملیات تحلیل و ارزیابی بر روی آنها انجام گردیده و الگوهایی که نامناسب هستند حذف میگردند.
-
درنهایت تفسیر و نتایج و استخراج اطلاعات انجام میگردد.
Leave A Comment