اندازهی قلم متن
تخمین مدت زمان مطالعهی مطلب:
دو دقیقه
پیشتر مطالبی در رابطه با مفاهیم مخزن داده و داده کاوی در سایت آمده است: ^ و ^ و ^.
در این سری مقالات به معرفی الگوریتمهای داده کاوی مایکروسافت و نحوه کار کردن با آنها در محیط SQL Server Data Tools (SSDT) میپردازیم. بیشتر متن مقاله ترجمه آزاد از کتاب معروف Data Mining with Microsoft SQL Server 2008 می باشد که یکی از بهترین کتابها در زمینه داده کاوی است. از آنجائیکه دسته بندی الگوریتمهای داده کاوی در SQL Server 2016 نسبت به SQL Server 2008 قدری متفاوت میباشد و کتاب فوق به دلیل ورژن SQL قدیمیتر، این موضوع را درنظر نگرفته است، بنابراین تغییرات ورژن جدید دسته بندی الگوریتمها نیز لحاظ شده است. جهت درک بهتر مطالب، سعی شدهاست مثال و توضیحاتی براساس تجربه کاری آورده شود.
برای دریافت SSDT میتوانید به اینجا مراجعه نمایید.
پس از دریافت و نصب SSDT میتوان به Visual Studio مراجعه نمود و یک پروژه Analysis Services Multidimensional and Data Mining یا به اختصار SSAS-M را به شکل زیر ایجاد کرد.
پس از ایجاد یک پروژه SSAS-M میتوان در بخش Mining Structure یک ساختار داده کاوی را به شکل زیر ایجاد نمود.
حال بایستی توسط ویزارد، ساختار داده کاوی مورد نظر را ایجاد نمود. در صفحه اول ویزارد، مخزن داده را مشخص مینماییم.
در صفحه بعد الگوریتم موردنظر را انتخاب مینماییم.
بدیهی است که پس از ساخت ساختار داده کاوی میتوان الگوریتمهای دیگری را نیز برای مدل کردن مخزن داده به کار برد.
در این مقاله فرض شده است که خواننده نحوه ساخت Cube و Dimension را در یک پروژه SSAS-M توسط SSDT ، میداند. در صورتیکه به داده کاوی و هوش تجاری علاقمند هستید و به مقدمات بیشتری در رابطه با مطالب فوق نیاز دارید، پیشنهاد میشود که فصلهای یک، سه و چهار کتاب فوق را جهت آشنایی بیشتر مطالعه نمایید.
همانطور که در شکل آخر نیز نشان داده شده است SSDT دارای الگوریتمهای زیر است:
- Microsoft_Naive_Bayes
- Microsoft_Decision_Trees
- Microsoft_Linear_Regression
- Microsoft_Clustering
- Microsoft_ Association_Rules
- Microsoft_Neural_Network
- Microsoft_Logistic_Regression