یکی از مفاهیم DATA SCIENCE که خیلیها با آن آشنا نیستند مفهوم دادههای مرتب یا TIDY DATA هست.. مثلا من چند وقت پیش درگیر یک پروژه تحت نظر یکی از شرکتهای بزرگ هلندی که بودجه چند ده میلیون دلاری و یک تیم اختصاصی DATA SCIENCE داشت بودم و این شرکت یک دیتاست برای تحلیل به من داد. وقتی من دیتاست را دیدم متوجه شدم که این دیتاست از استاندارد دادههای مرتب پیروی نمیکند و طبیعتا تمامی تحلیلهای قبلی آن شرکت دارای عیب و ایراد بود. جالبتر این بود که کسی در خصوص این مفهوم و این استاندارد نمیدانست و وقتی در خصوص این مساله به آنها گفتم خیلی حال کردند و خوشحال شدند! برای هممین تصمیم گرفتم که پستی در این خصوص بنویسم چون احتمالا خیلی از ماها هم از وجود این استاندارد خبر نداریم.
مطالب مشابه
- اشتراکها
نگهداری مرتب تر کدها با افزونه Tidyاشتراکها
سرمایه گذاری 75 میلیون دلاری مایکروسافت برای آموزش علوم رایانهاشتراکها
سری هفت قسمتی «Data Science»اشتراکها
یک HTML TIDY آنلاین - ابزاری برای تشخیص و رفع عیوب کدهای HTMLاشتراکها
کنفرانس Machine Learningاشتراکها
تمرینهایی از SQLاشتراکها
دورههای رایگان فراگیری Data Scienceاشتراکها
هندبوک علم رایانهمطالب
بررسی کارآیی کوئریها در SQL Server - قسمت هفتم - بررسی عملگر Nested loop در یک Query Planمطالب
تعریف انبار داده Data Warehouse