آشنایی با استاندارد داده های مرتب (Tidy Data)
200, OK
https://virgool.io/@mcnakhaee/%D8%AF%D8%A7%D8%AF%D9%87-%D9%87%D8%A7%DB%8C-%D9%85%D8%B1%D8%AA%D8%A8-tidy-data-%D9%BE%D8%A7%DB%8C%D8%AA%D9%88%D9%86-%D9%BE%D8%A7%D9%86%D8%AF%D8%A7%D8%B3-daq5hol5cav0 icon

یکی از مفاهیم DATA SCIENCE  که خیلی‌ها با آن آشنا نیستند مفهوم داده‌های مرتب یا TIDY DATA  هست.. مثلا من چند وقت پیش درگیر یک پروژه تحت نظر یکی از شرکت‌های بزرگ هلندی که بودجه چند ده میلیون دلاری و یک تیم اختصاصی DATA SCIENCE  داشت بودم و این شرکت یک دیتاست برای تحلیل به من داد. وقتی من دیتاست را دیدم متوجه شدم که این دیتاست از استاندارد داده‌های مرتب پیروی نمی‌کند و طبیعتا تمامی تحلیل‌های قبلی آن شرکت دارای عیب و ایراد بود. جالب‌تر این بود که کسی در خصوص این مفهوم و این استاندارد نمی‌دانست و وقتی در خصوص این مساله به آن‌ها گفتم خیلی حال کردند و خوشحال شدند! برای هممین تصمیم گرفتم که پستی در این خصوص بنویسم چون احتمالا خیلی از ماها هم از وجود این استاندارد خبر نداریم. 

آشنایی با استاندارد داده های مرتب (Tidy Data)