یکی از مفاهیم DATA SCIENCE که خیلیها با آن آشنا نیستند مفهوم دادههای مرتب یا TIDY DATA هست.. مثلا من چند وقت پیش درگیر یک پروژه تحت نظر یکی از شرکتهای بزرگ هلندی که بودجه چند ده میلیون دلاری و یک تیم اختصاصی DATA SCIENCE داشت بودم و این شرکت یک دیتاست برای تحلیل به من داد. وقتی من دیتاست را دیدم متوجه شدم که این دیتاست از استاندارد دادههای مرتب پیروی نمیکند و طبیعتا تمامی تحلیلهای قبلی آن شرکت دارای عیب و ایراد بود. جالبتر این بود که کسی در خصوص این مفهوم و این استاندارد نمیدانست و وقتی در خصوص این مساله به آنها گفتم خیلی حال کردند و خوشحال شدند! برای هممین تصمیم گرفتم که پستی در این خصوص بنویسم چون احتمالا خیلی از ماها هم از وجود این استاندارد خبر نداریم.