不会讲段子的厨师不是好的数据科学家。

数据处理=数据料理。

做菜和做数据分析,有着相同的步骤和流程,下面以番茄炒蛋的制作流程为例,进行简要分析:

定菜单

(我们要做-番茄炒蛋) 确定数据分析的基本内容、核心问题与分析的目标、方向

image1

备食材

(番茄:自家冰箱有,鸡蛋:市场上去买) 

数据搜集是为数据分析提供素材和依据,就像是做菜把材料一样。

image1  

洗菜备菜

(番茄:清洗,去皮;鸡蛋:打散加盐)

数据处理的过程就是把数据清洗,转化,提取,就像是摘菜,洗菜一样,需要把蔬菜清洗干净才能下锅。 

image1  image1

炒菜

(先炒鸡蛋,另起锅炒番茄,最后倒回鸡蛋)

利用统计分析和数据挖掘技术对数据进行分析和研究,从中发现规律和关系。

另一方面,利用找到的规律和关系,以合理的顺序、方式合理的融合数据(食材),以便呈现最佳的结果(味道)

image1

出锅装盘

  通过数据分析把研究出来的规律和关系利用图表和文字的形式展现数来,就像是把菜做好了以后盛出来一样,是 用盘子还是用盆子就看你做什么菜了。  

image1

后记

数据分析跟做菜一样,菜品的品相靠可视化,但是味道要看厨师对食材的了解和处理流程的把握。哪怕是同样的食材,处理的步骤不同(算法不同),加料不同(融合数据),乃至装盘不同(可视化)做出来的菜可以有极大的差别。

另:数据可视化有多重要?请参考以下不同装盘菜品的差距:

image1 image1

image1 image1