第四种
相关思维
几年前,“大数据”一下子火了 。这要归功于一本无比畅销的通俗读物《大数据时代》
书中提出了几个(当时)挺新颖的观点 。其中有一个说大数据关注的不是因果关系,而是相关关系
这个表述虽然不准确,但至少反映了相关性是很重要的,尤其在数据种类与数理都非常丰富的情况下 。
我们在媒体里常常看到这样的报道,“百分之多少的人会更倾向于做某件事” 。举个例子,有专家发现,在经济低迷的时候,89%的女性更倾向于买口红 。
结合数据的相关思维,够帮助我们找出事物之间隐性关系 。
虽然事物有千千万万,但事物之间的相关关系常见的也不外乎这四种:
文章插图
图片来源:猫爷
(a)正相关:X数量越多,Y数量越多
(b)负相关:X数量越多,Y数量越少
(c)不相关:X数量与Y数量无关
(d)非线性相关:某一范围内,X数量越多,Y数量越多;超过某一个拐点后,X数量越多,Y数量越少 。
相关思维简单易懂,在商业中的用处很广泛 。
打比方,现在你是你们公司的市场部经理,为了提高明年的销售业绩,你最近进行一次分析,哪个媒体广告需要减少投资,哪个媒体广告需要增加投资?
关于预算分配的问题,永远都让市场部头的人头疼 。这种决策在过去是(现在很多时候也是)老板们拍脑袋想出来的 。那有没有更加科学一点的办法呢?
试试用相关思维来翻译这个问题,那就是:销售额与哪个媒体广告的投放量存在正相关呢?
这个问题一下子就具体很多了,因为X与Y都是可以被很好量化的指标 。只需要把过去几个月甚至几年的数据拉出来,Excel一算就可以知道了 。
文章插图
图片来源:网络
假设将横坐标的看作是产品销量(口红、粉底液、气垫、防晒霜等等),纵坐标看成是媒体投放渠道金额(微信、微博、爱奇艺、杂志等等) 。那么,它们的两两之间的相关系数就会形成一张系数表 。
蓝色表示两者相关关系比较强,红色表示比较弱 。那么,哪个产品更应该加大哪个投放渠道的投放量就一目了然了 。
当然,这只是一个打比方 。一个严谨的投资决策肯定不能仅靠看一个维度或一张表就能解决的 。但它给出了一个很不错的视角 。
当你手头上拥有很多数据时,不妨来一次这样的数据探索(Data exploresure),说不定会有什么新奇发现哦 。
第五种
决策树思维
决策树(Decision tree),相信这个概念对于所有学过机器学习的人都并不陌生,因为这是一种入门级的算法 。几乎每个初学者第一个接触的机器学习算法都是决策树 。
它很实用,也特别好理解,因为它跟人的思维过程很像 。
它既可以当做一个体系化的分类思维,也可以当做一个流程图甚至是一个检查清单来使用 。但不管你怎么用,决策树的框架都是不变的 。
从顶端一点开始,它一层一层往下展开 。每一层都有若干个支点,而每个支点会分解成多条支线 。就像下图一样 。
文章插图
图片来源:网络
那它究竟怎么用呢?让我来举个简单的例子
假如有一天,你去参加非诚勿扰的相亲大会,由于你读过猫爷这篇文章,所以你打算在相亲节目中使用决策树 。
你的决策树长这样:
文章插图
图片来源:猫爷
如果对方年龄太大,你立马可以排除;在年龄合适的人里,你再看他长得怎么样,颜值爆表、每天看着他的脸都可以不用吃饭的,那就别问下去了,马上就在一起 。如果长得还行,那就继续看看他的收入,以此类推 。
由于决策树越接近顶端的因素,重要性越高 。所以你对相亲对象的要求,按重要性来排序就是年龄>颜值>收入>性格 。当然,这只是一个半开玩笑的举例,以便你理解 。
决策树在商业环境中的用途也是相关广泛的 。我随便给你举几个例子:
如果你现在是银行的信用卡主管,你会给一个申请者多少信用卡额度呢?这本身就是一个决策树模型能解决的问题 。你要做的,就是找出决策树中重要的支点与支线,譬如是否高学历、是否高收入、是否在500强、是否有负债、是否已婚、是否有房产等等 。当一个申请者落在好的分支里,那就获得高额度;落在差的分支里,就得到低额度 。
推荐阅读
- 茶纪事 没想到 鸦片战争竟然是由它引起的
- 论中国茶文化在韩国的跨文化传播
- 2020年最新违章记分表!?1-12分,看看你的分是如何被扣完的?
- 各种茶类都着怎样的功效呢
- 喝通俗易懂的好茶是怎样的种感受
- 宋文化时期的茶盏,吉州窑
- 什么是真正的岩茶 教你如何选购
- 北漂租房成本5000+?来看看公租房的居住条件
- 我们喝古树茶 喝的是什么
- 丽江周边的小村落,比古城更迷人