两大杀手锏!大数据轻松拿下

大数据是现在非常热的一个词 , 听起来是非常高端的东西 , 但实际上很多人都没接触过 , 那么什么叫大数据呢?就是很大的数据 , 哈哈 , 开个玩笑 。 其实大数据的概念非常深奥 , 我们这里就不谈那么宽泛的东西了 , 只谈一下和工作有关的大数据吧 。 例如我们平时工作都会接触到一些数据量很大的表格 , 可能是几百万甚至是几千万条的数据 , 如果不用一些特定的工具是很难完成分析的 , 对于不会这些工具的小白来说 , 无疑是一个非常头疼的事情 。
两大杀手锏!大数据轻松拿下
文章图片
此时我手上有一份汽车行业的数据源 , 一共有9800万条数据 , 接近一亿条数据 , 如果用EXCEL去处理的话 , 根本是不可能完成的事情 , 不要说分析了 , 就连打开文件也没办法做到 。 我们之前的文章说过 , EXCEL只能处理轻量级的数据 , 如果数据量超过百万行就会非常吃力 , 这是EXCEL的通病 , 也和EXCEL的人群定位有关 , 只适合小型企业或者个人去使用 , 中型以上的公司就会用其他的工具去分析大数据 , 例如会用到PYTHON、R语言、MYSQL等大数据处理工具 。
两大杀手锏!大数据轻松拿下
文章图片
但是这些工具不好的地方就是要写代码 , 你要知道 , 大部分人都并非是学计算机出身的 , 如果要理解这些代码都绝非是一件非常容易的事 , 更不用叫你写代码了 , 所以对于一般人来说 , 最实用的方法是直接用现成的数据处理软件 , 例如BI软件 。 BI软件的优点就是可以直接与数据库进行相连 , 又可以提供强大的数据可视化组件 , 所以很多企业都是直接购买这些软件 , 既可以提高效率 , 又可以节省人力成本 。 市场上有很多非常强大的BI软件 , 例如Tableau、powerBI、SmartBI等 , 这里以SmartBI的智分析为参考 , 直接上干货 , 教你如何高效率地去处理大数据 , 下面介绍的是两个非常好用的方法 。
1、即席查询
所谓即席查询 , 基本的含义就是可以查询明细数据及明细数据导出 , 通过简单的鼠标勾选数据字段与拖拽条件字段快速获得所需数据 , 并提供聚合计算、告警规则、重定义表关系、改变条件组合逻辑等高级功能 。 这段话有点复杂 , 那我们通过案例去解释一下 。
比如我们把上那份汽车的数据源连接好了 , 我们就可以对数据源进行字段的拉取 , 你可以自由筛选你需要分析的字段 , 而不需要把所有的字段都选上 。 筛选好了数据字段之后 , 你就可以把这个当成是一个数据集 , 保存在云端里 。 这个有点类似于你在MYSQL里写select的查询语句 , 但这里不一样的是你不用通过手写语句去查询 , 而是通过鼠标去拉拽就行了 , 非常地简单和高效率 。
两大杀手锏!大数据轻松拿下
文章图片
两大杀手锏!大数据轻松拿下
文章图片
把相应的字段拉拽完成后 , 点击保存 , 便可以进入下面的透视分析了 。
2、透视分析
透视分析是什么呢?用过EXCEL的人都知道 , 透视图是EXCEL里非常好用的一个功能 , 可以把整份数据源进行透视和分析 。 那么透视分析也是类似Excel透视表的方式 , 可以任意拖拽字段到行区、列区、度量区、待选列、过滤条件区域等 , 并且支持多维度 , 多角度钻取、切片、条件筛选、排序、告警、图表联动、复杂逻辑计算等操作 。
下面我们以汽车数据源为案例进行说明 , 这里再强调一下 , 这份数据是接近一亿行的数据量 。 我们接下来点击即席查询里的透视 , 就可以对数据源进行透视分析了 。
两大杀手锏!大数据轻松拿下
文章图片
打开透视分析之后 , 会出现一个新的界面 , 这个界面和EXCEL里的透视表差不多 , 可以在右边进行数据字段的选取 , 只要把分析字段拉拽到行区、列区、度量区 , 点击刷新 , 便可以得到你想要的分析结果 。 例如我这里选取了车系、行业和销售量 , 不到几秒钟的时间 , 便把几千万行数据量的表格完成了透视 , 是在是太惊人了 。
两大杀手锏!大数据轻松拿下
文章图片
如果你想增加其他的字段 , 这里也提供了非常智能和人性化的功能 , 例如你想增加同期值、环比增长等数据 , 透视分析也可以快速实现 , 不需要写任何代码和公式 , 是不是非常方便呢?
两大杀手锏!大数据轻松拿下
文章图片
【两大杀手锏!大数据轻松拿下】通过以上介绍的即席查询和透视分析两个非常强大的方法 , 你便可以快速对大数据进行分析和处理 , 在时间成本变得愈来愈重要的今天 , 这两个方法无疑是非常好的选择 , 非常适合在实际的业务场景中去使用 。
两大杀手锏!大数据轻松拿下
文章图片


    推荐阅读