3. 数据确认
当需求确认清楚之后,接下来需要确认数据源,可能会遇到 3 个问题 。
第 1 个问题:期望的数据没有存储 。
作为数据分析师,如果你能帮助改善这个问题,让企业的数据更加完备,那么你的影响力将会得到提升 。
第 2 个问题:数据分散在不同的位置 。
在传统企业,这个问题非常普遍,可能还没有建立数据仓库 。对于互联网企业,这个问题体现了数据仓库设计的不完备 。
如果不是经常性的问题,临时解决即可 。如果是经常性的问题,建议数据分析师主动了解底层的数据逻辑,编写自动化的代码,在可能的情况下,交付给数据仓库团队 。
第 3 个问题:数据源错误 。
这个问题非常致命,如果数据源不对,后面的分析结果可能造成误导,让需求方做出错误决策,后果不堪设想 。
所以,数据分析师提高数据敏感度也很重要,在做数据分析之前,一定要先确认一下,数据源是正确无误的吗?
4. 实现中
在需求实现的过程中,数据分析师要管理好自己的分析代码 。
以 Python 为例,尽量使用 Numpy、Pandas、Matplotlib 等比较成熟的包,用 Git 做好代码的版本控制,特别注意代码注释和提交信息的可读性和完整性,让数据处理的每个步骤都清晰易懂 。
另外,配合使用 Jupyter Lab 之类的工具,能大大提升数据分析的工作效率 。
一方面,我们要把好的经验和方法,沉淀为固定的流程步骤,实现工作的流程化 。比如一个数据报表,用怎样的格式和规范,读者容易抓住其中最有价值的信息?
另一方面,我们还要实现流程的工具化 。因为总有人会「偷懒」,总有人会逾越流程,总有人会偷偷地绕过流程 。所以,我们要适应用工具来辅助流程的执行 。
如果流程工具用起来不适应,怎么办?
华为早年引入集成产品开发 (简称 IPD)的流程,大家刚开始也不适应 。
任正非说了一句话:先僵化、后优化、再固化 。
5. 交付
突出主要分析结论,这是数据分析交付的重要内容 。
如果分析没有结论,就不能称之为交付 。
交付的内容,包括文字、表格、图形等要素 。文字表述要条理清晰,表格制作要标准规范,数据可视化的图形要选择合理 。
6. 复盘
很多数据分析工作,最终停留在「交付」这个状态,数据分析师交付结果之后,往往没有去跟进后续的效果情况,没有对分析的价值进行判断,没有进行复盘总结 。
交付之后,不妨思考一下,我们通过数据分析,帮助需求方做出了哪些正确的决策?给企业带来了哪些价值?与当初预期的目标相差多少?关键因素有哪些?假如重新再做一遍,怎么做才能做得更好?
猜你喜欢
- 如何找回删除的微信 如何找回删除的微信好友
- Twice成员朴志效的简介 姜丹尼尔朴志效分手了吗
- 科普下纤维素的作用有哪些
- 失去的微信聊天 失去的微信聊天记录能恢复吗
- 刘子行寿命为什么只有三年 刘子行是什么朝代的历史人物
- ios有什么虚拟的定位 ios有什么虚拟的定位软件有哪些
- 对方手机怎么操作 vivo手机怎么查别的手机的
- 跟满天星很像的花
- 年数总和折旧计算举例 年数总和法计提折旧的公式
- 文玩猴头是什么植物的种子
