数据分析重要的是问题的理解、分析的思路、分析的流程及结果的解读,工具和编程都是实现这些分析思路的手段之一。
虽然优秀的数据分析师并非几日能速成,但入门也有入门的捷径。盘算了一下数据分析的入门知识,大体分为以下这些,只要拿出你大学时啃高数的状态,每周夯实一个基础,基本能学成。
一分钟从0制作自己的数据可视化软件, streamlit + pygwalker教程
https://github.com/Kanaries/pygwalker
数理统计学
统计学是数据分析师必备的基础知识之一,是一组用于汇总数据和量化给定观测样本域属性的工具。 单独的原始观察数据只是数据,还不能变为我们想要的信息或知识。
有了原始数据,那么接下来的问题是:
什么是最常见或可预期的观测?
观测的限制条件是什么?
数据是什么样子的?
回答这些问题,我们需要借助一些统计工具来得出一些结论。借助统计学,你的分析深度、专业度和科学性都会有很大提升。
我们需要掌握统计学的以下几大概念:
1.集中趋势(中数、众数、平均数)
2.变异(四分位数、四分位距、异常值、方差)
3.归一化(标准分数)
4.正态分布
5.抽样分布(中心极限、抽样分布)
6.估计(置性度、置信区间)
7.假设检验
8.T检验
推荐书籍:吴喜之-《统计学•从数据到结论》