# 高效学习方法 MAS
- Muilti-Dimension 多角度
- Ask 不懂就问
- Sharing 最好的学习就是分享
# 数据分析多维度
- 基础概念
- 工具
- 题库
# 数据分析的三个重要组成部分
# 全景图
数据采集
- 数据源
- 爬虫
- 日志采集
- 传感器
- 工具使用
- 八爪鱼
- 火车采集器
- 搜集客
- 爬虫编写
- phantomjs
- Scarp
- lxml
- Selenium
- 数据源
数据挖掘
- 数学基础
- 概率论与数据统计
- 线性代数
- 图论
- 最优化方法
- 基本流程
- 商业理解
- 数据理解
- 数据准备
- 模型建立
- 模型评估
- 上线发布
- 十大算法
- 分类算法
- C45
- 朴素贝叶斯
- SVM
- KNN
- Adaboost
- CART
- 聚类算法
- K-Means
- EM
- 关联分析
- Apriori
- 连接分析
- PageRank
- 分类算法
- 实战
- 如何识别手写字
- 如何进行乳腺癌症检测
- 如何对文档进行归类
- ...
- 数学基础
数据可视化
- Python 数据清洗 挖掘
- matplotlib
- Seaborn
- 第三方工具
- 微图
- DataV
- Data GIF Maker
- Python 数据清洗 挖掘
# 认知三部曲
实战
工具
认知
自上而下 疑问回答做分解
带着问题找答案
自下而上 概况总结做聚合
带着概念作总结
# 牢记原则
- 不重复造轮子
- 工具决定效率
- 熟练度
# 总结
- 记录一下每天的认知
- 这些认知对应工具的那些操作
- 做更多的联系来工具你的认知