What
- 已有的数据
- 某种模型
- 利用此模型预测未来
- 机器学习界“数据为王”思想
历史
- Python R 第一代工具 单机
- Mahaout MR 第二代工具 分布式
- Spark MLlib 第三代工具 分布式 迭代
- H2O
- Flink
历史总是惊人的相似
体现
- 计算:云计算
- 推理:专家系统
- 灵敏:事件驱动
- 知识:数据仓库
- 检索:搜索引擎
- 智慧:机器学习
用途
- 分类
- 预测
- 聚类
- 推荐
算法分类
- 有监督 学习(特征-features 样本-example 有标签)
- 分类(做成单一决策)
- 逻辑回归
- 多元线性回归
- 推荐(选择许多可能,并排序)
- 预测
- 分类(做成单一决策)
- 无监督 学习(有特征 无标签)
- 聚类
名词
- 建模
- 训练集
- 测试集
Where
Why
做机器学习的大公司
- 百度
- 谷歌 AlphaGo
- 脸书
How
- 收集数据
- 准备输入数据
- 分析输入数据
- 训练算法
- 测试算法
- 使用算法
脑图
# 机器学习 ## 算法 ### 线性回归Liner Regression ![](http://wntc-1251220317.cossh.myqcloud.com/2019/1/7/1546847995671.png) #### 误差函数/损失函数 ![](http://wntc-1251220317.cossh.myqcloud.com/2019/1/7/1546849084076.png) ##### 存在最小值 ### 回归 #### 多元线性回归 ##### 梯度下降法 ## 历史 ### 1. Python R 第一代工具 单机 ### 2. Mahaout MR 第二代工具 分布式 ### 3. Spark MLlib 第三代工具 分布式 迭代 ### 4. H2O ### 5. Flink ## 体现 ### - 计算:云计算 ### - 推理:专家系统 ### - 灵敏:事件驱动 ### - 知识:数据仓库 ### - 检索:搜索引擎 ### - 智慧:机器学习 ## 用途 ### - 分类 ### - 预测 ### - 聚类 ### - 推荐 ## 算法分类 ### - 有监督 学习(特征-features 样本-example 有标签) #### - 分类(做成单一决策) ##### - 逻辑回归 ##### - 多元线性回归 #### - 预测 #### - 推荐(选择许多可能,并排序) ### - 无监督 学习(有特征 无标签) #### - 聚类 ## 做机器学习的大公司 ### - 百度 ### - 谷歌 AlphaGo ### - 脸书