机器学习

What

  • 已有的数据
  • 某种模型
  • 利用此模型预测未来
  • 机器学习界“数据为王”思想

历史

  1. Python R 第一代工具 单机
  2. Mahaout MR 第二代工具 分布式
  3. Spark MLlib 第三代工具 分布式 迭代
  4. H2O
  5. Flink

历史总是惊人的相似

历史总是惊人的相似

体现

  • 计算:云计算
  • 推理:专家系统
  • 灵敏:事件驱动
  • 知识:数据仓库
  • 检索:搜索引擎
  • 智慧:机器学习

用途

  • 分类
  • 预测
  • 聚类
  • 推荐

算法分类

  • 有监督 学习(特征-features 样本-example 有标签)
    • 分类(做成单一决策)
      • 逻辑回归
      • 多元线性回归
    • 推荐(选择许多可能,并排序)
    • 预测
  • 无监督 学习(有特征 无标签)
    • 聚类

名词

  • 建模
  • 训练集
  • 测试集

Where

Why

做机器学习的大公司

  • 百度
  • 谷歌 AlphaGo
  • 脸书

How

  1. 收集数据
  2. 准备输入数据
  3. 分析输入数据
  4. 训练算法
  5. 测试算法
  6. 使用算法

脑图

# 机器学习 ## 算法 ### 线性回归Liner Regression ![](http://wntc-1251220317.cossh.myqcloud.com/2019/1/7/1546847995671.png) #### 误差函数/损失函数 ![](http://wntc-1251220317.cossh.myqcloud.com/2019/1/7/1546849084076.png) ##### 存在最小值 ### 回归 #### 多元线性回归 ##### 梯度下降法 ## 历史 ### 1. Python R 第一代工具 单机 ### 2. Mahaout MR 第二代工具 分布式 ### 3. Spark MLlib 第三代工具 分布式 迭代 ### 4. H2O ### 5. Flink ## 体现 ### - 计算:云计算 ### - 推理:专家系统 ### - 灵敏:事件驱动 ### - 知识:数据仓库 ### - 检索:搜索引擎 ### - 智慧:机器学习 ## 用途 ### - 分类 ### - 预测 ### - 聚类 ### - 推荐 ## 算法分类 ### - 有监督 学习(特征-features 样本-example 有标签) #### - 分类(做成单一决策) ##### - 逻辑回归 ##### - 多元线性回归 #### - 预测 #### - 推荐(选择许多可能,并排序) ### - 无监督 学习(有特征 无标签) #### - 聚类 ## 做机器学习的大公司 ### - 百度 ### - 谷歌 AlphaGo ### - 脸书

Juforg wechat
欢迎您扫一扫上面的微信公众号,订阅我的博客!