美滋滋的生活
集成学习 集成学习
[TOC] 1 集成学习集成学习,通过构建并结合多个机器学习器来完成学习任务 常见的集成学习框架有2种: Bagging: 基学习器之间无强依赖关系,可并行生成 Boosting:有强依赖关系,必须串行生成 Bagging 有放回的随机
2021-07-01
无监督学习 无监督学习
[TOC] 1 聚类 聚类定义:根据数据中样本与样本之间的距离或相似度,将样本划分为若干组/类/簇 划分的原则:类内样本距离小、类间样本距离大 聚类类型 基于划分的聚类(无嵌套) 层次聚类(嵌套) 聚类分析的“三要素” 如何定义样本点
2020-01-05
概率图模型 概率图模型
[TOC] 1 概率图模型机器学习最重要的任务,是根据一些己观察到的证据(例如训练样本)来对感兴趣的未知变量(例如类别标记)进行估计和推测。 概率图模型(probabilistic graphical model)是一类用图来表达变量相关关
2019-12-07
概率图模型-CRF 概率图模型-CRF
[TOC] 1 马尔可夫随机场MRF马尔可夫随机场是典型的马尔可夫网,即一个无向图模型。 马尔可夫随机场表示的随机变量之间具有马尔可夫性 成对马尔可夫性:给定Yo的条件下,Yu和Yv条件独立 局部马尔可夫性 全局马尔可夫性
2019-12-07
线性回归与逻辑回归 线性回归与逻辑回归
[TOC] 1 线性回归1.1 简介简单来说,线性回归算法就是找到一条直线(一元线性回归)或一个超平面(多元线性回归)能够根据输入的特征向量来更好的预测输出y的值。 y = w_0x_0 + \cdots + w_px_p + b =
2019-12-05
决策树 决策树
1. 决策树[TOC] 1.1 简介决策树是一个分而治之的递归过程。 构建根节点,初始化特征集合和数据集合; 选择最优特征,并划分子集,更新数据集合和特征集合; 继续划分直到所有训练数据基本划分正确。 决策树学习的关键问题:特征选择、
2019-12-02
机器学习/概率图模型-HMM 机器学习/概率图模型-HMM
[TOC] 1 马尔可夫模型1.1 概念导入在某段时间内,交通信号灯的颜色变化序列是:红色 - 黄色 - 绿色 - 红色。 在某个星期天气的变化状态序列:晴朗 - 多云 - 雨天。 像交通信号灯一样,某一个状态只由前一个状态决定,这就是一个
2019-11-28
SVM SVM
SVM[TOC] 1 整体概览 什么是SVMSVM 是一种二分类模型。它的基本思想是在特征空间中寻找间隔最大的分离超平面使数据二分类 线性可分支持向量机——硬间隔支持向量机 线性支持向量机——软间隔支持向量机 非线性支持向量机——核技巧
2019-11-28