NLP入门(二)之信息抽取 数据挖掘

NLP入门(二)之信息抽取

1.什么是信息抽取(IE) 信息抽取的英文就是Information Extraction,是把文本信息转换成结构化信息。整体步骤有三步: 1. 从文本中了解到特定的信息; 2. 然后从特定信息中获取...
阅读全文
Dynamic Time Warping动态时间调整算法 数据挖掘

Dynamic Time Warping动态时间调整算法

1 入门讲解 非专业同学可以看第一章,是讲解大概DTW是解决什么问题的。 第二章讲算法的过程就没必要看了。 点与点之间的距离(相似度)可以用欧几里得距离来求得,那么两个时间序列之间的相似度如何判断呢?...
阅读全文
kalman filter-卡尔曼滤波器 数据挖掘

kalman filter-卡尔曼滤波器

先上一个卡尔曼的照片,以表敬意: 卡尔曼滤波器 英文kalman filter 这里介绍简单的,只有一个状态的滤波器 卡尔曼滤波器经常用在控制系统中、机器人系统中,但是这里主要讲解如何用在AI的大数据...
阅读全文
常见时间序列特征构建 数据挖掘

常见时间序列特征构建

下图是比赛的官方图片,电子显微镜下的微观粒子通道的模型图(这是我瞎编的,我也不知道这是啥,但应该是和离子通道有关吧,有没有医学的朋友解释一下的) 这个比赛的详情链接就放在这里了: University...
阅读全文
决策树(二)ID3,C4.5和CART 数据挖掘

决策树(二)ID3,C4.5和CART

关于决策树的purity的计算方法可以参考: 决策树purity/基尼系数/信息增益 如果有不懂得可以私信我,我给你讲。 ID3 用下面的例子来理解这个算法: 下图为我们的训练集。总共有14个训练样本...
阅读全文
决策树(一)基尼系数与信息增益 数据挖掘

决策树(一)基尼系数与信息增益

决策树简单描述 决策树的样子大概是这个样子的: 选择一个特征作为根节点,把这个特征划分成两个孩子节点,每个孩子节点就是原始数据集的子集,然后再找一个特征作为划分…… 划分的好坏,如图所示: 用纯度Pu...
阅读全文