【机器学习基础】——线性回归

之前看过一些有关机器学习的基础资料和视频,但很多知识点都记不太清了,现在专门开个专题,根据自己的理解将之前学过的进行回顾和整理,可能会引用一些例子和资料,资料主要来源于视频学习和《统计学习方法》一书,可能对于一些不清楚的问题会翻看一些博客等资料。 本节主要针对线性回归的原理以及梯度下降求解方法进行回 ... »

【Python机器学习实战】决策树与集成学习(七)——集成学习(5)XGBoost实例及调参

上一节对XGBoost算法的原理和过程进行了描述,XGBoost在算法优化方面主要在原损失函数中加入了正则项,同时将损失函数的二阶泰勒展开近似展开代替残差(事实上在GBDT中叶子结点的最优值求解也是使用的二阶泰勒展开(详细上面Tips有讲解),但XGBoost在求解决策树和最优值都用到了),同时在求 ... »

借助亚马逊S3和RapidMiner将机器学习应用到文本挖掘

本挖掘典型地运用了机器学习技术,例如聚类,分类,关联规则,和预测建模。这些技术揭示潜在内容中的意义和关系。文本发掘应用于诸如竞争情报,生命科学,客户呼声,媒体和出版,法律和税收,法律实施,情感分析和趋 »

skyme

机器学习--项目实际过程中的经验

"pandas 在线" 《统计学方法》 李航著 《机器学习》 周志华著 清华出版社 《剑指offer》 何海涛著 一次读取大文件可能把内存爆掉, 所以可以采取分块读取 »

Frank99

机器学习技法总结(四)(aggregation,vote,bootstrap...)

研究的动机是:我们采用了不同的模型得到T个不同的g,那么我们是不是可以通过这些不同的g的融合得到更加出色的G呢?因此,便有了以上四种不同的方法;1)(select)直接选择最好的一个作为融合的结果;2 »

huty

机器学习之Bagging与随机森林笔记

集成学习通过将多个学习器进行结合,常可获得比单一学习器显著优越的泛化性能。这对“弱学习器”尤为明显,因此集成学习的很多理论研究都是针对弱学习器进行的,而基学习器有时也被直接称为弱学习器。虽然从理论上来 »

yang901112

《从机器学习到深度学习》笔记(5)集成学习之随机森林

集成学习模型与其他有监督模型的出发点大相径庭,之前的模型都是在给定的训练集上通过构建越来越强大的算法进行数据拟合。而集成学习着重于在训练集上做文章:将训练集划分为各种子集或权重变换后用较弱的基模型拟合 »

liqiang001

机器学习:随机森林

随机森林 之前所述的集成学习方法中的 boosting 方法迭代地学习一系列弱学习算法, 并且当前弱学习算法依赖于上一轮学习器的学习过程, 然后组合这些弱学习器, 构成一个强学习器, boosting »

funmore233

基于机器学习的车载CAN网络入侵检测方法研究

一、项目的基本内容,项目研究的目的,国内外研究现状、水平和发展趋势,本研究达到的科学技术水平和预期社会经济效益 项目基本内容 通过分析CAN网络的各种特性,其中包含电器特性、通信原理、协议类型以及安全 »

Weber-security

[机器学习]RNN和LSTM

RNN与LSTM详解 RNN RNN 模型: $$ h_t = f(W_xx_t+W_hh_)$$ $$ \\hat y_t = \\sigma(W_oh_t)$$ 损失函数: $$ L_t = g(\\h »

mrdragonma

初探机器学习之使用百度AI服务实现图片识别与相似图片

一、百度云AI服务 最近在调研一些云服务平台的AI(人工智能)服务,了解了一下阿里云、腾讯云和百度云。其中,百度云提供了图像识别及图像搜索,而且还细分地提供了相似图片这项服务,比较符合我的需求,且百度 »

edisonchou