机器学习

Transformer算法完全解读

2017年6月谷歌发布论文《Attention is All You Need》,提出Transformer这一引燃机器学习领域的算法。数年过去,Transformer算法在计算机视觉、自然语言处理等众多应用领域展现了极为惊艳的表现。   大家都是神经网络,为何你的腰椎间盘却如此突出?   可以... ... »

HMS Core 机器学习服务打造同传翻译新“声”态,AI让国际交流更顺畅

2022年6月,HMS Core机器学习服务面向开发者提供一项全新的开放能力——同声传译,通过AI语音技术减少资源成本,加强沟通交流,旨在帮助开发者制作丰富多样的同声传译应用。 HMS Core同声传译涵盖了机器学习服务的语音识别、翻译、语音合成等核心技术,首先把输入的实时语音转换成文字,然后再把文 ... »

hmscore

我的考研简史

封面图by:Disco Diffusion prompts:A beautiful painting of a long detour in forest 回头看,自感走过的弯路多的离谱,同龄人中一帆风顺者已是我无法高攀的存在,不知道自己为什么就这么难。 目前状态外人看来已经很舒适,但是我却还未找到 ... »

机器学习笔记——模型调参利器 GridSearchCV(网格搜索)参数的说明

GridSearchCV,它存在的意义就是自动调参,只要把参数输进去,就能给出最优化的结果和参数。但是这个方法适合于小数据集,一旦数据的量级上去了,很难得出结果。这个时候就是需要动脑筋了。数据量比较大的时候可以使用一个快速调优的方法——坐标下降。它其实是一种贪心算法:拿当前对模型影响最大的参数调优,直到最优化;再拿下一个影响最大的参数调优,如此下去,直到所有的参数调整完毕。这个方法的缺点就是可能会 »

【机器学习】手写数字识别

前言 logistic回归,是一个分类算法,可以处理二元分类,多元分类。我们使用sklearn中的logistic对手写数字识别进行实践。 数据集 MNIST数据集来自美国国家标准与技术研究所,训练集由250个不同人手写数字构成,50%高中学生,50%来自人口普查局。 数据集展示 数据集下载 百度云 ... »

机器学习(ML)八之正向传播、反向传播和计算图,及数值稳定性和模型初始化

正向传播 正向传播的计算图 通常绘制计算图来可视化运算符和变量在计算中的依赖关系。下图绘制了本节中样例模型正向传播的计算图,其中左下角是输入,右上角是输出。可以看到,图中箭头方向大多是向右和向上,其中方框代表变量,圆圈代表运算符,箭头表示从输入到输出之间的依赖关系。 反向传播   训练深度学习模型 在训练深度学习模型时,正向传播和反向传播之间相互依赖。一方面,正向传播的计算可能依赖于模型参数的 »

AI 绘画极简教程

昨天在朋友圈发了几张我用AI绘画工具Disco Diffusion画的画 既然有同学问,就写个极简教程吧,画个图是足够了,想要深入了解还是自行百度吧,可以找到更详细的教程。 第 0 步:学会上网,注册Google账号 第 1 步:打开 colab https://colab.research.goo ... »

吴裕雄 python 机器学习——ElasticNet回归

import numpy as np import matplotlib.pyplot as plt from matplotlib import cm from mpl_toolkits.mplot3d import Axes3D from sklearn import datasets, linear_model from sklearn.model_selection import tra »

机器学习笔记(六)神经网络引入及多分类问题实践

一、 神经网络引入 我们将从计算机视觉直观的问题入手,提出引入非线性分类器的必要性。首先,我们希望计算机能够识别图片中的车。显然,这个问题对于计算机来说是很困难的,因为它只能看到像素点的数值。 应用机器学习,我们需要做的就是提供大量带标签的图片作为训练集,有的图片是一辆车,有的图片不是一辆车,最终我们希望我们给出一张图片,计算机可以准确地告诉我们这是不是一辆车。 显然这需要一个非线性分类模型。 »

机器学习基础:用 Lasso 做特征选择

大家入门机器学习第一个接触的模型应该是简单线性回归,但是在学Lasso时往往一带而过。其实 Lasso 回归也是机器学习模型中的常青树,在工业界应用十分广泛。在很多项目,尤其是特征选择中都会见到他的影子。 Lasso 给简单线性回归加了 L1 正则化,可以将不重要变量的系数收缩到 0 ,从而实现了特 ... »

【笔记】机器学习 - 李宏毅 - 14 - Semi-supervised Learning

半监督学习 在监督学习中,通常训练数据有input \(x^r\), 也有output \(\hat{y}^r\)。 但是在实际情况下,数据不难收集,但做数据的标记需要花费很大的功夫。 所以半监督学习,就是利用了很多没有标记的数据\(x^u\),通常U >> R。 transductive learning: unlabeled data就是testing data, inductiv »

【机器学习】机器学习中的误差减少策略

我们在拿到样本后进行机器学习,通常可以将样本分为两部分,比如前70%用来机器学习得到Θ,后30%用来对数据进行检验。 如何进行检验? 之前我们知道,逻辑回归代价函数JΘ的计算法方法,那么此处同理,我们可以得到对测试数据的JtestΘ的表达式,然后,我们利用剩下的测试数据统计0 / 1错分率,(或称误分类率)error(hΘ(x),y),得到test error = ∑error(hΘ(x),y)/ »

【Kernel Logistic Regression】林轩田机器学习技术

最近求职真慌,一方面要看机器学习,一方面还刷代码。还是静下心继续看看课程,因为觉得实在讲的太好了。能求啥样搬砖工作就随缘吧。 这节课的核心就在如何把kernel trick到logistic regression上。 首先把松弛变量的表达形式修改一下,把constrained的形式改成unconstrained的形式。 改成这种'unconstrained' form of soft-margi »

机器学习基础 | 相似度或距离的度量

目录 Minkowski Distance Pearson Correlation Coefficient Cosine Similarity Mahalanobis Distance 参考资料 在机器学习的聚类或者分类任务中,需要度量样本间的距离或者相似度。 本文总结常见距离(相似度)的计算方法。 本文主要关注“数值数据”的相似度(距离)的度量,对于布尔数据、文本数据、图像数据的相似性度 »

【火炉炼AI】机器学习011-分类模型的评估:准确率,精确率,召回率,F1值

【火炉炼AI】机器学习011-分类模型的评估:准确率,精确率,召回率,F1值 (本文所使用的Python库和版本号: Python 3.5, Numpy 1.14, scikit-learn 0.19, matplotlib 2.2 ) 在前面的(【火炉炼AI】机器学习004-岭回归器的构建和模型评估)中,讲解了回归模型的评估方法,主要有均方误差MSE, 解释方差分,R方得分等指标。 同样的,对于 »

机器学习python实战----手写数字识别

  看了上一篇内容之后,相信对K近邻算法有了一个清晰的认识,今天的内容——手写数字识别是对上一篇内容的延续,这里也是为了自己能更熟练的掌握k-NN算法。 我们有大约2000个训练样本和1000个左右测试样本,训练样本所在的文件夹是trainingDigits,测试样本所在的文件夹是testDigits。文本文件中是0~9的数字,但是是用二值图表示出来的,如图。我们要做的就是使用训练样本训练模型,并 »

机器学习-02-数据清洗和特征选择

  1.  老版本用Imputer import numpy as np from sklearn.preprocessing import Imputer X = [ [2, 2, 4, 1], [np.nan, 3, 4, 4], [1, 1, 1, np.nan], [2, 2, np.nan, 3] ] # missing_values(缺失值),st »