机器学习

图数据挖掘:级联的概率模型和疾病传播

这篇博客我们来介绍基于概率的级联行为模型,这种模型更关注系统整体,不过缺少对个体行为动机的刻画。基于随机树的传染病模型是分支过程(branching processes)的一种变种。在这种模型中,一个病人可能接触d个其他人,对他们中的每一个都有概率q>0将其传染,接下来我们来看当d和q取何值时,流行... ... »

图数据挖掘(二):网络的常见度量属性

网络的度分布p(k)表示了一个随机选择的节点拥有度$k$的概率。我们设度为k的节点数目Nk =#nodes with degree k,除以节点数量N则可得到归一化后的概率质量分布 p(k) = Nk/N。图的路径(path)指一个节点序列,使得序列中的每个节点都链接到序列中的下一个节点,一个路径... ... »

图数据挖掘(一):网络的基本概念和表示方法

网络(network)是一些通过链接(links)连接起来的对象集合,它包含以下成分:对象:节点(nodes)/顶点(vertices), 用N表示;交互:链接(links)/边(edges),用E表示;对象和交互组成的系统我们就称为网络(或图,graph),用G(N,E)表示。 ... »

orion-orion

如何在 Azure 机器学习工作室中使用 Vantage 数据

作者鲁帕尔沙阿最后更新于 2022 年 2 月 14 日 警告本文来自 Teradata 公司网站入门这是在 中发布的内容的删节版本。我们不保证所发布内容的准确性、完整性、可靠性或最新性。具体内容请参考原文。另外,如果您有任何需要或更正的要求或更正,请发表评论。 概述 Azure 机器学习 »

联邦学习:联邦异构知识图谱划分

在联邦场景下,C个知识图谱位于不同的客户端上。知识图谱拥的实体集合之间可能会存在重叠,而其关系集合和元组集合之间则不会重叠。我们联系一下现实场景看这是合理的,比如在不同客户端对应不同银行的情况下,由于不同银行都有着自己的业务流程,所以关系集合不重叠。本文我们来看具体在实验环节怎么去划分联邦异构知识图... ... »

机器学习实战-AdaBoost

1.概念 从若学习算法出发,反复学恶习得到一系列弱分类器(又称基本分类器),然后组合这些弱分类器构成一个强分类器。简单说就是假如有一堆数据data,不管是采用逻辑回归还是SVM算法对当前数据集通过分类器data进行分类,假如一些数据经过第一个分类器之后发现是对的,而另一堆数据经过第一个分类器之后发现 ... »

知识图谱实体对齐3:无监督和自监督的方法

我们在前面介绍的都是有监督的知识图谱对齐方法,它们都需要需要已经对齐好的实体做为种子(锚点),但是在实际场景下可能并没有那么多种子给我们使用。为了解决这个问题,有许多无监督/自监督的知识图谱对齐方法被提出。其中包括基于GAN的方法,基于对比学习的方法等。他们在不需要事先给定锚点的情况下将来自不同知识... ... »

机器学习实战-支持向量机

本文讲解了SVM的原理,以及代码中用到的公式手写的推导的过程,以及对应的SVM简单代码的实现及详解,还有加入核函数解决非线性函数的的方法及代码的详解 ... »

我应该学习机器学习什么? 4 必须阅读的书为那些谁

介绍 自从我成为没有经验的工程师以来已经过去了两年。从今年年初开始,我也参与了机器学习项目。起初,要学习的东西太多,我很犹豫,但我拼命尝试提供意见。 我认为有些人被机器学习和人工智能这两个词所吸引,并想成为工程师。对于这些人,我想介绍一些我在过去一年左右读过的一些我认为特别好的技术书籍,希望他们能找 »

python机器学习pytorch自定义数据加载器

目录 正文 1. 加载数据集 2. 迭代和可视化数据集 3.创建自定义数据集 3.1 __init__ 3.2 __len__ 3.3 __getitem__ 4. 使用 DataLoaders 为训练准备数据 5.遍历 DataLoader 正文 处理数据样本的代码可能会逐渐变得 »

机器学习实战-Logistic回归

1.基于 Logistic 回归和 Sigmoid 函数的分类 逻辑回归适合于01情况的分类就是描述一个问题是或者不是,所以就引入sigmoid函数,因为这个函数可以将所有值变成0-1之间的一个值,这样就方便算概率 首先我们可以先看看Sigmoid函数(又叫Logistic函数)将任意的输入映射到了 ... »

twq46

vivo互联网机器学习平台的建设与实践

vivo 互联网产品团队 - Wang xiao 随着广告和内容等推荐场景的扩展,算法模型也在不断演进迭代中。业务的不断增长,模型的训练、产出迫切需要进行平台化管理。vivo互联网机器学习平台主要业务场景包括游戏分发、商店、商城、内容分发等。本文将从业务场景、平台功能实现两个方面介绍vivo内部的机 ... »

vivotech

吴恩达机器学习复习3:分类、假设的表示方法、决策边界、损失函数、简化的损失函数和梯度下降、梯度下降、高等优化、多级分类

【分类】 ①两类或二分类问题:输出值为0或1 ②多分类问题:比如y可能有4个值,0、1、2、3 有关肿瘤的分类问题 如果使用线性回归处理分类问题? 为了尝试分类,方法是使用线性回归并且把大于0.5的映射为1,小于0.5的映射为0 然而这种方法并不能正常工作,因为分类不是一个线性函数 【假设的表示方法 ... »

asandstar

吴恩达机器学习复习2:多重特征、多重变量的梯度下降、梯度下降实践Ⅰ:数据特征缩放、梯度下降实践Ⅱ:学习率、特征和多项式回归、正规方程法、向量化

【多重特征】 多变量线性回归 可以有任何输入变量的等式的表示方法 假设 使用矩阵乘法的定义,我们的多变量假设功能可以被简洁地描述为 这是未来我们为训练例子的准备的假设函数的向量化 【多重变量的梯度下降】 假设 参数 代价函数 梯度下降的步骤 原来的算法(n=1) 反复做{ 角度0 = 原角度0-学习 ... »

asandstar

详解机器学习中的数据处理(二)——特征归一化

在机器学习中,我们的数据集往往存在各种各样的问题,如果不对数据进行预处理,模型的训练和预测就难以进行。这一系列博文将介绍一下机器学习中的数据预处理问题,以UCI数据集为例详细介绍缺失值处理、连续特征离散化,特征归一化及离散特征的编码等问题,同时会附上处理的Matlab程序代码,这篇博文先介绍下特征归... ... »

机器学习实战-朴素贝叶斯

本文讲述了朴素贝叶斯的原理,概率的计算方式,给出代码的详细解释,并最后给出代码的运行过程的总结,然后又用了两个实例来讲述朴素贝叶斯代码的计算过程 ... »