机器学习

机器学习入门的第一课:回归

机器学习,通俗简单来说,就是用某些算法指导计算机模拟或实现人类的学习行为从已有的数据总结规律获得“经验”并不断改善自身性能的一个过程。由此可见,算法和数据是计算机学习到“新知识”或“新技能”的关键所在。 1.谈谈“回归”一词的起源 十九世纪八十年代,高尔顿和他的学生、现代统计学奠基人之一的皮尔逊(P ... »

机器学习&恶意代码静态检测

分析工具 readelf elfparser ninja GDB IDAPro Strings python库:pyelftools、lief 方法概述 | 数据/特征 | 算法模型 | 优点 | 缺点 | | | | | | | 二进制文件 | byte-ngram [7]、malConv [8] ... »

机器学习&恶意代码动态检测

写在前面 对恶意程序动态检测方法做了概述, 关于方法1和2可以参考阿里云恶意程序检测大赛; 方法3后面补充 方法4参考文末给出的文献; 1 基于API调用的统计特征 统计特征(23个): 文件相关(3) 进程相关(4) 线程(5) api调用(11) 文件操作次数文件pid跨度文件运行时间跨度 文件 ... »

机器学习&恶意代码检测简介

Malware detection 可执行文件简介 ELF(Executable Linkable Format) linux下的可执行文件格式,按照ELF格式编写的文件包括:.so、.a等 PE(Portable Executable) windows下的可执行文件格式,按照PE格式编写的文件包括 ... »

AI系统——机器学习和深度学习算法流程

现在搞传统机器学习相关的研究论文确实占比不太高,有的人吐槽深度学习就是个系统工程而已,没有数学含金量。但是无可否认的是深度学习是在太好用啦,极大地简化了传统机器学习的整体算法分析和学习流程,更重要的是在一些通用的领域任务刷新了传统机器学习算法达不到的精度和准确率。深度学习这几年特别火,就像5年前的大... ... »

吴恩达机器学习系列0——初识机器学习

机器学习(Machine Learning)作为当前最为流行的信息技术之一,已经吸引了众多人员的广泛关注,要想深度研究与掌握机器学习,了解其基础理论与应用是一条必经之路。吴恩达教授的机器学习系列视频内容通俗易懂,可以说是为广大想要探索机器学习的朋友们提供了一个入门福利。之前看吴恩达机器学习的时候做了 ... »

smallflyingfish

【转】机器学习最佳入门学习资料汇总

机器学习最佳入门学习资料汇总 专为机器学习初学者推荐的优质学习资源,帮助初学者快速入门。 这篇文章的确很难写,因为我希望它真正地对初学者有帮助。面前放着一张空白的纸,我坐下来问自己一个难题:面对一个对 »

toyking

NLP之统计机器学习中的生成式和判别式 - 翠竹林

机器学习的方法主要分为生成式和判别式两种。生成式模型:假定输入是X,类别标签是Y。产生式模型估计联合概率P(X,Y),因为可以根据联合概率来生成样本。判别式模型:假定输入是X,类别标签是Y。判别式模型 »

zcftech

机器学习 学习资料

注:该文主要用于记录机器学习相关的参考资料,其中包含大神博客、书籍、视频教程等URL链接。 该文所附所有链接资料仅做个人记录,尊重原创。 声明:本文只负责推荐,原文并非我写,尊重原创。 1.零基础入门 »

leokale-zz

机器学习知识体系

随着2016年Alpha Go在围棋击败李世石,2017年初卡内基梅隆大学人工智能系统Libratus在长达20天的鏖战中,打败4名世界顶级德州扑克玩家,这标志着人工智能技术又达到了一个新的高峰。人工 »

chihaoyuIsnotHere

数据归一化Scaler-机器学习算法

//2019.08.03下午#机器学习算法的数据归一化(feature scaling)1、数据归一化的必要性:对于机器学习算法的基础训练数据,由于数据类型的不同,其单位及其量纲也是不一样的,而也正是 »

Yanjy-OnlyOne

机器学习归一化 - mdumpling

转发:http://blog.csdn.net/zbc1090549839/article/details/44103801(请移步原文) 机器学习、数据挖掘工作中,数据前期准备、数据预处理过程、特征 »

mdumpling

机器学习文章资料汇总

机器学习领域的几种主要学习方式From Stumps to Trees to ForestsKDD-2014 – The Biggest, Best, and Booming Data Science »

mtcnn

机器学习算法总结(九)——降维(SVD, PCA)

降维是机器学习中很重要的一种思想。在机器学习中经常会碰到一些高维的数据集,而在高维数据情形下会出现数据样本稀疏,距离计算等困难,这类问题是所有机器学习方法共同面临的严重问题,称之为“ 维度灾难 ”。另 »

jiangxinyang