array(2) {
  ["docs"]=>
  array(10) {
    [0]=>
    array(10) {
      ["id"]=>
      string(3) "428"
      ["text"]=>
      string(77) "Visual Studio 2017 单独启动MSDN帮助（Microsoft Help Viewer）的方法"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(8) "DonetRen"
      ["tagsname"]=>
      string(55) "Visual Studio 2017|MSDN帮助|C#程序|.NET|Help Viewer"
      ["tagsid"]=>
      string(23) "[401,402,403,"300",404]"
      ["catesname"]=>
      string(0) ""
      ["catesid"]=>
      string(2) "[]"
      ["createtime"]=>
      string(10) "1511400964"
      ["_id"]=>
      string(3) "428"
    }
    [1]=>
    array(10) {
      ["id"]=>
      string(3) "427"
      ["text"]=>
      string(42) "npm -v；报错 cannot find module "wrapp""
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(4) "zzty"
      ["tagsname"]=>
      string(50) "node.js|npm|cannot find module &quot;wrapp“|node"
      ["tagsid"]=>
      string(19) "[398,"239",399,400]"
      ["catesname"]=>
      string(0) ""
      ["catesid"]=>
      string(2) "[]"
      ["createtime"]=>
      string(10) "1511400760"
      ["_id"]=>
      string(3) "427"
    }
    [2]=>
    array(10) {
      ["id"]=>
      string(3) "426"
      ["text"]=>
      string(54) "说说css中pt、px、em、rem都扮演了什么角色"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(12) "zhengqiaoyin"
      ["tagsname"]=>
      string(0) ""
      ["tagsid"]=>
      string(2) "[]"
      ["catesname"]=>
      string(0) ""
      ["catesid"]=>
      string(2) "[]"
      ["createtime"]=>
      string(10) "1511400640"
      ["_id"]=>
      string(3) "426"
    }
    [3]=>
    array(10) {
      ["id"]=>
      string(3) "425"
      ["text"]=>
      string(83) "深入学习JS执行--创建执行上下文（变量对象，作用域链，this）"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(7) "Ry-yuan"
      ["tagsname"]=>
      string(33) "Javascript|Javascript执行过程"
      ["tagsid"]=>
      string(13) "["169","191"]"
      ["catesname"]=>
      string(0) ""
      ["catesid"]=>
      string(2) "[]"
      ["createtime"]=>
      string(10) "1511399901"
      ["_id"]=>
      string(3) "425"
    }
    [4]=>
    array(10) {
      ["id"]=>
      string(3) "424"
      ["text"]=>
      string(30) "C# 排序技术研究与对比"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(9) "vveiliang"
      ["tagsname"]=>
      string(0) ""
      ["tagsid"]=>
      string(2) "[]"
      ["catesname"]=>
      string(8) ".Net Dev"
      ["catesid"]=>
      string(5) "[199]"
      ["createtime"]=>
      string(10) "1511399150"
      ["_id"]=>
      string(3) "424"
    }
    [5]=>
    array(10) {
      ["id"]=>
      string(3) "423"
      ["text"]=>
      string(72) "【算法】小白的算法笔记：快速排序算法的编码和优化"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(9) "penghuwan"
      ["tagsname"]=>
      string(6) "算法"
      ["tagsid"]=>
      string(7) "["344"]"
      ["catesname"]=>
      string(0) ""
      ["catesid"]=>
      string(2) "[]"
      ["createtime"]=>
      string(10) "1511398109"
      ["_id"]=>
      string(3) "423"
    }
    [6]=>
    array(10) {
      ["id"]=>
      string(3) "422"
      ["text"]=>
      string(64) "JavaScript数据可视化编程学习（二）Flotr2，雷达图"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(7) "chengxs"
      ["tagsname"]=>
      string(28) "数据可视化|前端学习"
      ["tagsid"]=>
      string(9) "[396,397]"
      ["catesname"]=>
      string(18) "前端基本知识"
      ["catesid"]=>
      string(5) "[198]"
      ["createtime"]=>
      string(10) "1511397800"
      ["_id"]=>
      string(3) "422"
    }
    [7]=>
    array(10) {
      ["id"]=>
      string(3) "421"
      ["text"]=>
      string(36) "C#表达式目录树（Expression）"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(4) "wwym"
      ["tagsname"]=>
      string(0) ""
      ["tagsid"]=>
      string(2) "[]"
      ["catesname"]=>
      string(4) ".NET"
      ["catesid"]=>
      string(7) "["119"]"
      ["createtime"]=>
      string(10) "1511397474"
      ["_id"]=>
      string(3) "421"
    }
    [8]=>
    array(10) {
      ["id"]=>
      string(3) "420"
      ["text"]=>
      string(47) "数据结构 队列_队列实例：事件处理"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(7) "idreamo"
      ["tagsname"]=>
      string(40) "C语言|数据结构|队列|事件处理"
      ["tagsid"]=>
      string(23) "["246","247","248",395]"
      ["catesname"]=>
      string(12) "数据结构"
      ["catesid"]=>
      string(7) "["133"]"
      ["createtime"]=>
      string(10) "1511397279"
      ["_id"]=>
      string(3) "420"
    }
    [9]=>
    array(10) {
      ["id"]=>
      string(3) "419"
      ["text"]=>
      string(47) "久等了,博客园官方Android客户端发布"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(3) "cmt"
      ["tagsname"]=>
      string(0) ""
      ["tagsid"]=>
      string(2) "[]"
      ["catesname"]=>
      string(0) ""
      ["catesid"]=>
      string(2) "[]"
      ["createtime"]=>
      string(10) "1511396549"
      ["_id"]=>
      string(3) "419"
    }
  }
  ["count"]=>
  int(200)
}
222<!DOCTYPE html>
<html lang="zh-CN">
<head>
<meta charset="utf-8" />
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<meta http-equiv="content-language" content="zh-CN" />
<meta http-equiv="X-UA-Compatible" content="IE=edge" /> 
    <title>Dealing with Noise in Defect Prediction - 爱码网</title>
     
<meta name="keywords" content="Dealing with Noise in Defect Prediction" />
<meta name="description" content="目录ECharts异步加载ECharts数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。chart.setOption({    color: [" />
<meta name="viewport" content="width=device-width, initial-scale=1.0" />
<link rel="stylesheet" type="text/css" href="/statics/css/base.css?v=2.7" />
<script src="/statics/js/detail.min.js?v=2.2"></script>   
<script>
   $(document).ready(function () { 
		$("img").error(function () {
			$(this).hide();
		}); 
	}); 
</script>
</head>
<body class="home-template dtpg">
<nav class="main-nav clearfix">
    <div class="inner">
        <ul class="nav">
            <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/" title="爱码网">首页</a></li>
                        <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/nav/1.html" title="前端技术">前端技术</a></li>
                        <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/nav/9.html" title="编程语言">编程语言</a></li>
                        <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/nav/31.html" title="人工智能">人工智能</a></li>
                        <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/nav/41.html" title="运维知识">运维知识</a></li>
                        <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/nav/52.html" title="资源下载">资源下载</a></li>
                        <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/nav/68.html" title="常用小工具">常用小工具</a></li>
                        <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/nav/72.html" title="技术问答">技术问答</a></li>
                    </ul>            
	 
    </div>
</nav><div class="site-wrapper">
 
    <header style="height: auto;padding: 10px 0px;" class="main-header">
        <div style="max-width:910px" class="main-header-content inner">
                        <h1 class="page-title"><a href="/show-203784952.html" title="Dealing with Noise in Defect Prediction">Dealing with Noise in Defect Prediction</a></h1>
            
        </div>

    </header>
    <main class="content" role="main">
	

        <div class="leftbox">
    <article class="post tag-uifont tag-webview">
        <header class="post-header">
            <footer class="tc">  
                <time class="post-date" datetime="2021-06-20">2021-06-20</time>
            </footer>
        </header>
        <section class="post-content">
            <div class="contentbef">  
                  
                              </div>

            
<p><strong>题目：</strong> Dealing with Noise in Defect Prediction <br><strong>作者：</strong> Sunghun Kim, Hongyu Zhang, Rongxin Wu, Liang Gong <br><strong>单位：</strong> Hongkong University of Science and Technology, Tsinghua University <br><strong>出版：</strong> ICSE</p>
<hr>
<h3>解决的问题</h3>
<p>提出了一种方法，用来解决缺陷信息中的噪声。首先研究了噪声对缺陷预测模型造成的影响，提出了可接受的噪声比例范围。然后提出了一个噪声检测和评估算法。</p>
<h3>两个应用场景</h3>
<h3>预测buggy changes</h3>
<p><img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTl3YVdGdWMyaGxiaTVqYjIwdmFXMWhaMlZ6THpZME55ODNaVFUyTnpNM1pEZzJOek5tWkRSaU5URTBaRGxoTkdVeFl6QTJNVFkzWmk1d2JtYz0=" alt="Dealing with Noise in Defect Prediction" title="Dealing with Noise in Defect Prediction"></p>
<p>假设对于一个文件，我们有上图所示的变更历史，那么通过学习从Revision 1到Revision n中有bug和无bug的change模式，change分类模型就能够预测是否Revision n+1引入了bug。 <br>
为得到change的标签，我们首先从项目历史中抽取change，当一个commit包含fix时，我们就可以向后追踪来确定这段需要修改的错误代码是何时引入系统的。 <br>
一个文件的change包含两个源码版本和一个记录了添加代码和删除代码的change delta。一个文件的change有相关联的元数据，例如chage log，作者，和commit日期。通过挖掘change历史，我们可以得到co-change数量，也就是一个commit中有多少和文件是一同修改的，还可以得到一个文件的作者数量，一个文件历史更改次数等等。我们将这些作为特征。</p>
<h3>预测buggy files</h3>
<p>另一种常见的缺陷预测是提前识别出文件中的bug，人们普遍认为软件的一些内部属性（例如度量元）与外部的属性（例如缺陷）是有关联的。近年来许多基于软件度量元的缺陷预测模型已被提出，这些缺陷预测模型以度量元为特征，利用已构建的模型来预测新项目模块的缺陷情况。</p>
<h3>缺陷信息中的噪声</h3>
<p>上述两种方法都需要标签来构建和评估模型。为将文件/change标记为有缺陷/无缺陷，很多研究人员对开源系统的bug数据库进行挖掘。有两种方法是人们广泛应用的：搜索关键词，例如”Fixed”，”Bug”，和搜索与bug report相关的引用，例如”#42233”。我们在实验中同时应用了这两种方法。 <br>
有一些开源项目为它们的change log制定了很强的规则。例如，Columba的100%的chage都有类似’[bug]’ , ‘[intern]’, ‘[feature]’, ‘[ui]’这样的tag。Eclipse的开发者通常会在他们的chage log中标有相关的bug report ID。 <br>
然而近期的一些研究发现通过挖掘软件仓库收集到的数据往往包含bug。他们发现关联的bug数量不等于所有已修改bug数量，有时甚至占不到50%，这说明缺陷数据集中有很大的漏报率。这是因为开发者在修改bug的revision中经常不写特定的关键词，或者没有留下bug report链接。最近的研究已经证明这样的噪声对缺陷预测结果会产生影响。</p>
<h3>实验</h3>
<h3>研究问题</h3>
<ol>
<li>一个缺陷预测模型对缺陷数据漏报的抵抗性(resistant)如何。</li>
<li>一个缺陷预测模型对缺陷数据误报的抵抗性如何。</li>
<li>一个缺陷预测模型对同时包含误报和漏报的缺陷数据抵抗性如何。</li>
</ol>
<h3>制造有噪声的数据</h3>
<p>为解决我们的研究问题，我们需要一个标准数据集(golden set)，其中不含任何误报或漏报，同时我们需要有噪声的数据集。然而得到标准集是很难的，我们认真挑选了一些高品质的数据集，并假设它们是标准集。然后为得到包含噪声的数据集，我们为标准集添加噪声。具体做法是随机从标准集中选择样本，然后改变它们的标签（从有bug变为无bug，或从无bug变为有bug）。值得一提的是，我们只为训练集添加了噪声，而测试集继续利用标准集。 <br>
我们的实验利用贝叶斯网络作为分类器，并且利用10折交叉验证来保证准确性。</p>
<h3>傀儡分类器</h3>
<p>一个有效的分类器的分类效果至少应该强于随机猜测，我们将一个基于随机猜测的分类器叫做傀儡分类器。我们利用傀儡分类器的F分数作为我们度量缺陷预测模型噪声抵抗性的基准。我们假设傀儡分类器随机地将50%的样本分类为有缺陷，将另外50%样本分类为无缺陷，由此得到的傀儡分类器的F分数为0.375。</p>
<h3>噪声抵抗性</h3>
<h3>Change Classifcation的噪声抵抗能力</h3>
<h4>目标项目</h4>
<p>我们使用Columba, Eclipse JDT Core, Scarab作为我们实验的目标项目，因为这些项目有高品质的change log。对于前两个项目，我们直接使用 <em>Classifying Software Changes: Clean or Buggy?</em> 中收集的数据集作为基准集。数据集信息如下所示。 <br><img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTl3YVdGdWMyaGxiaTVqYjIwdmFXMWhaMlZ6THpFek1pODRNak5oTmpJell6a3hZVE0zTWpCak1qVTVNVEl5TmpreVlUSXpZemhoTkM1d2JtYz0=" alt="Dealing with Noise in Defect Prediction" title="Dealing with Noise in Defect Prediction"></p>
<h4>初始准确性</h4>
<p>我们利用不加缺陷的数据集构建了基于change分类的缺陷预测模型，并且评估了它的性能如图所示。</p>
<p><img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTl3YVdGdWMyaGxiaTVqYjIwdmFXMWhaMlZ6THpZNE1DODNaV1k1WmpBNFpXSTJaalJpT0RreE9UVXhNVGhpT1ROaE9UWTROVGsyT0M1d2JtYz0=" alt="Dealing with Noise in Defect Prediction" title="Dealing with Noise in Defect Prediction"></p>
<h4>漏报抵抗性</h4>
<p>为添加漏报，我们随机选择含有bug的样本，将它们的标签改为无bug。下图显示了在包含不同比例漏报的数据集中得到的F分数。x轴表示我们人工添加的漏报比例。同时也显示了傀儡分类的F分数。</p>
<p><img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTl3YVdGdWMyaGxiaTVqYjIwdmFXMWhaMlZ6THpZNE1TODFNamhrTVRabU56YzNNV1UxWldWak1qQXdNVGc1WldOaVpEQmlPVFZpT1M1d2JtYz0=" alt="Dealing with Noise in Defect Prediction" title="Dealing with Noise in Defect Prediction"></p>
<p>对这一结果的一个可能解释是表征bug的特征是较为普遍的，因此训练集中失去一些样本并不会对性能造成很明显的下降。</p>
<h4>误报抵抗性</h4>
<p>我们以类似方法为数据集添加误报，得到的结果如下图所示：</p>
<p><img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTl3YVdGdWMyaGxiaTVqYjIwdmFXMWhaMlZ6THpJNE5pOHhaR0l3TWpJeE1XRm1ZemszWlRsalkyUmhNREppWTJVMVpqZ3hOMkkzWlM1d2JtYz0=" alt="Dealing with Noise in Defect Prediction" title="Dealing with Noise in Defect Prediction"></p>
<p>对Eclipse敏感性的一个可能解释是其数据集中buggy change的数量较小，在添加了众多FP(False Positive，误报)后，表征bug的特征变得不再明显。</p>
<h4>误报与漏报的抵抗性</h4>
<p>下图显示了同时为数据集添加误报和漏报后，缺陷预测模型的性能。</p>
<p><img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTl3YVdGdWMyaGxiaTVqYjIwdmFXMWhaMlZ6THpVMk5DODBaR0poTW1NeE5EWmtOV05rWXprNU9HRmlOMlF3T0dZNFptRXhORFprTkM1d2JtYz0=" alt="Dealing with Noise in Defect Prediction" title="Dealing with Noise in Defect Prediction"></p>
<h3>Buggy文件预测</h3>
<h4>目标项目</h4>
<p>我们利用SWT和Eclipse 3.4中的Debug项目作为标准集。我们通过挖掘Eclipse Bugzilla和CVS仓库来收集缺陷信息。两个项目的信息如下表所示：</p>
<p><img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTl3YVdGdWMyaGxiaTVqYjIwdmFXMWhaMlZ6THprek1pODJaR1ZrWVdJME5XSXlPV1UzWldFeVpqTTVPRGRqTmpnNE1qaGhZek0wWXk1d2JtYz0=" alt="Dealing with Noise in Defect Prediction" title="Dealing with Noise in Defect Prediction"></p>
<p>我们还为两个项目收集了以下度量元作为特征：</p>
<ul>
<li>复杂度度量元，包括代码行数，平均圈复杂度，最大圈复杂度</li>
<li>面向对象的度量元(CK-OO度量元)</li>
<li>change度量元，包括从上个主要版本增添和删除的代码的行数，文件被修改的次数</li>
<li>开发者度量元，即参与修改文件的开发者数量</li>
</ul>
<p>我们对这两个项目进行了与上面类似的操作，得到下面三个图：</p>
<p><img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTl3YVdGdWMyaGxiaTVqYjIwdmFXMWhaMlZ6THpFMU15OW1aamRsWlROa04yVXdZakJpWXpRd1pHUmtabVk0T1RZeU1UY3daV0pqT1M1d2JtYz0=" alt="Dealing with Noise in Defect Prediction" title="Dealing with Noise in Defect Prediction"></p>
<p><img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTl3YVdGdWMyaGxiaTVqYjIwdmFXMWhaMlZ6THpjeEx6WmpObVF4WVdGa1l6Rm1NRFZrTmpZM1ltUTROall6WWpWaE1UYzBOamMzTG5CdVp3PT0=" alt="Dealing with Noise in Defect Prediction" title="Dealing with Noise in Defect Prediction"></p>
<p><img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTl3YVdGdWMyaGxiaTVqYjIwdmFXMWhaMlZ6THpjek9TODNNalkyWldFNFlXSmtOalV5WVRkbE1HRTFaR1F5TXpjeU56WXpNV1ZpWWk1d2JtYz0=" alt="Dealing with Noise in Defect Prediction" title="Dealing with Noise in Defect Prediction"></p>
<h3>讨论</h3>
<h4>可接受的噪声比例</h4>
<p>我们的实验显示，当有缺陷的实例足够多时，增加FP或FN并不会对预测性能有明显的影响。而对于既有FP又有FN的数据集，噪声增加时预测性能会减弱。当数据集中有bug的样本数较小时，模型的性能会受到较明显的影响。 <br>
在缺陷预测实践中，漏报往往更加常见。误报通常发生在开发者发布了一条消息称他修改了一个bug，然而实际上并没有时。 <br>
我们认为，我们的研究结果至少可以应用在chage分类和buggy文件分类问题上，建议研究者在构建分类模型之前先对数据进行采样和人工检查来衡量FP和FN比率，根据比率来判断缺陷数据是否可用。</p>
<h4>不同机器学习方法的噪声抵抗性</h4>
<p>在前面的部分我们通过贝叶斯网络得到了我们的结果，而本节我们会使用朴素贝叶斯，支持向量机和集成学习来重复实验，观察噪声对预测准确性的影响。我们利用SWT进行实验的结果如图所示：</p>
<p><img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTl3YVdGdWMyaGxiaTVqYjIwdmFXMWhaMlZ6THpNME1DOWxOV1JrWWpWaE1XUm1ZamcwWkdFeFpEQmpaR0kyT0Rka09UZGtNVGhrTkM1d2JtYz0=" alt="Dealing with Noise in Defect Prediction" title="Dealing with Noise in Defect Prediction"></p>
<h3>处理缺陷数据中的噪声</h3>
<h3>识别噪声样本</h3>
<p>我们提出了一个新颖的检测噪声的算法叫做Closest List Noise Identification(CLNI，我就不尬翻了)，算法由下图给出。</p>
<p><img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTl3YVdGdWMyaGxiaTVqYjIwdmFXMWhaMlZ6THpneU5DODBNRE5sTjJOaVpqaGlPRGd5WldZM01tRmtNekpsWVdKaE1UUmhaV00wTUM1d2JtYz0=" alt="Dealing with Noise in Defect Prediction" title="Dealing with Noise in Defect Prediction"></p>
<p>CLNI算法是这样工作的：对每一次迭代j，对每一个样本<span></span><span id="MathJax-Element-1524-Frame" role="textbox" aria-readonly="true" style=""><nobr><span id="MathJax-Span-9382" style="width: 2.217em; display: inline-block;"><span style="display: inline-block; position: relative; width: 1.789em; height: 0px; font-size: 123%;"><span style="position: absolute; clip: rect(1.84em, 1000em, 2.976em, -0.496em); top: -2.656em; left: 0em;"><span id="MathJax-Span-9383"><span id="MathJax-Span-9384" style="font-family: STIXGeneral; font-style: italic;">I<span style="display: inline-block; overflow: hidden; height: 1px; width: 0.051em;"></span></span><span id="MathJax-Span-9385" style="font-family: STIXGeneral; font-style: italic;">n</span><span id="MathJax-Span-9386" style="font-family: STIXGeneral; font-style: italic;">s</span><span id="MathJax-Span-9387"><span style="display: inline-block; position: relative; width: 0.545em; height: 0px;"><span style="position: absolute; clip: rect(1.947em, 1000em, 2.829em, -0.45em); top: -2.656em; left: 0em;"><span id="MathJax-Span-9388" style="font-family: STIXGeneral; font-style: italic;">t<span style="display: inline-block; overflow: hidden; height: 1px; width: 0.018em;"></span></span><span style="display: inline-block; width: 0px; height: 2.656em;"></span></span><span style="position: absolute; top: -2.343em; left: 0.253em;"><span id="MathJax-Span-9389" style="font-size: 70.7%; font-family: STIXGeneral; font-style: italic;">i</span><span style="display: inline-block; width: 0px; height: 2.493em;"></span></span></span></span></span><span style="display: inline-block; width: 0px; height: 2.656em;"></span></span></span><span style="border-left: 0em solid; display: inline-block; overflow: hidden; width: 0px; height: 1.131em; vertical-align: -0.261em;"></span></span></nobr></span>，与它最近的样本被列出来，称为<span></span><span id="MathJax-Element-1525-Frame" role="textbox" aria-readonly="true" style=""><nobr><span id="MathJax-Span-9390" style="width: 2.15em; display: inline-block;"><span style="display: inline-block; position: relative; width: 1.734em; height: 0px; font-size: 123%;"><span style="position: absolute; clip: rect(1.839em, 1000em, 2.976em, -0.496em); top: -2.656em; left: 0em;"><span id="MathJax-Span-9391"><span id="MathJax-Span-9392" style="font-family: STIXGeneral; font-style: italic;">L<span style="display: inline-block; overflow: hidden; height: 1px; width: 0.003em;"></span></span><span id="MathJax-Span-9393" style="font-family: STIXGeneral; font-style: italic;">i</span><span id="MathJax-Span-9394" style="font-family: STIXGeneral; font-style: italic;">s</span><span id="MathJax-Span-9395"><span style="display: inline-block; position: relative; width: 0.545em; height: 0px;"><span style="position: absolute; clip: rect(1.947em, 1000em, 2.829em, -0.45em); top: -2.656em; left: 0em;"><span id="MathJax-Span-9396" style="font-family: STIXGeneral; font-style: italic;">t<span style="display: inline-block; overflow: hidden; height: 1px; width: 0.018em;"></span></span><span style="display: inline-block; width: 0px; height: 2.656em;"></span></span><span style="position: absolute; top: -2.343em; left: 0.253em;"><span id="MathJax-Span-9397" style="font-size: 70.7%; font-family: STIXGeneral; font-style: italic;">i</span><span style="display: inline-block; width: 0px; height: 2.493em;"></span></span></span></span></span><span style="display: inline-block; width: 0px; height: 2.656em;"></span></span></span><span style="border-left: 0em solid; display: inline-block; overflow: hidden; width: 0px; height: 1.132em; vertical-align: -0.261em;"></span></span></nobr></span>。在<span></span><span id="MathJax-Element-1526-Frame" role="textbox" aria-readonly="true" style=""><nobr><span id="MathJax-Span-9398" style="width: 2.15em; display: inline-block;"><span style="display: inline-block; position: relative; width: 1.734em; height: 0px; font-size: 123%;"><span style="position: absolute; clip: rect(1.839em, 1000em, 2.976em, -0.496em); top: -2.656em; left: 0em;"><span id="MathJax-Span-9399"><span id="MathJax-Span-9400" style="font-family: STIXGeneral; font-style: italic;">L<span style="display: inline-block; overflow: hidden; height: 1px; width: 0.003em;"></span></span><span id="MathJax-Span-9401" style="font-family: STIXGeneral; font-style: italic;">i</span><span id="MathJax-Span-9402" style="font-family: STIXGeneral; font-style: italic;">s</span><span id="MathJax-Span-9403"><span style="display: inline-block; position: relative; width: 0.545em; height: 0px;"><span style="position: absolute; clip: rect(1.947em, 1000em, 2.829em, -0.45em); top: -2.656em; left: 0em;"><span id="MathJax-Span-9404" style="font-family: STIXGeneral; font-style: italic;">t<span style="display: inline-block; overflow: hidden; height: 1px; width: 0.018em;"></span></span><span style="display: inline-block; width: 0px; height: 2.656em;"></span></span><span style="position: absolute; top: -2.343em; left: 0.253em;"><span id="MathJax-Span-9405" style="font-size: 70.7%; font-family: STIXGeneral; font-style: italic;">i</span><span style="display: inline-block; width: 0px; height: 2.493em;"></span></span></span></span></span><span style="display: inline-block; width: 0px; height: 2.656em;"></span></span></span><span style="border-left: 0em solid; display: inline-block; overflow: hidden; width: 0px; height: 1.132em; vertical-align: -0.261em;"></span></span></nobr></span>中，样本根据它们到<span></span><span id="MathJax-Element-1527-Frame" role="textbox" aria-readonly="true" style=""><nobr><span id="MathJax-Span-9406" style="width: 2.217em; display: inline-block;"><span style="display: inline-block; position: relative; width: 1.789em; height: 0px; font-size: 123%;"><span style="position: absolute; clip: rect(1.84em, 1000em, 2.976em, -0.496em); top: -2.656em; left: 0em;"><span id="MathJax-Span-9407"><span id="MathJax-Span-9408" style="font-family: STIXGeneral; font-style: italic;">I<span style="display: inline-block; overflow: hidden; height: 1px; width: 0.051em;"></span></span><span id="MathJax-Span-9409" style="font-family: STIXGeneral; font-style: italic;">n</span><span id="MathJax-Span-9410" style="font-family: STIXGeneral; font-style: italic;">s</span><span id="MathJax-Span-9411"><span style="display: inline-block; position: relative; width: 0.545em; height: 0px;"><span style="position: absolute; clip: rect(1.947em, 1000em, 2.829em, -0.45em); top: -2.656em; left: 0em;"><span id="MathJax-Span-9412" style="font-family: STIXGeneral; font-style: italic;">t<span style="display: inline-block; overflow: hidden; height: 1px; width: 0.018em;"></span></span><span style="display: inline-block; width: 0px; height: 2.656em;"></span></span><span style="position: absolute; top: -2.343em; left: 0.253em;"><span id="MathJax-Span-9413" style="font-size: 70.7%; font-family: STIXGeneral; font-style: italic;">i</span><span style="display: inline-block; width: 0px; height: 2.493em;"></span></span></span></span></span><span style="display: inline-block; width: 0px; height: 2.656em;"></span></span></span><span style="border-left: 0em solid; display: inline-block; overflow: hidden; width: 0px; height: 1.131em; vertical-align: -0.261em;"></span></span></nobr></span>的欧式距离按升序排序。排名最高的N个样本中，与<span></span><span id="MathJax-Element-1528-Frame" role="textbox" aria-readonly="true" style=""><nobr><span id="MathJax-Span-9414" style="width: 2.217em; display: inline-block;"><span style="display: inline-block; position: relative; width: 1.789em; height: 0px; font-size: 123%;"><span style="position: absolute; clip: rect(1.84em, 1000em, 2.976em, -0.496em); top: -2.656em; left: 0em;"><span id="MathJax-Span-9415"><span id="MathJax-Span-9416" style="font-family: STIXGeneral; font-style: italic;">I<span style="display: inline-block; overflow: hidden; height: 1px; width: 0.051em;"></span></span><span id="MathJax-Span-9417" style="font-family: STIXGeneral; font-style: italic;">n</span><span id="MathJax-Span-9418" style="font-family: STIXGeneral; font-style: italic;">s</span><span id="MathJax-Span-9419"><span style="display: inline-block; position: relative; width: 0.545em; height: 0px;"><span style="position: absolute; clip: rect(1.947em, 1000em, 2.829em, -0.45em); top: -2.656em; left: 0em;"><span id="MathJax-Span-9420" style="font-family: STIXGeneral; font-style: italic;">t<span style="display: inline-block; overflow: hidden; height: 1px; width: 0.018em;"></span></span><span style="display: inline-block; width: 0px; height: 2.656em;"></span></span><span style="position: absolute; top: -2.343em; left: 0.253em;"><span id="MathJax-Span-9421" style="font-size: 70.7%; font-family: STIXGeneral; font-style: italic;">i</span><span style="display: inline-block; width: 0px; height: 2.493em;"></span></span></span></span></span><span style="display: inline-block; width: 0px; height: 2.656em;"></span></span></span><span style="border-left: 0em solid; display: inline-block; overflow: hidden; width: 0px; height: 1.131em; vertical-align: -0.261em;"></span></span></nobr></span>类别不同的样本比例计为<span></span><span id="MathJax-Element-1529-Frame" role="textbox" aria-readonly="true" style=""><nobr><span id="MathJax-Span-9422" style="width: 0.617em; display: inline-block;"><span style="display: inline-block; position: relative; width: 0.488em; height: 0px; font-size: 123%;"><span style="position: absolute; clip: rect(1.815em, 1000em, 2.829em, -0.461em); top: -2.656em; left: 0em;"><span id="MathJax-Span-9423"><span id="MathJax-Span-9424" style="font-family: STIXGeneral; font-style: italic;">θ<span style="display: inline-block; overflow: hidden; height: 1px; width: 0.014em;"></span></span></span><span style="display: inline-block; width: 0px; height: 2.656em;"></span></span></span><span style="border-left: 0em solid; display: inline-block; overflow: hidden; width: 0px; height: 0.981em; vertical-align: -0.08em;"></span></span></nobr></span>。如果<span></span><span id="MathJax-Element-1530-Frame" role="textbox" aria-readonly="true" style=""><nobr><span id="MathJax-Span-9425" style="width: 0.617em; display: inline-block;"><span style="display: inline-block; position: relative; width: 0.488em; height: 0px; font-size: 123%;"><span style="position: absolute; clip: rect(1.815em, 1000em, 2.829em, -0.461em); top: -2.656em; left: 0em;"><span id="MathJax-Span-9426"><span id="MathJax-Span-9427" style="font-family: STIXGeneral; font-style: italic;">θ<span style="display: inline-block; overflow: hidden; height: 1px; width: 0.014em;"></span></span></span><span style="display: inline-block; width: 0px; height: 2.656em;"></span></span></span><span style="border-left: 0em solid; display: inline-block; overflow: hidden; width: 0px; height: 0.981em; vertical-align: -0.08em;"></span></span></nobr></span>大于或等于某个阈值<span></span><span id="MathJax-Element-1531-Frame" role="textbox" aria-readonly="true" style=""><nobr><span id="MathJax-Span-9428" style="width: 0.55em; display: inline-block;"><span style="display: inline-block; position: relative; width: 0.434em; height: 0px; font-size: 123%;"><span style="position: absolute; clip: rect(1.825em, 1000em, 2.829em, -0.464em); top: -2.656em; left: 0em;"><span id="MathJax-Span-9429"><span id="MathJax-Span-9430" style="font-family: STIXGeneral; font-style: italic;">δ</span></span><span style="display: inline-block; width: 0px; height: 2.656em;"></span></span></span><span style="border-left: 0em solid; display: inline-block; overflow: hidden; width: 0px; height: 0.969em; vertical-align: -0.08em;"></span></span></nobr></span>，那么<span></span><span id="MathJax-Element-1532-Frame" role="textbox" aria-readonly="true" style=""><nobr><span id="MathJax-Span-9431" style="width: 2.217em; display: inline-block;"><span style="display: inline-block; position: relative; width: 1.789em; height: 0px; font-size: 123%;"><span style="position: absolute; clip: rect(1.84em, 1000em, 2.976em, -0.496em); top: -2.656em; left: 0em;"><span id="MathJax-Span-9432"><span id="MathJax-Span-9433" style="font-family: STIXGeneral; font-style: italic;">I<span style="display: inline-block; overflow: hidden; height: 1px; width: 0.051em;"></span></span><span id="MathJax-Span-9434" style="font-family: STIXGeneral; font-style: italic;">n</span><span id="MathJax-Span-9435" style="font-family: STIXGeneral; font-style: italic;">s</span><span id="MathJax-Span-9436"><span style="display: inline-block; position: relative; width: 0.545em; height: 0px;"><span style="position: absolute; clip: rect(1.947em, 1000em, 2.829em, -0.45em); top: -2.656em; left: 0em;"><span id="MathJax-Span-9437" style="font-family: STIXGeneral; font-style: italic;">t<span style="display: inline-block; overflow: hidden; height: 1px; width: 0.018em;"></span></span><span style="display: inline-block; width: 0px; height: 2.656em;"></span></span><span style="position: absolute; top: -2.343em; left: 0.253em;"><span id="MathJax-Span-9438" style="font-size: 70.7%; font-family: STIXGeneral; font-style: italic;">i</span><span style="display: inline-block; width: 0px; height: 2.493em;"></span></span></span></span></span><span style="display: inline-block; width: 0px; height: 2.656em;"></span></span></span><span style="border-left: 0em solid; display: inline-block; overflow: hidden; width: 0px; height: 1.131em; vertical-align: -0.261em;"></span></span></nobr></span>很有可能就是一个噪声样本，应该被划分入噪声集<span></span><span id="MathJax-Element-1533-Frame" role="textbox" aria-readonly="true" style=""><nobr><span id="MathJax-Span-9439" style="width: 1.083em; display: inline-block;"><span style="display: inline-block; position: relative; width: 0.867em; height: 0px; font-size: 123%;"><span style="position: absolute; clip: rect(1.663em, 1000em, 2.952em, -0.539em); top: -2.493em; left: 0em;"><span id="MathJax-Span-9440"><span id="MathJax-Span-9441"><span style="display: inline-block; position: relative; width: 0.888em; height: 0px;"><span style="position: absolute; clip: rect(1.825em, 1000em, 2.818em, -0.539em); top: -2.656em; left: 0em;"><span id="MathJax-Span-9442" style="font-family: STIXGeneral; font-style: italic;">A</span><span style="display: inline-block; width: 0px; height: 2.656em;"></span></span><span style="position: absolute; top: -2.343em; left: 0.596em;"><span id="MathJax-Span-9443" style="font-size: 70.7%; font-family: STIXGeneral; font-style: italic;">j<span style="display: inline-block; overflow: hidden; height: 1px; width: 0.001em;"></span></span><span style="display: inline-block; width: 0px; height: 2.493em;"></span></span></span></span></span><span style="display: inline-block; width: 0px; height: 2.493em;"></span></span></span><span style="border-left: 0em solid; display: inline-block; overflow: hidden; width: 0px; height: 1.32em; vertical-align: -0.431em;"></span></span></nobr></span>，重复上述步骤直到<span></span><span id="MathJax-Element-1534-Frame" role="textbox" aria-readonly="true" style=""><nobr><span id="MathJax-Span-9444" style="width: 1.083em; display: inline-block;"><span style="display: inline-block; position: relative; width: 0.867em; height: 0px; font-size: 123%;"><span style="position: absolute; clip: rect(1.663em, 1000em, 2.952em, -0.539em); top: -2.493em; left: 0em;"><span id="MathJax-Span-9445"><span id="MathJax-Span-9446"><span style="display: inline-block; position: relative; width: 0.888em; height: 0px;"><span style="position: absolute; clip: rect(1.825em, 1000em, 2.818em, -0.539em); top: -2.656em; left: 0em;"><span id="MathJax-Span-9447" style="font-family: STIXGeneral; font-style: italic;">A</span><span style="display: inline-block; width: 0px; height: 2.656em;"></span></span><span style="position: absolute; top: -2.343em; left: 0.596em;"><span id="MathJax-Span-9448" style="font-size: 70.7%; font-family: STIXGeneral; font-style: italic;">j<span style="display: inline-block; overflow: hidden; height: 1px; width: 0.001em;"></span></span><span style="display: inline-block; width: 0px; height: 2.493em;"></span></span></span></span></span><span style="display: inline-block; width: 0px; height: 2.493em;"></span></span></span><span style="border-left: 0em solid; display: inline-block; overflow: hidden; width: 0px; height: 1.32em; vertical-align: -0.431em;"></span></span></nobr></span>和<span></span><span id="MathJax-Element-1535-Frame" role="textbox" aria-readonly="true" style=""><nobr><span id="MathJax-Span-9449" style="width: 2.15em; display: inline-block;"><span style="display: inline-block; position: relative; width: 1.734em; height: 0px; font-size: 123%;"><span style="position: absolute; clip: rect(1.663em, 1000em, 2.952em, -0.539em); top: -2.493em; left: 0em;"><span id="MathJax-Span-9450"><span id="MathJax-Span-9451"><span style="display: inline-block; position: relative; width: 1.755em; height: 0px;"><span style="position: absolute; clip: rect(1.825em, 1000em, 2.818em, -0.539em); top: -2.656em; left: 0em;"><span id="MathJax-Span-9452" style="font-family: STIXGeneral; font-style: italic;">A</span><span style="display: inline-block; width: 0px; height: 2.656em;"></span></span><span style="position: absolute; top: -2.343em; left: 0.596em;"><span id="MathJax-Span-9453"><span id="MathJax-Span-9454"><span id="MathJax-Span-9455" style="font-size: 70.7%; font-family: STIXGeneral; font-style: italic;">j<span style="display: inline-block; overflow: hidden; height: 1px; width: 0.001em;"></span></span><span id="MathJax-Span-9456" style="font-size: 70.7%; font-family: STIXGeneral;">−</span><span id="MathJax-Span-9457" style="font-size: 70.7%; font-family: STIXGeneral;">1</span></span></span><span style="display: inline-block; width: 0px; height: 2.493em;"></span></span></span></span></span><span style="display: inline-block; width: 0px; height: 2.493em;"></span></span></span><span style="border-left: 0em solid; display: inline-block; overflow: hidden; width: 0px; height: 1.32em; vertical-align: -0.431em;"></span></span></nobr></span>间的相似度超过<span></span><span id="MathJax-Element-1536-Frame" role="textbox" aria-readonly="true" style=""><nobr><span id="MathJax-Span-9458" style="width: 0.55em; display: inline-block;"><span style="display: inline-block; position: relative; width: 0.434em; height: 0px; font-size: 123%;"><span style="position: absolute; clip: rect(2.052em, 1000em, 2.829em, -0.458em); top: -2.656em; left: 0em;"><span id="MathJax-Span-9459"><span id="MathJax-Span-9460" style="font-family: STIXGeneral; font-style: italic;">ε</span></span><span style="display: inline-block; width: 0px; height: 2.656em;"></span></span></span><span style="border-left: 0em solid; display: inline-block; overflow: hidden; width: 0px; height: 0.689em; vertical-align: -0.08em;"></span></span></nobr></span>，此时返回<span></span><span id="MathJax-Element-1537-Frame" role="textbox" aria-readonly="true" style=""><nobr><span id="MathJax-Span-9461" style="width: 1.083em; display: inline-block;"><span style="display: inline-block; position: relative; width: 0.867em; height: 0px; font-size: 123%;"><span style="position: absolute; clip: rect(1.663em, 1000em, 2.952em, -0.539em); top: -2.493em; left: 0em;"><span id="MathJax-Span-9462"><span id="MathJax-Span-9463"><span style="display: inline-block; position: relative; width: 0.888em; height: 0px;"><span style="position: absolute; clip: rect(1.825em, 1000em, 2.818em, -0.539em); top: -2.656em; left: 0em;"><span id="MathJax-Span-9464" style="font-family: STIXGeneral; font-style: italic;">A</span><span style="display: inline-block; width: 0px; height: 2.656em;"></span></span><span style="position: absolute; top: -2.343em; left: 0.596em;"><span id="MathJax-Span-9465" style="font-size: 70.7%; font-family: STIXGeneral; font-style: italic;">j<span style="display: inline-block; overflow: hidden; height: 1px; width: 0.001em;"></span></span><span style="display: inline-block; width: 0px; height: 2.493em;"></span></span></span></span></span><span style="display: inline-block; width: 0px; height: 2.493em;"></span></span></span><span style="border-left: 0em solid; display: inline-block; overflow: hidden; width: 0px; height: 1.32em; vertical-align: -0.431em;"></span></span></nobr></span>作为噪声集。研究表明，当<span></span><span id="MathJax-Element-1538-Frame" role="textbox" aria-readonly="true" style=""><nobr><span id="MathJax-Span-9466" style="width: 0.883em; display: inline-block;"><span style="display: inline-block; position: relative; width: 0.705em; height: 0px; font-size: 123%;"><span style="position: absolute; clip: rect(1.84em, 1000em, 2.833em, -0.508em); top: -2.656em; left: 0em;"><span id="MathJax-Span-9467"><span id="MathJax-Span-9468" style="font-family: STIXGeneral; font-style: italic;">N<span style="display: inline-block; overflow: hidden; height: 1px; width: 0.06em;"></span></span></span><span style="display: inline-block; width: 0px; height: 2.656em;"></span></span></span><span style="border-left: 0em solid; display: inline-block; overflow: hidden; width: 0px; height: 0.955em; vertical-align: -0.085em;"></span></span></nobr></span>取5，<span></span><span id="MathJax-Element-1539-Frame" role="textbox" aria-readonly="true" style=""><nobr><span id="MathJax-Span-9469" style="width: 0.55em; display: inline-block;"><span style="display: inline-block; position: relative; width: 0.434em; height: 0px; font-size: 123%;"><span style="position: absolute; clip: rect(1.825em, 1000em, 2.829em, -0.464em); top: -2.656em; left: 0em;"><span id="MathJax-Span-9470"><span id="MathJax-Span-9471" style="font-family: STIXGeneral; font-style: italic;">δ</span></span><span style="display: inline-block; width: 0px; height: 2.656em;"></span></span></span><span style="border-left: 0em solid; display: inline-block; overflow: hidden; width: 0px; height: 0.969em; vertical-align: -0.08em;"></span></span></nobr></span>取0.6，<span></span><span id="MathJax-Element-1540-Frame" role="textbox" aria-readonly="true" style=""><nobr><span id="MathJax-Span-9472" style="width: 0.55em; display: inline-block;"><span style="display: inline-block; position: relative; width: 0.434em; height: 0px; font-size: 123%;"><span style="position: absolute; clip: rect(2.052em, 1000em, 2.829em, -0.458em); top: -2.656em; left: 0em;"><span id="MathJax-Span-9473"><span id="MathJax-Span-9474" style="font-family: STIXGeneral; font-style: italic;">ε</span></span><span style="display: inline-block; width: 0px; height: 2.656em;"></span></span></span><span style="border-left: 0em solid; display: inline-block; overflow: hidden; width: 0px; height: 0.689em; vertical-align: -0.08em;"></span></span></nobr></span>取0.99时，算法的效果最好。</p>
<h3>评估</h3>
<p>我们利用Eclipse 3.4 SWT和Debug来评估CLNI，我们通过随机选择n%的样本并改变其标签来创建噪声数据集，然后对其应用了CLNI，利用精确度，召回率和F分数来评估CLNI的性能。当噪声率为20%时，结果显示精确度超过0.6，召回率超过0.83，F值超过0.71，在不断增加噪声率的情况下精确度，召回率和F值的变化如图所示。</p>
<p><img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTl3YVdGdWMyaGxiaTVqYjIwdmFXMWhaMlZ6THpVeU5TODRaVFk1WmpZd05ETTBNakF5TWpBeU9XWXdNVEF3TjJSbU5qUTNaR0pqTlM1d2JtYz0=" alt="Dealing with Noise in Defect Prediction" title="Dealing with Noise in Defect Prediction"></p>
<h3>可能存在的问题</h3>
<ul>
<li>我们实验中用到的所有数据集都是从开源项目中收集的，商业公司软件缺陷管理中引入的噪声可能与开源项目不同。</li>
<li>论文中的标准数据集可能不够完美。</li>
<li>我们实验中的噪声数据仿真可能与实际的噪声模式不同。</li>
</ul>
 
                    
                <div style="margin-top: 10px;">
                  </div> 
        </section>
	 
        <footer class="post-footer">
            <section class="author">
                                            </section>
        </footer>
        <p class="mt10">相关文章：</p>
        <div style="width: 100%;" class="contentcard">
      
            <div style="width: 100%;height: auto;" class="carditem litem clearfix"> 
                    <ul style="padding-left: 0rem;" class="cardcont">
                                            </ul>
               </div>   
         </div>
    </article>

  
</div>

<div class="rigthbox contentcard mt10">
 
          <div style="height: auto;" class="carditem litem">
    <div class="cardtit">猜你喜欢 </div>
        <ul class="cardcont">
                        </ul>
   </div> 

<div style="height: auto;" class="carditem litem">
    <div class="cardtit">相关资源 </div>
        <ul class="cardcont">
              
                            </ul>
   </div>
   
    <div style="height: auto;" class="carditem litem">
     <div class="cardtit">相似解决方案 </div>
         <ul class="cardcont">
                          </ul>
    </div>
  
   <div style="height: auto;background-color: #ddd;text-align: center;" class="carditem litem">
    <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-5446233687289962" data-ad-slot="2607637140"  data-ad-format="auto"  data-full-width-responsive="true"></ins><script>(adsbygoogle = window.adsbygoogle || []).push({});</script>
</div> 
   <div  style="height: auto;" class="carditem litem mt20">
    <div class="cardtit">热门标签  </div>
    <div class="tagbox">
                    <a target="_blank" title="Java" href="/default/index/tags?cid=164&cname=Java" >Java</a>
                        <a target="_blank" title="Python" href="/default/index/tags?cid=367&cname=Python" >Python</a>
                        <a target="_blank" title="linux" href="/default/index/tags?cid=274&cname=linux" >linux</a>
                        <a target="_blank" title="javascript" href="/default/index/tags?cid=169&cname=javascript" >javascript</a>
                        <a target="_blank" title="Mysql" href="/default/index/tags?cid=237&cname=Mysql" >Mysql</a>
                        <a target="_blank" title="C#" href="/default/index/tags?cid=187&cname=C%23" >C#</a>
                        <a target="_blank" title="Docker" href="/default/index/tags?cid=243&cname=Docker" >Docker</a>
                        <a target="_blank" title="算法" href="/default/index/tags?cid=344&cname=%E7%AE%97%E6%B3%95" >算法</a>
                        <a target="_blank" title="前端" href="/default/index/tags?cid=160&cname=%E5%89%8D%E7%AB%AF" >前端</a>
                        <a target="_blank" title="SpringBoot" href="/default/index/tags?cid=168&cname=SpringBoot" >SpringBoot</a>
                        <a target="_blank" title="Redis" href="/default/index/tags?cid=227&cname=Redis" >Redis</a>
                        <a target="_blank" title="Vue" href="/default/index/tags?cid=236&cname=Vue" >Vue</a>
                        <a target="_blank" title="spring" href="/default/index/tags?cid=696&cname=spring" >spring</a>
                        <a target="_blank" title="设计模式" href="/default/index/tags?cid=632&cname=%E8%AE%BE%E8%AE%A1%E6%A8%A1%E5%BC%8F" >设计模式</a>
                        <a target="_blank" title=".net core" href="/default/index/tags?cid=381&cname=.net+core" >.net core</a>
                        <a target="_blank" title=".net" href="/default/index/tags?cid=300&cname=.net" >.net</a>
                        <a target="_blank" title="kubernetes" href="/default/index/tags?cid=2179&cname=kubernetes" >kubernetes</a>
                        <a target="_blank" title="c++" href="/default/index/tags?cid=312&cname=c%2B%2B" >c++</a>
                        <a target="_blank" title="数据库" href="/default/index/tags?cid=284&cname=%E6%95%B0%E6%8D%AE%E5%BA%93" >数据库</a>
                        <a target="_blank" title="数据结构" href="/default/index/tags?cid=247&cname=%E6%95%B0%E6%8D%AE%E7%BB%93%E6%9E%84" >数据结构</a>
                        <a target="_blank" title="大数据" href="/default/index/tags?cid=888&cname=%E5%A4%A7%E6%95%B0%E6%8D%AE" >大数据</a>
                        <a target="_blank" title="js" href="/default/index/tags?cid=159&cname=js" >js</a>
                        <a target="_blank" title="机器学习" href="/default/index/tags?cid=171&cname=%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0" >机器学习</a>
                        <a target="_blank" title="微服务" href="/default/index/tags?cid=832&cname=%E5%BE%AE%E6%9C%8D%E5%8A%A1" >微服务</a>
                        <a target="_blank" title="Android" href="/default/index/tags?cid=282&cname=Android" >Android</a>
                        <a target="_blank" title="Go" href="/default/index/tags?cid=839&cname=Go" >Go</a>
                        <a target="_blank" title="程序员" href="/default/index/tags?cid=327&cname=%E7%A8%8B%E5%BA%8F%E5%91%98" >程序员</a>
                        <a target="_blank" title="面试" href="/default/index/tags?cid=637&cname=%E9%9D%A2%E8%AF%95" >面试</a>
                        <a target="_blank" title="JVM" href="/default/index/tags?cid=727&cname=JVM" >JVM</a>
                        <a target="_blank" title="ASP.net core" href="/default/index/tags?cid=179&cname=ASP.net+core" >ASP.net core</a>
                        <a target="_blank" title="云原生" href="/default/index/tags?cid=22056&cname=%E4%BA%91%E5%8E%9F%E7%94%9F" >云原生</a>
                        <a target="_blank" title="人工智能" href="/default/index/tags?cid=270&cname=%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD" >人工智能</a>
                        <a target="_blank" title="后端" href="/default/index/tags?cid=1089&cname=%E5%90%8E%E7%AB%AF" >后端</a>
                        <a target="_blank" title="PHP" href="/default/index/tags?cid=281&cname=PHP" >PHP</a>
                        <a target="_blank" title="git" href="/default/index/tags?cid=226&cname=git" >git</a>
                        <a target="_blank" title="CSS" href="/default/index/tags?cid=817&cname=CSS" >CSS</a>
                        <a target="_blank" title="golang" href="/default/index/tags?cid=409&cname=golang" >golang</a>
                        <a target="_blank" title="k8s" href="/default/index/tags?cid=5067&cname=k8s" >k8s</a>
                        <a target="_blank" title="Nginx" href="/default/index/tags?cid=373&cname=Nginx" >Nginx</a>
                        <a target="_blank" title="Django" href="/default/index/tags?cid=634&cname=Django" >Django</a>
                        <a target="_blank" title="mybatis" href="/default/index/tags?cid=720&cname=mybatis" >mybatis</a>
                        <a target="_blank" title="深度学习" href="/default/index/tags?cid=345&cname=%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0" >深度学习</a>
                        <a target="_blank" title="多线程" href="/default/index/tags?cid=986&cname=%E5%A4%9A%E7%BA%BF%E7%A8%8B" >多线程</a>
                        <a target="_blank" title="React" href="/default/index/tags?cid=560&cname=React" >React</a>
                        <a target="_blank" title="架构" href="/default/index/tags?cid=2070&cname=%E6%9E%B6%E6%9E%84" >架构</a>
                        <a target="_blank" title="devops" href="/default/index/tags?cid=2662&cname=devops" >devops</a>
                        <a target="_blank" title="爬虫" href="/default/index/tags?cid=905&cname=%E7%88%AC%E8%99%AB" >爬虫</a>
                        <a target="_blank" title="云计算" href="/default/index/tags?cid=361&cname=%E4%BA%91%E8%AE%A1%E7%AE%97" >云计算</a>
                        <a target="_blank" title="Spring Boot" href="/default/index/tags?cid=201&cname=Spring+Boot" >Spring Boot</a>
                        <a target="_blank" title="LeetCode" href="/default/index/tags?cid=342&cname=LeetCode" >LeetCode</a>
                </div>
       
   </div>
   
        <div id="rightadbox" style="height: 300px;background-color: #ddd;text-align: center;" class="carditem litem">
            <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-5446233687289962" data-ad-slot="2607637140"  data-ad-format="auto"  data-full-width-responsive="true"></ins><script>(adsbygoogle = window.adsbygoogle || []).push({});</script>
        </div> 
</div>
<div class="clearfix"></div>
</main>
    
<div class="yllinks alink"></div>
 

<footer class="site-footer clearfix">
<section class="copyright">By &copy; 2026 <a href="/" title="www.likecs.com">likecs</a> 版权所有,<br/>本站所有数据收集于网络如有侵犯到您的权益请联系 进行下架处理1。 </section>
<section class="poweredby">  <a target="_blank" href="https://beian.miit.gov.cn/">粤ICP备22038628号</a>Powered By  WordPress </section>
<script charset="UTF-8" id="LA_COLLECT" src="//sdk.51.la/js-sdk-pro.min.js"></script>
<script>LA.init({id: "Je3PjbvUssp6BbvY",ck: "Je3PjbvUssp6BbvY"})</script>
<script>
var _hmt = _hmt || [];
(function() {
  var hm = document.createElement("script");
  hm.src = "https://hm.baidu.com/hm.js?2eb031e42d29b7c1a1f16948d2ae2a9f";
  var s = document.getElementsByTagName("script")[0]; 
  s.parentNode.insertBefore(hm, s);
})();
</script>
</footer>  
</div>
<script>
    $(function(){
                    $(".post-content").append('<p style="padding: 20px;color: #cacaca;">来源网络，如有侵犯到您的权益请联系进行下架处理</p>')  
            }) 
</script> 
</body>
</html>