array(2) {
  ["docs"]=>
  array(10) {
    [0]=>
    array(10) {
      ["id"]=>
      string(3) "428"
      ["text"]=>
      string(77) "Visual Studio 2017 单独启动MSDN帮助（Microsoft Help Viewer）的方法"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(8) "DonetRen"
      ["tagsname"]=>
      string(55) "Visual Studio 2017|MSDN帮助|C#程序|.NET|Help Viewer"
      ["tagsid"]=>
      string(23) "[401,402,403,"300",404]"
      ["catesname"]=>
      string(0) ""
      ["catesid"]=>
      string(2) "[]"
      ["createtime"]=>
      string(10) "1511400964"
      ["_id"]=>
      string(3) "428"
    }
    [1]=>
    array(10) {
      ["id"]=>
      string(3) "427"
      ["text"]=>
      string(42) "npm -v；报错 cannot find module "wrapp""
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(4) "zzty"
      ["tagsname"]=>
      string(50) "node.js|npm|cannot find module &quot;wrapp“|node"
      ["tagsid"]=>
      string(19) "[398,"239",399,400]"
      ["catesname"]=>
      string(0) ""
      ["catesid"]=>
      string(2) "[]"
      ["createtime"]=>
      string(10) "1511400760"
      ["_id"]=>
      string(3) "427"
    }
    [2]=>
    array(10) {
      ["id"]=>
      string(3) "426"
      ["text"]=>
      string(54) "说说css中pt、px、em、rem都扮演了什么角色"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(12) "zhengqiaoyin"
      ["tagsname"]=>
      string(0) ""
      ["tagsid"]=>
      string(2) "[]"
      ["catesname"]=>
      string(0) ""
      ["catesid"]=>
      string(2) "[]"
      ["createtime"]=>
      string(10) "1511400640"
      ["_id"]=>
      string(3) "426"
    }
    [3]=>
    array(10) {
      ["id"]=>
      string(3) "425"
      ["text"]=>
      string(83) "深入学习JS执行--创建执行上下文（变量对象，作用域链，this）"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(7) "Ry-yuan"
      ["tagsname"]=>
      string(33) "Javascript|Javascript执行过程"
      ["tagsid"]=>
      string(13) "["169","191"]"
      ["catesname"]=>
      string(0) ""
      ["catesid"]=>
      string(2) "[]"
      ["createtime"]=>
      string(10) "1511399901"
      ["_id"]=>
      string(3) "425"
    }
    [4]=>
    array(10) {
      ["id"]=>
      string(3) "424"
      ["text"]=>
      string(30) "C# 排序技术研究与对比"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(9) "vveiliang"
      ["tagsname"]=>
      string(0) ""
      ["tagsid"]=>
      string(2) "[]"
      ["catesname"]=>
      string(8) ".Net Dev"
      ["catesid"]=>
      string(5) "[199]"
      ["createtime"]=>
      string(10) "1511399150"
      ["_id"]=>
      string(3) "424"
    }
    [5]=>
    array(10) {
      ["id"]=>
      string(3) "423"
      ["text"]=>
      string(72) "【算法】小白的算法笔记：快速排序算法的编码和优化"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(9) "penghuwan"
      ["tagsname"]=>
      string(6) "算法"
      ["tagsid"]=>
      string(7) "["344"]"
      ["catesname"]=>
      string(0) ""
      ["catesid"]=>
      string(2) "[]"
      ["createtime"]=>
      string(10) "1511398109"
      ["_id"]=>
      string(3) "423"
    }
    [6]=>
    array(10) {
      ["id"]=>
      string(3) "422"
      ["text"]=>
      string(64) "JavaScript数据可视化编程学习（二）Flotr2，雷达图"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(7) "chengxs"
      ["tagsname"]=>
      string(28) "数据可视化|前端学习"
      ["tagsid"]=>
      string(9) "[396,397]"
      ["catesname"]=>
      string(18) "前端基本知识"
      ["catesid"]=>
      string(5) "[198]"
      ["createtime"]=>
      string(10) "1511397800"
      ["_id"]=>
      string(3) "422"
    }
    [7]=>
    array(10) {
      ["id"]=>
      string(3) "421"
      ["text"]=>
      string(36) "C#表达式目录树（Expression）"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(4) "wwym"
      ["tagsname"]=>
      string(0) ""
      ["tagsid"]=>
      string(2) "[]"
      ["catesname"]=>
      string(4) ".NET"
      ["catesid"]=>
      string(7) "["119"]"
      ["createtime"]=>
      string(10) "1511397474"
      ["_id"]=>
      string(3) "421"
    }
    [8]=>
    array(10) {
      ["id"]=>
      string(3) "420"
      ["text"]=>
      string(47) "数据结构 队列_队列实例：事件处理"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(7) "idreamo"
      ["tagsname"]=>
      string(40) "C语言|数据结构|队列|事件处理"
      ["tagsid"]=>
      string(23) "["246","247","248",395]"
      ["catesname"]=>
      string(12) "数据结构"
      ["catesid"]=>
      string(7) "["133"]"
      ["createtime"]=>
      string(10) "1511397279"
      ["_id"]=>
      string(3) "420"
    }
    [9]=>
    array(10) {
      ["id"]=>
      string(3) "419"
      ["text"]=>
      string(47) "久等了,博客园官方Android客户端发布"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(3) "cmt"
      ["tagsname"]=>
      string(0) ""
      ["tagsid"]=>
      string(2) "[]"
      ["catesname"]=>
      string(0) ""
      ["catesid"]=>
      string(2) "[]"
      ["createtime"]=>
      string(10) "1511396549"
      ["_id"]=>
      string(3) "419"
    }
  }
  ["count"]=>
  int(200)
}
222<!DOCTYPE html>
<html lang="zh-CN">
<head>
<meta charset="utf-8" />
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<meta http-equiv="content-language" content="zh-CN" />
<meta http-equiv="X-UA-Compatible" content="IE=edge" /> 
    <title>深度学习新的采样方式和损失函数--论文笔记 - 爱码网</title>
     
<meta name="keywords" content="深度学习新的采样方式和损失函数--论文笔记" />
<meta name="description" content="目录ECharts异步加载ECharts数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。chart.setOption({    color: [" />
<meta name="viewport" content="width=device-width, initial-scale=1.0" />
<link rel="stylesheet" type="text/css" href="/statics/css/base.css?v=2.7" />
<script src="/statics/js/detail.min.js?v=2.2"></script>   
<script>
   $(document).ready(function () { 
		$("img").error(function () {
			$(this).hide();
		}); 
	}); 
</script>
</head>
<body class="home-template dtpg">
<nav class="main-nav clearfix">
    <div class="inner">
        <ul class="nav">
            <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/" title="爱码网">首页</a></li>
                        <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/nav/1.html" title="前端技术">前端技术</a></li>
                        <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/nav/9.html" title="编程语言">编程语言</a></li>
                        <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/nav/31.html" title="人工智能">人工智能</a></li>
                        <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/nav/41.html" title="运维知识">运维知识</a></li>
                        <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/nav/52.html" title="资源下载">资源下载</a></li>
                        <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/nav/68.html" title="常用小工具">常用小工具</a></li>
                        <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/nav/72.html" title="技术问答">技术问答</a></li>
                    </ul>            
	 
    </div>
</nav><div class="site-wrapper">
 
    <header style="height: auto;padding: 10px 0px;" class="main-header">
        <div style="max-width:910px" class="main-header-content inner">
                        <h1 class="page-title"><a href="/show-204387602.html" title="深度学习新的采样方式和损失函数--论文笔记">深度学习新的采样方式和损失函数--论文笔记</a></h1>
            
        </div>

    </header>
    <main class="content" role="main">
	

        <div class="leftbox">
    <article class="post tag-uifont tag-webview">
        <header class="post-header">
            <footer class="tc">  
                <time class="post-date" datetime="2021-07-13">2021-07-13</time>
            </footer>
        </header>
        <section class="post-content">
            <div class="contentbef">  
                  
                              </div>

            
<p><a href="https://zhuanlan.zhihu.com/p/27748177" rel="nofollow" target="_blank">深度学习新的采样方式和损失函数--论文笔记</a></p>
<p></p>
<div><div class="RichText ztext Post-RichText">
<p>论文《Sampling matters in deep embedding learning》</p>
<p>论文地址：<a href="https://link.zhihu.com/?target=https%3A//arxiv.org/pdf/1706.07567.pdf" rel="nofollow" target="_blank"><span>https://</span><span>arxiv.org/pdf/1706.0756</span><span>7.pdf</span><span></span></a></p>
<p> 该论文为2017年6月上传至arxiv。主要研究的是深度嵌入学习（deep embedding learning）中的采样问题和损失函数的问题。作者分析了contrastive loss和triplet loss，提出了一种新的采样方式（distance weighted sampling）和一种新的loss function(margin based loss)。证明了训练模型时，数据的采样方式和loss function的形式对结果有着同样重要的影响。实验证明，该工作提出的方法在多个数据集上都能够得到最好的效果。</p>
<p> 在机器学习领域，对loss function的研究已经有很多了，loss function的好坏，直接影响到模型的训练结果。作者在本文中只讨论深度嵌入学习，可以简单理解为基于深度模型的学习，之所以叫嵌入学习（embedding learning）是因为该类模型的核心思想是：建立一个嵌入空间，在该空间中，相似的样本距离近，不相似的样本距离远。</p>
<h3>传统loss function</h3>
<p> 设f(xi)为嵌入空间中的数据点，我们的目标是使得嵌入空间中相似的点距离近，不相似的点距离远。设两样本的欧氏距离为：</p>
<p><img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTkzZDNjdWVtaHBhSFV1WTI5dEwyVnhkV0YwYVc5dVAzUmxlRDFFWHlVM1FtbHFKVGRFSlRORUpUZERKVGREWmlVeU9IaGZKVGRDYVNVM1JDVXlPUzFtSlRJNGVGOGxOMEpxSlRkRUpUSTVKVGRESlRkRA==" alt="深度学习新的采样方式和损失函数--论文笔记" title="深度学习新的采样方式和损失函数--论文笔记"> 对于正样本对，有yij=1，对于负样本对，则有yij=0。</p>
<p><strong>Contrastive loss</strong></p>
<p> 其目标函数如下：</p>
<img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTl3YVdGdWMyaGxiaTVqYjIwdmFXMWhaMlZ6THpjNUwyVTRZVFk1WVRReE5XVTVZbVl4T1dJd1lXRm1NbUZpTVRWaE1tRXdPVEptTGtwUVJVYz0=" alt="深度学习新的采样方式和损失函数--论文笔记" title="深度学习新的采样方式和损失函数--论文笔记"><p>该loss的问题在于，它需要定义一个固定的a，这其实就默认了所有每类样本的分布都相同，这其实是一个很强的假设。</p>
<p><strong>Triplet loss</strong></p>
<p> 其目标函数如下：</p>
<img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTl3YVdGdWMyaGxiaTVqYjIwdmFXMWhaMlZ6THpNME55OHhOekU0T0dKa01HTmtOall3TkRObE1qQTBPRE0yTVdVeVpqVTRPV016TXk1S1VFVkg=" alt="深度学习新的采样方式和损失函数--论文笔记" title="深度学习新的采样方式和损失函数--论文笔记"><p>它使得正负例样本之间的距离尽可能接近于a，这就不管数据的分布了。它能够补足contrastive loss的缺点，使得嵌入空间可以任意扭曲。作者总结称，triplet loss超越constrative loss的原因有两个：1）constrative loss有一个固定的a，而triplet loss能够灵活适应各种空间形状，一定程度上能够抵御噪声的影响；2）triplet loss只要求正例与正例的距离小于正例与负例的距离即可，而constrative loss则还要尽量使所有的正例集中在一起，而这点是不必要的。</p>
<p> 对于contrastive loss来说，使用hard negative mining的方法，能够使得模型收敛得更快；然而，如果使用的是triplet loss，hard negative mining很可能会模型坍塌。这里所说的hard negative mining是指：对于某些任务，比如人脸检测，直接进行采样，训练出的模型效果不会太好，因为模型可能会检测出很多假正例；因此，可以取置信度很高的为正例的真负例，与正例一起训练，这些负例就被称为hard negative mining。对于模型坍塌的问题，可以这样解释，设一个anchor样本a，负例样本n，如果对负例样本f(xn)求梯度，可得：</p>
<img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTl3YVdGdWMyaGxiaTVqYjIwdmFXMWhaMlZ6THpZekx6RXdNR0kzT1RNd09HUTVOR000TW1Oa056TTJZbU00Tm1WaE5HUXpNRGxtTGtwUVJVYz0=" alt="深度学习新的采样方式和损失函数--论文笔记" title="深度学习新的采样方式和损失函数--论文笔记"><p>其中</p>
<img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTl3YVdGdWMyaGxiaTVqYjIwdmFXMWhaMlZ6THpFeE1DODFPVFZqWXpVM01qRm1NbVkyT0RWaU56YzNabVUyTW1FMU9HUTFNVEJsTmk1S1VFVkg=" alt="深度学习新的采样方式和损失函数--论文笔记" title="深度学习新的采样方式和损失函数--论文笔记"><p>Hard negative样本通常离anchor的距离较小，即han较小，这时如果有噪声，那么这种采样方式就很容易受到噪声的影响，从而造成训练时的模型坍塌。</p>
<p>由于模型坍塌的问题，FaceNet[1]提出了一种semi-hard negative mining的方法：给定一个anchor样本a，一个正例样本p，对于负例的采样，使用以下公式：</p>
<img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTl3YVdGdWMyaGxiaTVqYjIwdmFXMWhaMlZ6THpJMU9DODFNR0ZqWTJGalltRXpPRGM0TXpVM05EZ3haVGRqT0dKa05XSTBOemRpTWk1S1VFVkg=" alt="深度学习新的采样方式和损失函数--论文笔记" title="深度学习新的采样方式和损失函数--论文笔记"><p>这样采样出来的负例，不至于过于hard。</p>
<h3>Distance Weighted sampling</h3>
<p> 在现实状态下，如果同类样本是均匀分布在其各自的簇中的，如果我们对所有的样本进行两两采样，计算其距离，最终得到的点对距离分布（distribution of pairwise distances）有着如下关系：</p>
<img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTl3YVdGdWMyaGxiaTVqYjIwdmFXMWhaMlZ6THpFeE9TOHlOR0UzTkRWbE1ETmhOVE00WVRoaE5ERmlZbVl5TnpoaE1tVTFNelJqTnk1S1VFVkg=" alt="深度学习新的采样方式和损失函数--论文笔记" title="深度学习新的采样方式和损失函数--论文笔记"><p>而且，最佳的采样状态是对于分散均匀的负样本，进行均匀地采样。具体证明，可以参考论文[2]。因此，作者提出了一种新的采样方法Distance weighted sampling。给定一个anchor样本a，负例样本的选择方法如下：</p>
<img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTl3YVdGdWMyaGxiaTVqYjIwdmFXMWhaMlZ6THpnMU15ODJNREk1WlRNek5HUmlabVZqTnpReFlXUmlORFkxTTJFM09UYzBabUU0WkM1S1VFVkg=" alt="深度学习新的采样方式和损失函数--论文笔记" title="深度学习新的采样方式和损失函数--论文笔记"><p> 如图1所示，为各种采样方法在一个模拟数据集上的结果，纵轴为数据梯度的方差。从图中可以看出，hard negative mining方法采样的样本都处于高方差的区域，如果数据集中有噪声的话，采样很容易受到噪声的影响，从而导致模型坍塌。随机采样的样本容易集中在低方差的区域，从而使得loss很小，但此时模型实际上并没有训练好。Semi-hard negative mining采样的范围很小，这很可能导致模型在很早的时候就收敛，loss下降很慢，但实际上此时模型也还没训练好；而本文提出的方法，能够实现在整个数据集上均匀采样。</p>
<img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTl3YVdGdWMyaGxiaTVqYjIwdmFXMWhaMlZ6THpVd01pOW1OemMyTmpFeVkyUmxZMk14WWpNNVpXUmtNRGhtTW1KaE1qQXlObUU1Tmk1S1VFVkg=" alt="深度学习新的采样方式和损失函数--论文笔记" title="深度学习新的采样方式和损失函数--论文笔记"><p>图1 各种采样结果在模拟数据集上的采样结果</p>
<h3>Margin based loss</h3>
<p> 如图2所示，为不同loss function取不同样本时损失的曲线图。可以根据constractive loss和triplet loss的公式，来理解2a和2b。这里主要观察2b，如果采样的时候采的都是hard negative 样本，即Dan的值很小，从图中可以看出，负例的梯度会非常小（也可以对目标函数进行求导，得出相同的结论），此时就会导致模型坍塌。一个简单的改进方法就是，将triplet loss中的二次项换成一次项，这时目标函数的导数固定为1，能够解决梯度消失的问题，这里其实可以类比深度学习中应用广泛的RELU**函数。</p>
<img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTl3YVdGdWMyaGxiaTVqYjIwdmFXMWhaMlZ6THpVd01pOWxZbU0xTkRWa01qRmxNall3Tm1NMU9EVmhPVFExWTJOaVpEbGtaVFF5WlM1S1VFVkg=" alt="深度学习新的采样方式和损失函数--论文笔记" title="深度学习新的采样方式和损失函数--论文笔记"><p>图2 loss vs pairwise distance</p>
<p> 作者提出了一个新的目标函数Margin based loss，这个函数设计的目标是：1）能像triplet loss一样灵活；2）能够自适应不同的数据分布；3）能够像contrastive loss一样计算高效。</p>
<p>首先，定义一个自适应的margin：</p>
<img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTl3YVdGdWMyaGxiaTVqYjIwdmFXMWhaMlZ6THpJeU1TODBNVEEyWXpnMllUTmtNMkkxTkRJeU5HUXlZemsyWkRKbFltRXpOak5rTlM1S1VFVkg=" alt="深度学习新的采样方式和损失函数--论文笔记" title="深度学习新的采样方式和损失函数--论文笔记"><p>我们称anchor样本与正例样本之间的距离为正例对距离；称anchor样本与负例样本之间的距离为负例对距离。公式中的参数beta定义了正例对距离与负例对距离之间的界限，如果正例对距离Dij大于beta，则损失加大；或者负例对距离Dij小于beta，损失加大。A控制样本的分离间隔；当样本为正例对时，yij为1，样本为负例对时，yij为-1。如图2d所示，为该目标函数的损失曲线图，与2a比较，它放松了对正例的约束。将其与2c比较，在有损失的地方，它们的导数都是1，具有良好的性质，且2d的形状不受限于数据集本身，而只与a和beta有关。</p>
<p>为了实现像triplet loss一样的灵活性，可以将beta设置为与样本有关的值：</p>
<img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTl3YVdGdWMyaGxiaTVqYjIwdmFXMWhaMlZ6THpZNE1DOWxOV000TmpVek5HUmpZbVprWmpVd05qRm1ZMlF4Tm1Fd016SmtOamd3T0M1S1VFVkg=" alt="深度学习新的采样方式和损失函数--论文笔记" title="深度学习新的采样方式和损失函数--论文笔记"><p>其中， beta(class)称为样本偏置， beta(img)称为类别偏置。这里需要注意，第一个beta(0)是人工定义的初始值，利用梯度下降，不断调整beta(class)和beta(img)的值（就如同调整神经网络的参数）以在训练集上达到最优，这时能够得到最优的beta(class)和beta(img)（每个类一个beta(class)，每个样本一个beta(img)）。在调整beta的值的时候，可以对其整体求导</p>
<img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTl3YVdGdWMyaGxiaTVqYjIwdmFXMWhaMlZ6THpZMU1DOWxOelUwTldObFlqSmlaVFV6TWpRNVpEZGtaV1pqWTJZeU1qVXhaRGMzWVM1S1VFVkg=" alt="深度学习新的采样方式和损失函数--论文笔记" title="深度学习新的采样方式和损失函数--论文笔记"><p>用来指导beta值的调整。从公式可以看出，beta的值似乎越大越好，其值越大，负例离anchor点的距离也就越大，不容易受到噪声的影响（上文已经提到了具体细节）。为了对beta进行规划化，需要给它一个限制，作者引入了一个超参数v，并定义:</p>
<img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTl3YVdGdWMyaGxiaTVqYjIwdmFXMWhaMlZ6THpJeU5DOW1Nek0wTXpBNVlUSmlZekl4WTJRNU1UaG1ZVGt5TUdWak9UVmxOV1l4TUM1S1VFVkg=" alt="深度学习新的采样方式和损失函数--论文笔记" title="深度学习新的采样方式和损失函数--论文笔记"><p>这个v参数能够调整margin两边，违反margin数据点的数量，具体原理可见[3]中的v-trick。</p>
<h3>实验结果</h3>
<p><strong>数据集</strong>：Stanford Online Products, CARS196, CUB200-2011, CASIA-WebFace, LFW.</p>
<p><strong>实验</strong>：图片检索和图片聚类（Stanford Online Products, CARS196, CUB200-2011），人脸验证（CASIA-WebFace, LFW）。</p>
<p><strong>模型</strong>：ResNet-50[4]</p>
<p><strong>初始化参数</strong>：beta(0)=1.2,beta(class)=0,beta(img)=0.</p>
<p> 首先，在Stanford Online Products数据集上进行实验，来测试不同loss function和采样方式对结果的影响，ResNet-50模型从头开始训练。结果如表1所示，在semi-hard采样方法中，constrastive loss和triplet loss的性能类似，而如果使用随机采样，constrastive loss的性能要差很多（triplet loss不能随机采样），这其实反证了一个结论：triplet loss的性能不仅仅来自于其自身的函数结构，也与采样方式有很大的关系。</p>
<img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTl3YVdGdWMyaGxiaTVqYjIwdmFXMWhaMlZ6THpNeU55OW1PV1kxWVdZNU9UaGtPVEV5TURjNU1EQXhORGMyWkdNeU5EbGlaamN6Tnk1S1VFVkg=" alt="深度学习新的采样方式和损失函数--论文笔记" title="深度学习新的采样方式和损失函数--论文笔记"><p><br></p>
<p> Distance weighted采样方法对于除了constrastive loss之外的所有loss function都有加强的效果。作者称该采样方法在constrastive loss上结果差的原因是它对于超参数特别敏感，无法找到一个合适的参数。</p>
<p> 作者也实验了pre-trained的模型效果，提升了大概10%的效果。</p>
<p> 由于pre-trained模型效果更好，因此接下来的时候均使用该模型。如图3所示，为图片搜索的结果，可以看到本文基于margin的方法要优于triplet loss方法。</p>
<img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTl3YVdGdWMyaGxiaTVqYjIwdmFXMWhaMlZ6THprd055OHdOVGRqTnpsbU1HTmlPVEZqWXpsa1ptUmxaVGxsTWpaaU1UVmxaR05sWWk1S1VFVkg=" alt="深度学习新的采样方式和损失函数--论文笔记" title="深度学习新的采样方式和损失函数--论文笔记"><p>图3 图片搜索结果</p>
<p> 作者还对比了固定的beta和本文灵活的beta对结果的影响。由表2的结果可知，灵活的beta对于结果的确是有提升的。注意，这里作者只说了beta(class)，得到了更好的效果，他也试验了beta(img)，但结果很不稳定，很有可能是过拟合的原因。因此，在实验的时候，可以只考虑beta(class)，去除beta(img)。</p>
<img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTl3YVdGdWMyaGxiaTVqYjIwdmFXMWhaMlZ6THpZNE1TOHpZbVEzWkdOaVpqVmtNbVpqWm1Wak5ESXpZbUl6TjJVellXUXlZMlJpT1M1S1VFVkg=" alt="深度学习新的采样方式和损失函数--论文笔记" title="深度学习新的采样方式和损失函数--论文笔记"><p> 如图4所示，作者对loss function的稳定性进行了实验，将batch中图片的数量分为改为2和10，有结果可知，本文基于margin的方法要比triplet loss方法稳定很多。</p>
<img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTl3YVdGdWMyaGxiaTVqYjIwdmFXMWhaMlZ6THpFM05TOWpPV1V4TVdaallUWmlaV1JqTkRObU5EUTVZVGMyT0daaE1HSXpNRGszWmk1S1VFVkg=" alt="深度学习新的采样方式和损失函数--论文笔记" title="深度学习新的采样方式和损失函数--论文笔记"><p>图4 Margin loss和triplet loss稳定性对比</p>
<p> 如图5所示，是对收敛速度的实验，其中本文算法收敛最快且效果最好，triplet loss其次，contrastive loss就要差很多了。</p>
<img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTl3YVdGdWMyaGxiaTVqYjIwdmFXMWhaMlZ6THpJeU9DOWlZamRpWWpabFltVTFPR05tTUdSaE5UZ3lPREZoT0RBMFl6SXhPVEU1TkM1S1VFVkg=" alt="深度学习新的采样方式和损失函数--论文笔记" title="深度学习新的采样方式和损失函数--论文笔记"><p>图5 不同loss的收敛速度对比</p>
<p> 本文还与目前最好的图片搜索和聚类方法进行了比较，结果如表3、4、5所示，可以看到本文算法效果最好。</p>
<img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTl3YVdGdWMyaGxiaTVqYjIwdmFXMWhaMlZ6THpReU9TODNZVE5rT1dVNVltSXhOalUwTVdReVpqYzBOMkl3WVdWbU1UUXpNV1JoTlM1S1VFVkg=" alt="深度学习新的采样方式和损失函数--论文笔记" title="深度学习新的采样方式和损失函数--论文笔记"><p><br></p>
<img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTl3YVdGdWMyaGxiaTVqYjIwdmFXMWhaMlZ6THpnMk1pODNORGMyWVRKaFkyUTBNbVU0WkROaE1ESmtNamcxTVRVMk5ESm1NVGxtWlM1S1VFVkg=" alt="深度学习新的采样方式和损失函数--论文笔记" title="深度学习新的采样方式和损失函数--论文笔记"><p>表6是人脸验证的结果，本文算法accuracy结果依然最好。</p>
<img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTl3YVdGdWMyaGxiaTVqYjIwdmFXMWhaMlZ6THpZeU1TOHlZMlZsTW1NeVlqYzJNRE01WlRVelpURmpOVE14WWpnd1pqQmtOMkl4WkM1S1VFVkg=" alt="深度学习新的采样方式和损失函数--论文笔记" title="深度学习新的采样方式和损失函数--论文笔记"><h3>总结</h3>
<p> 本文主要对contrastive loss、triplet loss目标函数和各种采样策略进行了分析，结合分析结果，提出了一种新的采样方式distance weighted sampling和一种新的损失函数margin-based loss。这两种方法能够显著提高模型各方面的性能，取得了在多个数据集上至今最好的结果。有一点吐槽一下，文章的题目只提到“sampling matters”，但实际上文章的算法共两个部分：采样和损失函数。这样取名字仅仅是因为目前该领域损失函数的工作太多，采样的工作太少么？</p>
<h3>参考文献</h3>
<p>[1]Facenet: A unified embedding for face recognition and clustering.(CVPR2015)</p>
<p>[2]The sphere game in n dimensions. <a href="https://link.zhihu.com/?target=http%3A//faculty.madisoncollege.edu/alehnen/sphere/hypers.htm" rel="nofollow" target="_blank"><span>http://</span><span>faculty.madisoncollege.edu</span><span>/alehnen/sphere/hypers.htm</span><span></span></a>. Accessed: 2017-02-22.</p>
<p>[3]New support vector algorithms. Neural computation, 2000.</p>
<p>[4]Deep residual learning for image recognition.(CVPR 2016)</p>
</div></div>
<br>
 
                    
                <div style="margin-top: 10px;">
                  </div> 
        </section>
	 
        <footer class="post-footer">
            <section class="author">
                                            </section>
        </footer>
        <p class="mt10">相关文章：</p>
        <div style="width: 100%;" class="contentcard">
      
            <div style="width: 100%;height: auto;" class="carditem litem clearfix"> 
                    <ul style="padding-left: 0rem;" class="cardcont">
                                            </ul>
               </div>   
         </div>
    </article>

  
</div>

<div class="rigthbox contentcard mt10">
 
          <div style="height: auto;" class="carditem litem">
    <div class="cardtit">猜你喜欢 </div>
        <ul class="cardcont">
                        </ul>
   </div> 

<div style="height: auto;" class="carditem litem">
    <div class="cardtit">相关资源 </div>
        <ul class="cardcont">
              
                            </ul>
   </div>
   
    <div style="height: auto;" class="carditem litem">
     <div class="cardtit">相似解决方案 </div>
         <ul class="cardcont">
                          </ul>
    </div>
  
   <div style="height: auto;background-color: #ddd;text-align: center;" class="carditem litem">
    <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-5446233687289962" data-ad-slot="2607637140"  data-ad-format="auto"  data-full-width-responsive="true"></ins><script>(adsbygoogle = window.adsbygoogle || []).push({});</script>
</div> 
   <div  style="height: auto;" class="carditem litem mt20">
    <div class="cardtit">热门标签  </div>
    <div class="tagbox">
                    <a target="_blank" title="Java" href="/default/index/tags?cid=164&cname=Java" >Java</a>
                        <a target="_blank" title="Python" href="/default/index/tags?cid=367&cname=Python" >Python</a>
                        <a target="_blank" title="linux" href="/default/index/tags?cid=274&cname=linux" >linux</a>
                        <a target="_blank" title="javascript" href="/default/index/tags?cid=169&cname=javascript" >javascript</a>
                        <a target="_blank" title="Mysql" href="/default/index/tags?cid=237&cname=Mysql" >Mysql</a>
                        <a target="_blank" title="C#" href="/default/index/tags?cid=187&cname=C%23" >C#</a>
                        <a target="_blank" title="Docker" href="/default/index/tags?cid=243&cname=Docker" >Docker</a>
                        <a target="_blank" title="算法" href="/default/index/tags?cid=344&cname=%E7%AE%97%E6%B3%95" >算法</a>
                        <a target="_blank" title="前端" href="/default/index/tags?cid=160&cname=%E5%89%8D%E7%AB%AF" >前端</a>
                        <a target="_blank" title="SpringBoot" href="/default/index/tags?cid=168&cname=SpringBoot" >SpringBoot</a>
                        <a target="_blank" title="Redis" href="/default/index/tags?cid=227&cname=Redis" >Redis</a>
                        <a target="_blank" title="Vue" href="/default/index/tags?cid=236&cname=Vue" >Vue</a>
                        <a target="_blank" title="spring" href="/default/index/tags?cid=696&cname=spring" >spring</a>
                        <a target="_blank" title="设计模式" href="/default/index/tags?cid=632&cname=%E8%AE%BE%E8%AE%A1%E6%A8%A1%E5%BC%8F" >设计模式</a>
                        <a target="_blank" title=".net core" href="/default/index/tags?cid=381&cname=.net+core" >.net core</a>
                        <a target="_blank" title=".net" href="/default/index/tags?cid=300&cname=.net" >.net</a>
                        <a target="_blank" title="kubernetes" href="/default/index/tags?cid=2179&cname=kubernetes" >kubernetes</a>
                        <a target="_blank" title="c++" href="/default/index/tags?cid=312&cname=c%2B%2B" >c++</a>
                        <a target="_blank" title="数据库" href="/default/index/tags?cid=284&cname=%E6%95%B0%E6%8D%AE%E5%BA%93" >数据库</a>
                        <a target="_blank" title="数据结构" href="/default/index/tags?cid=247&cname=%E6%95%B0%E6%8D%AE%E7%BB%93%E6%9E%84" >数据结构</a>
                        <a target="_blank" title="大数据" href="/default/index/tags?cid=888&cname=%E5%A4%A7%E6%95%B0%E6%8D%AE" >大数据</a>
                        <a target="_blank" title="js" href="/default/index/tags?cid=159&cname=js" >js</a>
                        <a target="_blank" title="机器学习" href="/default/index/tags?cid=171&cname=%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0" >机器学习</a>
                        <a target="_blank" title="微服务" href="/default/index/tags?cid=832&cname=%E5%BE%AE%E6%9C%8D%E5%8A%A1" >微服务</a>
                        <a target="_blank" title="Android" href="/default/index/tags?cid=282&cname=Android" >Android</a>
                        <a target="_blank" title="Go" href="/default/index/tags?cid=839&cname=Go" >Go</a>
                        <a target="_blank" title="程序员" href="/default/index/tags?cid=327&cname=%E7%A8%8B%E5%BA%8F%E5%91%98" >程序员</a>
                        <a target="_blank" title="面试" href="/default/index/tags?cid=637&cname=%E9%9D%A2%E8%AF%95" >面试</a>
                        <a target="_blank" title="JVM" href="/default/index/tags?cid=727&cname=JVM" >JVM</a>
                        <a target="_blank" title="ASP.net core" href="/default/index/tags?cid=179&cname=ASP.net+core" >ASP.net core</a>
                        <a target="_blank" title="云原生" href="/default/index/tags?cid=22056&cname=%E4%BA%91%E5%8E%9F%E7%94%9F" >云原生</a>
                        <a target="_blank" title="人工智能" href="/default/index/tags?cid=270&cname=%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD" >人工智能</a>
                        <a target="_blank" title="后端" href="/default/index/tags?cid=1089&cname=%E5%90%8E%E7%AB%AF" >后端</a>
                        <a target="_blank" title="PHP" href="/default/index/tags?cid=281&cname=PHP" >PHP</a>
                        <a target="_blank" title="git" href="/default/index/tags?cid=226&cname=git" >git</a>
                        <a target="_blank" title="CSS" href="/default/index/tags?cid=817&cname=CSS" >CSS</a>
                        <a target="_blank" title="golang" href="/default/index/tags?cid=409&cname=golang" >golang</a>
                        <a target="_blank" title="k8s" href="/default/index/tags?cid=5067&cname=k8s" >k8s</a>
                        <a target="_blank" title="Nginx" href="/default/index/tags?cid=373&cname=Nginx" >Nginx</a>
                        <a target="_blank" title="Django" href="/default/index/tags?cid=634&cname=Django" >Django</a>
                        <a target="_blank" title="mybatis" href="/default/index/tags?cid=720&cname=mybatis" >mybatis</a>
                        <a target="_blank" title="深度学习" href="/default/index/tags?cid=345&cname=%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0" >深度学习</a>
                        <a target="_blank" title="多线程" href="/default/index/tags?cid=986&cname=%E5%A4%9A%E7%BA%BF%E7%A8%8B" >多线程</a>
                        <a target="_blank" title="React" href="/default/index/tags?cid=560&cname=React" >React</a>
                        <a target="_blank" title="架构" href="/default/index/tags?cid=2070&cname=%E6%9E%B6%E6%9E%84" >架构</a>
                        <a target="_blank" title="devops" href="/default/index/tags?cid=2662&cname=devops" >devops</a>
                        <a target="_blank" title="爬虫" href="/default/index/tags?cid=905&cname=%E7%88%AC%E8%99%AB" >爬虫</a>
                        <a target="_blank" title="云计算" href="/default/index/tags?cid=361&cname=%E4%BA%91%E8%AE%A1%E7%AE%97" >云计算</a>
                        <a target="_blank" title="Spring Boot" href="/default/index/tags?cid=201&cname=Spring+Boot" >Spring Boot</a>
                        <a target="_blank" title="LeetCode" href="/default/index/tags?cid=342&cname=LeetCode" >LeetCode</a>
                </div>
       
   </div>
   
        <div id="rightadbox" style="height: 300px;background-color: #ddd;text-align: center;" class="carditem litem">
            <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-5446233687289962" data-ad-slot="2607637140"  data-ad-format="auto"  data-full-width-responsive="true"></ins><script>(adsbygoogle = window.adsbygoogle || []).push({});</script>
        </div> 
</div>
<div class="clearfix"></div>
</main>
    
<div class="yllinks alink"></div>
 

<footer class="site-footer clearfix">
<section class="copyright">By &copy; 2026 <a href="/" title="www.likecs.com">likecs</a> 版权所有,<br/>本站所有数据收集于网络如有侵犯到您的权益请联系 进行下架处理1。 </section>
<section class="poweredby">  <a target="_blank" href="https://beian.miit.gov.cn/">粤ICP备22038628号</a>Powered By  WordPress </section>
<script charset="UTF-8" id="LA_COLLECT" src="//sdk.51.la/js-sdk-pro.min.js"></script>
<script>LA.init({id: "Je3PjbvUssp6BbvY",ck: "Je3PjbvUssp6BbvY"})</script>
<script>
var _hmt = _hmt || [];
(function() {
  var hm = document.createElement("script");
  hm.src = "https://hm.baidu.com/hm.js?2eb031e42d29b7c1a1f16948d2ae2a9f";
  var s = document.getElementsByTagName("script")[0]; 
  s.parentNode.insertBefore(hm, s);
})();
</script>
</footer>  
</div>
<script>
    $(function(){
                    $(".post-content").append('<p style="padding: 20px;color: #cacaca;">来源网络，如有侵犯到您的权益请联系进行下架处理</p>')  
            }) 
</script> 
</body>
</html>