【问题标题】:Adaptive Threshold CIKernel/CIFilter iOS自适应阈值 CIKernel/CIFilter iOS
【发布时间】:2016-07-11 02:28:28
【问题描述】:

为了找到在 iOS 上执行自适应阈值处理的内核,我进行了全面研究。不幸的是,我不理解内核语言或它背后的逻辑。下面,我找到了一个执行阈值处理的例程 (https://gist.github.com/xhruso00/a3f8a9c8ae7e33b8b23d)

static NSString * const kKernelSource = @"kernel vec4 thresholdKernel(sampler image)\n"
"{\n"
"  float inputThreshold = 0.05;\n"
"  float pass = 1.0;\n"
"  float fail = 0.0;\n"
"  const vec4   vec_Y = vec4( 0.299, 0.587, 0.114, 0.0 );\n"
"  vec4  src = unpremultiply( sample(image, samplerCoord(image)) );\n"
"  float Y = dot( src, vec_Y );\n"
"  src.rgb = vec3( compare( Y - inputThreshold, fail, pass));\n"
"  return premultiply(src);\n"
"}";

是否可以将其重写为自适应阈值内核?我提供给它的图像已经变成了黑白并且已经模糊了。你有什么资源可以指点我吗?我想坚持使用 CoreImage,因为我的整个堆栈都是围绕它构建的。

编辑:我试图实现的最佳示例/参考已在 GPUImage 的 GPUImageAdaptiveThresholdFilter 中实现 - https://github.com/BradLarson/GPUImage/blob/c5f0914152419437869c35e29858773b1a06083c/framework/Source/GPUImageAdaptiveThresholdFilter.m

【问题讨论】:

  • 我用描述、金属和现代方法更新了我的代码gist.github.com/xhruso00/a3f8a9c8ae7e33b8b23d 我用下面的代码启发了自己,但下面的代码不考虑 alpha 预乘(透明区域将变为黑色或白色)。跨度>

标签: ios core-image cifilter adaptive-threshold cikernel


【解决方案1】:

您可以使用CIColorThresholdOtsu 核心图像过滤器

【讨论】:

  • 这个更新的答案也非常有用!如果开发者写了一个阈值算法,只是想应用阈值,那么 CIColorThreshold 也值得一看:cifilter.io/CIColorThreshold
【解决方案2】:

Simon 的过滤器是实现所需效果的正确方法,但是,您必须修改一些东西。

首先,切换imageLumathresholdLuma 的顺序,因为我们希望黑色字母保持黑色,而不是相反。此外,您应该添加一个常数(我选择0.01)来消除噪音。

    var thresholdKernel =  CIColorKernel(string:
    "kernel vec4 thresholdFilter(__sample image, __sample threshold)" +
        "{" +
        "   float imageLuma = dot(image.rgb, vec3(0.2126, 0.7152, 0.0722));" +
        "   float thresholdLuma = dot(threshold.rgb, vec3(0.2126, 0.7152, 0.0722));" +
        "   return vec4(vec3(step(thresholdLuma, imageLuma+0.001)), 1);"     
    "}"

override var outputImage: CIImage! {
    guard let inputImage = inputImage,
        let thresholdKernel = thresholdKernel else {
        return nil
    }
    let blurred = inputImage.applyingFilter("CIBoxBlur", withInputParameters: [kCIInputRadiusKey: 5]) // block size
    let extent = inputImage.extent
    let arguments = [inputImage, blurred]
    return thresholdKernel.apply(withExtent: extent, arguments: arguments)
}

这就是,您只使用 Apple 的 Core Image,无需安装任何外部库:)

当然,您可以稍微调整一下常量和块大小的值。

【讨论】:

  • 帕斯卡,谢谢你的回答。关于如何在 CoreImage 中实现这一点的任何想法? github.com/ctodobom/OpenNoteScanner/blob/master/app/src/main/…
  • 你提到了一个常数 0.01 但你有 0.001,这是一个错误吗?另外,您是否将此常量应用于 imageLuma 或阈值亮度(假设我确实想要黑色背景的白色字母。
  • 0.01 和 0.001 似乎没有太大区别。您可以尝试不同的值以满足您的需要。
【解决方案3】:

这看起来如何:我使用了 CoreImage CIBoxBlur(尽管专用的卷积过滤器可能更快)并将其输出传递到我的 existing threshold filter

class AdaptiveThresholdFilter: CIFilter
{
    var inputImage : CIImage?


    var thresholdKernel =  CIColorKernel(string:
    "kernel vec4 thresholdFilter(__sample image, __sample threshold)" +
    "{" +
    "   float imageLuma = dot(image.rgb, vec3(0.2126, 0.7152, 0.0722));" +
    "   float thresholdLuma = dot(threshold.rgb, vec3(0.2126, 0.7152, 0.0722));" +

    "   return vec4(vec3(step(imageLuma, thresholdLuma)), 1.0);" +
    "}"
    )


    override var outputImage: CIImage!
    {
        guard let inputImage = inputImage,
            thresholdKernel = thresholdKernel else
        {
            return nil
        }

        let blurred = inputImage.imageByApplyingFilter("CIBoxBlur",
               withInputParameters: [kCIInputRadiusKey: 9])

        let extent = inputImage.extent
        let arguments = [inputImage, blurred]

        return thresholdKernel.applyWithExtent(extent, arguments: arguments)
    }
}

我找到了一个阴影页面的this image,并使用以下代码:

let page = CIImage(image: UIImage(named: "son1.gif")!)

let filter = AdaptiveThresholdFilter()

filter.inputImage = page

let final = filter.outputImage

我得到了这个结果:

干杯!

西蒙

【讨论】:

猜你喜欢
  • 1970-01-01
  • 2013-01-23
  • 1970-01-01
  • 2014-04-03
  • 1970-01-01
  • 2011-04-21
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多