前言

从2015开始,在FME中匹配中文变成了一件麻烦事,以往版本中在StringSearcher匹配中文的“[\u4e00-\u9fa5]+”写法不好用了。本文将以两种方式在新版的FME中匹配中文。

通过转换器

通过转换器,具体思路如下:

1.  对这个表达式进行分析:在正则表达式中中括号里的内容表示一个集合,是要匹配字符的范围。

2.  我们在匹配英文的时候一般可以这么写“[a-zA-Z]+”,这表示要匹配英文,不论大小写。

3.  所以,我们匹配中文的时候是不是也可以这么写,将Unicode编码对应的汉字“-”写进去?经测试,可行。

转换器设置及匹配结果截图如下:

使用FME匹配中文


使用FME匹配中文

通过PythonCaller

通过Python去匹配中文这种方式可以直接使用Python中的re包进行中文的匹配,自然可以达到匹配中文的效果。

转换器设置及匹配结果截图如下:

使用FME匹配中文使用FME匹配中文

使用FME匹配中文



总结

两种方式都可以在新版的FME中达到匹配中文的效果,具体是要使用转换器还是写两行代码,这个要看心情。

欢迎关注本人公众号,以便接收最新技术资讯


使用FME匹配中文


相关文章:

  • 2022-12-23
  • 2022-12-23
  • 2022-02-16
  • 2021-11-30
  • 2021-05-29
  • 2022-12-23
  • 2021-12-24
  • 2022-12-23
猜你喜欢
  • 2022-01-01
  • 2022-12-23
  • 2021-03-30
  • 2022-01-03
  • 2021-09-30
  • 2021-08-11
  • 2021-12-14
相关资源
相似解决方案