【发布时间】:2019-01-08 07:08:49
【问题描述】:
我正在尝试清理字符串,结果如下:
lt i gt 芽孢杆菌中抗砷基因的表征 lt i gt sp UWC 从成熟的粉煤灰酸性矿山排水中分离 中和固体
我正在尝试删除 lt、i、gt,因为它们是精简的 HTML 实体,似乎没有被删除。处理这个或其他我可以考虑的解决方案的最佳方法是什么?
这是我目前的解决方案:
/**
* @return string
*/
public function getFormattedTitle()
{
$string = preg_replace('/[^A-Za-z0-9\-]/', ' ', filter_var($this->getTitle(), FILTER_SANITIZE_STRING));
return $string;
}
这是一个示例输入字符串:
Assessing <i>Clivia</i> taxonomy using the core DNA barcode regions, <i>matK</i> and <i>rbcLa</i>
谢谢!
【问题讨论】:
标签: php string replace html-entities