【发布时间】:2014-08-31 23:41:12
【问题描述】:
我想在两个数组中找到部分匹配的 ipv6 前缀。例如,一个数组中的2001:db8: 将匹配另一个数组中的2001:db8:1::/48 和2001:db8:2::/48。
我已经通过迭代另一个数组来让它工作:
ru_routes=( $(curl -4 ftp://ftp.ripe.net/ripe/stats/delegated-ripencc-latest | egrep -o '\|RU\|ipv6\|.+?::\|[0-9]+' | cut -d'|' -f4 | sed 's/::$/:/g') );
msk_ix_routes=( $(curl -4 http://www.msk-ix.ru/download/lg/msk_ipv6_pfx.txt.gz | gunzip | egrep -o '\b.*::/[0-9]*') );
routes=();
for item1 in ${msk_ix_routes[@]}; do
for item2 in ${ru_routes[@]}; do
if [[ $item1 = $item2* ]]; then
routes+=( $item1 );
break
fi
done
done
但它在我的 mips 路由器上运行有点慢(约 90 秒)。我找到了this useful answer,它运行得更快,但我无法让它以与上述相同的方式工作。而且我认为我不需要像示例中那样的“if”构造,因为它会两次做同样的事情。我的不工作版本:
msk=" ${msk_ix_routes[*]} "; # add framing blanks
for item in ${ru_routes[@]}; do
routes+=( egrep -o "$item[\S]*/g" <<< $msk );
done
我猜这里引用和转义有问题,但我无法解决。请帮忙)我愿意接受建议。
顺便说一句,我在第一个版本中使用了“comm”,它运行得更快,但后来它只完全匹配,因此我开始玩循环:
routes=( $(comm -12 <(printf '%s\n' "${ru_routes[@]}" | LC_ALL=C sort) <(printf '%s\n' "${msk_ix_routes[@]}" | LC_ALL=C sort)) );
【问题讨论】:
-
与您要引用
[@]列表扩展以防止数组元素分词的任何其他内容无关(在您的情况下可能不是问题,但通常是正确的做事方式)。 -
那两个不起作用的选项不起作用怎么办?他们在做什么? (第二个看起来将创建一个空列表,因为
[[测试不返回任何内容(仅返回代码)。您几乎肯定希望在if块中进行该测试,然后附加 @987654331 @ 到列表中(就像在链接的问题中一样)。 -
我同意第二个选项(删除它)第一个给我 889111 匹配而不是 4xx 有效匹配。 $item 将是一个完全匹配,我想获得所有更长的匹配(子字符串)
标签: regex bash debian-based