如题,Hyperscan号称是最快的正则引擎,由Intel开发。我记得SR使用的是Google的re2,在大规模匹配场景下,速度还是不够快。这里的大规模包括:
1.数据量。比如数据量上亿以上。
2.匹配的文本。匹配的文本长度较长,char_length计算长度300以上。
3.正则:正则表达式char_length计算长度1万以上。
替换成Hyperscan后,正则效率应该会大大提升。
如题,Hyperscan号称是最快的正则引擎,由Intel开发。我记得SR使用的是Google的re2,在大规模匹配场景下,速度还是不够快。这里的大规模包括:
1.数据量。比如数据量上亿以上。
2.匹配的文本。匹配的文本长度较长,char_length计算长度300以上。
3.正则:正则表达式char_length计算长度1万以上。
替换成Hyperscan后,正则效率应该会大大提升。