我正在尝试编写一个可以提取命令的正则表达式,这是到目前为止使用负向后置断言获得的结果:
\b(?<![@#\/])\w.*
因此,输入:
/msg @nickname #channel foo bar baz /foo #channel @nickname foo bar baz foo bar baz
foo bar baz每次都提取。参见工作示例 https://regex101.com/r/lF9aG7/3
foo bar baz
但是在Go中,这不会编译http://play.golang.org/p/gkkVZgScS_
它抛出:
panic: regexp: Compile(`\b(?<![@#\/])\w.*`): error parsing regexp: invalid or unsupported Perl syntax: `(?<`
我做了一些研究,发现该语言不支持负向回溯以保证O(n)时间。
我该如何重写此正则表达式,以使其在没有负面效果的情况下完成相同的工作?
由于从后面看,您只使用了一个简单的字符集;您可以将其替换为否定的字符集:
\b[^@#/]\w.*
如果在字符串的开头允许使用,则使用^锚点:
^
(?:^|[^@#\/])\b\w.*
根据您问题中“转到游乐场”链接中的示例,我认为您正在寻找以开头的所有字符作为过滤条件[#@/]。您可以使用一个filter函数:
[#@/]
filter
func Filter(vs []string, f func(string) bool) []string { vsf := make([]string, 0) for _, v := range vs { if f(v) { vsf = append(vsf, v) } } return vsf }
和一个Process使用上述过滤器的函数:
Process
func Process(inp string) string { t := strings.Split(inp, " ") t = Filter(t, func(x string) bool { return strings.Index(x, "#") != 0 && strings.Index(x, "@") != 0 && strings.Index(x, "/") != 0 }) return strings.Join(t, " ") }
可以在操场上的http://play.golang.org/p/ntJRNxJTxo上看到它