注意:我已经看到了这个问题,但是还没有人回答,所以没有太大帮助。奇怪的是,被标记为“可能重复”的问题已被删除(我第一次看到它。)
我们在使用Pattern进行正则表达式验证时遇到问题。这些都没有发生在我们的代码中,整个事情都在Spring Framework和Hibernate的验证中发生。
(Spring 3.2.1,Spring 3.1.1,Hibernate Validation 4.2.0)
该调用尝试使用@Valid注释验证Spring Framework @ModelAttribute注释:
@RequestMapping("/foo/bar") public String doFooBar(@Valid @ModelAttribute("fooBarForm") FooBar form)
经过验证的FooBar对象上的字段具有@Pattern注释,如下所示:
public class FooBar implements Serializable{ @Length(min=0,max=22) @Pattern(regexp=ValidPattern.MYVALIDPATTERN) private String myField;
FooBar类还包含其他具有自定义验证的自定义对象。
ValidPattern.MYVALIDPATTERN中的验证模式如下所示:
^([\w\-,:'"\.\?+_#~!@#$&*() /]*|(?:<sup>™</sup>)*|(?:<sup>®</sup>)*|(?:<sup>©</sup>)*)*$
调用此验证时,它可以在99.99%的时间内正常运行。但是每天至少有一次,线程会以某种方式“耗尽”整个服务器,因此我们必须手动将其杀死(否则最终会导致堆栈溢出)。
当我们杀死线程时,我们发现线程已经卡在这个Pattern类中,一遍又一遍地做一些事情(下面的堆栈跟踪)。关于如何解决(甚至陷阱)这个问题的任何想法?
[Top of stack] java.util.regex.Pattern$6.isSatisfiedBy(Pattern.java:4780) java.util.regex.Pattern$6.isSatisfiedBy(Pattern.java:4780) java.util.regex.Pattern$6.isSatisfiedBy(Pattern.java:4780) java.util.regex.Pattern$6.isSatisfiedBy(Pattern.java:4780) java.util.regex.Pattern$6.isSatisfiedBy(Pattern.java:4780) java.util.regex.Pattern$6.isSatisfiedBy(Pattern.java:4780) java.util.regex.Pattern$6.isSatisfiedBy(Pattern.java:4780) java.util.regex.Pattern$6.isSatisfiedBy(Pattern.java:4780) java.util.regex.Pattern$6.isSatisfiedBy(Pattern.java:4780) java.util.regex.Pattern$6.isSatisfiedBy(Pattern.java:4780) java.util.regex.Pattern$6.isSatisfiedBy(Pattern.java:4780) java.util.regex.Pattern$6.isSatisfiedBy(Pattern.java:4780) java.util.regex.Pattern$6.isSatisfiedBy(Pattern.java:4780) java.util.regex.Pattern$6.isSatisfiedBy(Pattern.java:4780) java.util.regex.Pattern$6.isSatisfiedBy(Pattern.java:4780) java.util.regex.Pattern$6.isSatisfiedBy(Pattern.java:4780) java.util.regex.Pattern$6.isSatisfiedBy(Pattern.java:4780) java.util.regex.Pattern$6.isSatisfiedBy(Pattern.java:4780) java.util.regex.Pattern$6.isSatisfiedBy(Pattern.java:4780) java.util.regex.Pattern$6.isSatisfiedBy(Pattern.java:4780) java.util.regex.Pattern$6.isSatisfiedBy(Pattern.java:4780) java.util.regex.Pattern$CharProperty.match(Pattern.java:3362) java.util.regex.Pattern$Curly.match0(Pattern.java:3777) java.util.regex.Pattern$Curly.match(Pattern.java:3761) java.util.regex.Pattern$Branch.match(Pattern.java:4131) java.util.regex.Pattern$GroupHead.match(Pattern.java:4185) java.util.regex.Pattern$Loop.match(Pattern.java:4312) java.util.regex.Pattern$GroupTail.match(Pattern.java:4244) java.util.regex.Pattern$BranchConn.match(Pattern.java:4095) java.util.regex.Pattern$Curly.match0(Pattern.java:3799) java.util.regex.Pattern$Curly.match(Pattern.java:3761) java.util.regex.Pattern$Branch.match(Pattern.java:4131) java.util.regex.Pattern$GroupHead.match(Pattern.java:4185) java.util.regex.Pattern$Loop.match(Pattern.java:4312) java.util.regex.Pattern$GroupTail.match(Pattern.java:4244) java.util.regex.Pattern$BranchConn.match(Pattern.java:4095) java.util.regex.Pattern$Curly.match0(Pattern.java:3799) java.util.regex.Pattern$Curly.match(Pattern.java:3761) java.util.regex.Pattern$Branch.match(Pattern.java:4131) java.util.regex.Pattern$GroupHead.match(Pattern.java:4185) java.util.regex.Pattern$Loop.match(Pattern.java:4312) java.util.regex.Pattern$GroupTail.match(Pattern.java:4244) java.util.regex.Pattern$BranchConn.match(Pattern.java:4095) java.util.regex.Pattern$Curly.match0(Pattern.java:3799) java.util.regex.Pattern$Curly.match(Pattern.java:3761) java.util.regex.Pattern$Branch.match(Pattern.java:4131) java.util.regex.Pattern$GroupHead.match(Pattern.java:4185) java.util.regex.Pattern$Loop.match(Pattern.java:4312) java.util.regex.Pattern$GroupTail.match(Pattern.java:4244) java.util.regex.Pattern$BranchConn.match(Pattern.java:4095) java.util.regex.Pattern$Curly.match0(Pattern.java:3799) java.util.regex.Pattern$Curly.match(Pattern.java:3761) java.util.regex.Pattern$Branch.match(Pattern.java:4131) java.util.regex.Pattern$GroupHead.match(Pattern.java:4185) java.util.regex.Pattern$Loop.match(Pattern.java:4312) java.util.regex.Pattern$GroupTail.match(Pattern.java:4244) java.util.regex.Pattern$BranchConn.match(Pattern.java:4095) java.util.regex.Pattern$Curly.match0(Pattern.java:3799) java.util.regex.Pattern$Curly.match(Pattern.java:3761) java.util.regex.Pattern$Branch.match(Pattern.java:4131) java.util.regex.Pattern$GroupHead.match(Pattern.java:4185) java.util.regex.Pattern$Loop.match(Pattern.java:4312) java.util.regex.Pattern$GroupTail.match(Pattern.java:4244) java.util.regex.Pattern$BranchConn.match(Pattern.java:4095) java.util.regex.Pattern$Curly.match0(Pattern.java:3799) java.util.regex.Pattern$Curly.match(Pattern.java:3761) java.util.regex.Pattern$Branch.match(Pattern.java:4131) java.util.regex.Pattern$GroupHead.match(Pattern.java:4185) java.util.regex.Pattern$Loop.match(Pattern.java:4312) java.util.regex.Pattern$GroupTail.match(Pattern.java:4244) java.util.regex.Pattern$BranchConn.match(Pattern.java:4095) java.util.regex.Pattern$Curly.match0(Pattern.java:3799) java.util.regex.Pattern$Curly.match(Pattern.java:3761) java.util.regex.Pattern$Branch.match(Pattern.java:4131) java.util.regex.Pattern$GroupHead.match(Pattern.java:4185) java.util.regex.Pattern$Loop.match(Pattern.java:4312) java.util.regex.Pattern$GroupTail.match(Pattern.java:4244) java.util.regex.Pattern$BranchConn.match(Pattern.java:4095) java.util.regex.Pattern$Curly.match0(Pattern.java:3799) java.util.regex.Pattern$Curly.match(Pattern.java:3761) java.util.regex.Pattern$Branch.match(Pattern.java:4131) java.util.regex.Pattern$GroupHead.match(Pattern.java:4185) java.util.regex.Pattern$Loop.match(Pattern.java:4312) java.util.regex.Pattern$GroupTail.match(Pattern.java:4244) java.util.regex.Pattern$BranchConn.match(Pattern.java:4095) java.util.regex.Pattern$Curly.match0(Pattern.java:3799) java.util.regex.Pattern$Curly.match(Pattern.java:3761) java.util.regex.Pattern$Branch.match(Pattern.java:4131) java.util.regex.Pattern$GroupHead.match(Pattern.java:4185) java.util.regex.Pattern$Loop.match(Pattern.java:4312) java.util.regex.Pattern$GroupTail.match(Pattern.java:4244) java.util.regex.Pattern$BranchConn.match(Pattern.java:4095) java.util.regex.Pattern$Curly.match0(Pattern.java:3799) java.util.regex.Pattern$Curly.match(Pattern.java:3761) java.util.regex.Pattern$Branch.match(Pattern.java:4131) java.util.regex.Pattern$GroupHead.match(Pattern.java:4185) java.util.regex.Pattern$Loop.match(Pattern.java:4312) java.util.regex.Pattern$GroupTail.match(Pattern.java:4244) java.util.regex.Pattern$BranchConn.match(Pattern.java:4095) java.util.regex.Pattern$Curly.match0(Pattern.java:3799) java.util.regex.Pattern$Curly.match(Pattern.java:3761) java.util.regex.Pattern$Branch.match(Pattern.java:4131) java.util.regex.Pattern$GroupHead.match(Pattern.java:4185) java.util.regex.Pattern$Loop.match(Pattern.java:4312) java.util.regex.Pattern$GroupTail.match(Pattern.java:4244) java.util.regex.Pattern$BranchConn.match(Pattern.java:4095) java.util.regex.Pattern$Curly.match0(Pattern.java:3799) java.util.regex.Pattern$Curly.match(Pattern.java:3761) java.util.regex.Pattern$Branch.match(Pattern.java:4131) java.util.regex.Pattern$GroupHead.match(Pattern.java:4185) java.util.regex.Pattern$Loop.match(Pattern.java:4312) java.util.regex.Pattern$GroupTail.match(Pattern.java:4244) java.util.regex.Pattern$BranchConn.match(Pattern.java:4095) java.util.regex.Pattern$Curly.match0(Pattern.java:3799) java.util.regex.Pattern$Curly.match(Pattern.java:3761) java.util.regex.Pattern$Branch.match(Pattern.java:4131) java.util.regex.Pattern$GroupHead.match(Pattern.java:4185) java.util.regex.Pattern$Loop.match(Pattern.java:4312) java.util.regex.Pattern$GroupTail.match(Pattern.java:4244) java.util.regex.Pattern$BranchConn.match(Pattern.java:4095) java.util.regex.Pattern$Curly.match0(Pattern.java:3799) java.util.regex.Pattern$Curly.match(Pattern.java:3761) java.util.regex.Pattern$Branch.match(Pattern.java:4131) java.util.regex.Pattern$GroupHead.match(Pattern.java:4185) java.util.regex.Pattern$Loop.matchInit(Pattern.java:4331) java.util.regex.Pattern$Prolog.match(Pattern.java:4268) java.util.regex.Pattern$Begin.match(Pattern.java:3137) java.util.regex.Matcher.match(Matcher.java:1138) java.util.regex.Matcher.matches(Matcher.java:519) org.hibernate.validator.constraints.impl.PatternValidator.isValid(PatternValidator.java:52) org.hibernate.validator.constraints.impl.PatternValidator.isValid(PatternValidator.java:28) org.hibernate.validator.engine.ConstraintTree.validateSingleConstraint(ConstraintTree.java:278) org.hibernate.validator.engine.ConstraintTree.validateConstraints(ConstraintTree.java:153) org.hibernate.validator.engine.ConstraintTree.validateConstraints(ConstraintTree.java:117) org.hibernate.validator.metadata.MetaConstraint.validateConstraint(MetaConstraint.java:84) org.hibernate.validator.engine.ValidatorImpl.validateConstraint(ValidatorImpl.java:452) org.hibernate.validator.engine.ValidatorImpl.validateConstraintsForDefaultGroup(ValidatorImpl.java:397) org.hibernate.validator.engine.ValidatorImpl.validateConstraintsForCurrentGroup(ValidatorImpl.java:361) org.hibernate.validator.engine.ValidatorImpl.validateInContext(ValidatorImpl.java:313) org.hibernate.validator.engine.ValidatorImpl.validateCascadedConstraint(ValidatorImpl.java:613) org.hibernate.validator.engine.ValidatorImpl.validateCascadedConstraints(ValidatorImpl.java:478) org.hibernate.validator.engine.ValidatorImpl.validateInContext(ValidatorImpl.java:322) org.hibernate.validator.engine.ValidatorImpl.validateCascadedConstraint(ValidatorImpl.java:613) org.hibernate.validator.engine.ValidatorImpl.validateCascadedConstraints(ValidatorImpl.java:478) org.hibernate.validator.engine.ValidatorImpl.validateInContext(ValidatorImpl.java:322) org.hibernate.validator.engine.ValidatorImpl.validate(ValidatorImpl.java:139) org.springframework.validation.beanvalidation.SpringValidatorAdapter.validate(SpringValidatorAdapter.java:102) org.springframework.validation.DataBinder.validate(DataBinder.java:772) org.springframework.web.method.annotation.ModelAttributeMethodProcessor.validateIfApplicable(ModelAttributeMethodProcessor.java:159) org.springframework.web.method.annotation.ModelAttributeMethodProcessor.resolveArgument(ModelAttributeMethodProcessor.java:107) [Abbreviated for brevity]
注意pobrelkey和David Wallace的答案都是正确的,但是这里有更多解释…
该正则表达式之所以“疯狂”(标题为BTW)是因为它受到灾难性的回溯。它具有经典的/^(A*)*$/形式。请注意,仅当模式与目标字符串不匹配时,才会发生这种失控行为。
/^(A*)*$/
考虑到失控模式: ^(A*|B*|C*|D*)*$有几种解决方法:
^(A*|B*|C*|D*)*$
^(A|B|C|D)*$
^(A*+|B*+|C*+|D*+)*$
*
*+
^(?>A*|B*|C*|D*)*$
后两个的性能应该比第一个快很多,但是所有三个都将解决“ regex变得疯狂”的问题。(是的,最好不要使用正则表达式解析HTML。)