ClearTK 提供一个 Java 的用来开发基于统计的 NLP 自然语言处理框架。基于 Apache UIMA 构建,由科罗拉多大学的计算语言与教育研究中心开发。
示例代码:
FeatureExtractor1<Token> extractor = new TypePathExtractor<Token>(Token.class, "pos"); List<Feature> features = extractor.extract(this.jCas, token);
Maven
<properties> <cleartk.version>2.0.0</cleartk.version> </properties> ... <dependencies> <dependency> <groupId>org.cleartk</groupId> <artifactId>cleartk-ml</artifactId> <version>${cleartk.version}</version> </dependency> <dependency> <groupId>org.cleartk</groupId> <artifactId>cleartk-ml-liblinear</artifactId> <version>${cleartk.version}</version> </dependency> ... </dependencies>