小编典典

Java 斯坦福 NLP:语音标签的一部分?

all

在这里演示的斯坦福 NLP给出了这样的输出:

Colorless/JJ green/JJ ideas/NNS sleep/VBP furiously/RB ./.

词性标签是什么意思?我找不到正式的名单。是斯坦福自己的系统,还是他们使用通用标签?(JJ例如,什么是?)

此外,例如,当我遍历句子、寻找名词时,我最终会做一些事情,比如检查 tag 是否为.contains('N').
这感觉很弱。有没有更好的方法来以编程方式搜索某个词性?


阅读 62

收藏
2022-08-07

共1个答案

小编典典

宾州树库项目。查看词性标记ps。

JJ是形容词。NNS是名词,复数。VBP 是动词现在时。RB是副词。

那是给英语的。对于中国人来说,它是 Penn Chinese Treebank。对于德语,它是 NEGRA 语料库。

  1. CC 协调连词
  2. CD 基数
  3. DT 确定器
  4. EX Existential there
  5. FW 外来词
  6. IN 介词或从属连词
  7. JJ形容词
  8. JJR 形容词,比较级
  9. JJS 形容词,最高级
  10. LS 列表项标记
  11. MD模态
  12. NN 名词,单数或质量
  13. NNS 名词,复数
  14. NNP 专有名词,单数
  15. NNPS 专有名词,复数
  16. PDT 预定义器
  17. POS 所有格结尾
  18. PRP人称代词
  19. PRP$ 所有格代词
  20. RB 副词
  21. RBR 副词,比较
  22. RBS 副词,最高级
  23. 反相粒子
  24. 符号
  25. 呃感叹词
  26. VB 动词,基本形式
  27. VBD 动词,过去式
  28. VBG 动词、动名词或现在分词
  29. VBN 动词,过去分词
  30. VBP 动词,非第三人称单数现在时
  31. VBZ 动词,第三人称单数现在时
  32. WDT Wh确定器
  33. WP Wh 颅代词
  34. WP$ 所有格代词
  35. WRB 头颅副词
2022-08-07