最近在拜读郑捷老师的《NLP汉语自然语言处理原理与实践》,姑且简称CNLP,在阅读的过程中,记录下自己的收获与心得,以便以后翻阅查看。

-
自然语言处理的应用领域:信息检索、信息抽取、数据挖掘、舆情分析、文本摘要、自动问答系统等;
-
自然语言处理的主要任务:从最初的对词的研究,发展到现在的对句子的研究,即对句法、句意、以及句子生成的研究,已经能够比较好的解决句子层面的问题,但还没达到解决篇章层面的问题;
-
自然语言处理的一般架构:
- 左侧是语法层面的模块,包括分词、词性标注与句法解析;右侧偏重语义层面的理解, 命名实体识别主要用来识别语料中的专有名词和未登录词的成词情况,如人名、地名、组织机构名等,其结果受中文分词和词性标注的影响。即命名实体识别是以分词与词性标注位签前提的。
- 语义组块用来确定一个以上词汇构成的短语结构,即短语级别的标注,主要识别名词性短语、动词性短语、介词短语等。语义组块的识别来源于中文分词、词性标注和命名实体识别的共同信息。即语义组块的识别特征必须包含中文分词、命名实体识别和词性标注。
- 语义角色标注是以句子中的动词为中心来预测句子中各个语法成分的特征。
-
开源的NLP系统举例:LTP, StanfordNLP, FudanNLP, HanLP等。
相关文章:
-
2021-07-22
-
2022-01-04
-
2021-11-20
-
2021-05-24
-
2021-09-12
-
2021-07-06
-
2021-11-21
猜你喜欢
-
2021-10-17
-
2022-01-06
-
2021-12-19
-
2021-06-17
-
2022-12-23
-
2021-09-14
-
2021-10-31
相关资源
-
下载
2022-12-18
-
下载
2021-06-06
-
下载
2023-02-11
-
下载
2022-12-14