自然语言处理

[自然语言处理] 基于pycorrector实现文本纠错

文本纠错(Text Error Correction)技术旨在自动修正输入文本中的拼写、语法、标点符号等错误,以提高文本的准确性、通顺性和规范性。该技术可以通过自然语言处理技术实现,基于上下文和语言规则对文本进行分析和推断,发现其中的错误,并给出正确的替换或修改建议。 pycorrector是一个开 ... »

使用自动模型

本文通过文本分类任务演示了HuggingFace自动模型使用方法,既不需要手动计算loss,也不需要手动定义下游任务模型,通过阅读自动模型实现源码,提高NLP建模能力。 一.任务和数据集介绍 1.任务介绍 前面章节通过手动方式定义下游任务模型,HuggingFace也提供了一些常见的预定义下游任务模 ... »

shengshengwang

中文命名实体识别

本文通过people_daily_ner数据集,介绍两段式训练过程,第一阶段是训练下游任务模型,第二阶段是联合训练下游任务模型和预训练模型,来实现中文命名实体识别任务。 一.任务和数据集介绍 1.命名实体识别任务 NER(Named Entity Recognition)和Pos(Part-of-S ... »

shengshengwang

中文情感分类

本文通过ChnSentiCorp数据集介绍了文本分类任务过程,主要使用预训练语言模型bert-base-chinese直接在测试集上进行测试,也简要介绍了模型训练流程,不过最后没有保存训练好的模型。 一.任务和数据集介绍 1.任务 中文情感分类本质还是一个文本分类问题。 2.数据集 本文使用ChnS ... »

shengshengwang

使用训练工具

HuggingFace上提供了很多已经训练好的模型库,如果想针对特定数据集优化,那么就需要二次训练模型,并且HuggingFace也提供了训练工具。 一.准备数据集 1.加载编码工具 加载hfl/rbt3编码工具如下所示: def load_encode(): # 1.加载编码工具 # 第6章/加载 ... »

shengshengwang

一文详解自然语言处理两大任务与代码实战:NLU与NLG

> 自然语言处理(NLP)涵盖了从基础理论到实际应用的广泛领域,本文深入探讨了NLP的关键概念,包括词向量、文本预处理、自然语言理解与生成、统计与规则驱动方法等,为读者提供了全面而深入的视角。 > 作者 TechLead,拥有10+年互联网服务架构、AI产品研发经验、团队管理经验,同济本复旦硕,复旦 ... »

xfuture

聊聊自然语言处理NLP

## 概述 自然语言处理(NLP)的正式定义:是一个使用计算机科学、人工智能(AI)和形式语言学概念来分析自然语言的研究领域。不太正式的定义表明:它是一组工具,用于从自然语言源(如web页面和文本文档)获取有意义和有用的信息。NLP工具的实现一般是基于机器学习与深度学习、其它算法(Lucene Co ... »

zhiyong-ITNote

[自然语言处理] 自然语言处理库spaCy使用指北

spaCy是一个基于Python编写的开源自然语言处理库。基于自然处理领域的最新研究,spaCy提供了一系列高效且易用的工具,用于文本预处理、文本解析、命名实体识别、词性标注、句法分析和文本分类等任务。 spaCy的官方仓库地址为:[spaCy-github](https://github.com/ ... »

luohenyueji

自然语言处理 Paddle NLP - 开放域对话系统-理论

常见的对话系统 - 个人助手 •Apple Siri, Amazon Alexa, Baidu Xiaodu - 客户服务•餐厅预定、商品咨询、债务催收 - 休闲娱乐 •Microsoft XiaoIce,Replika ![image](https://img2023.cnblogs.com/bl ... »

vipsoft

自然语言处理 Paddle NLP - 任务式对话系统-理论

什么是任务型对话: - 任务型:用于帮助用户完成某领域的特定任务,例如订餐、查天气、订票等 - 闲聊型:也称作开放域对话系统,目标是让用户持续的参与到交互过程,提供情感陪伴 - 问答型:提供知识满足,具体类型比较多,如图谱问答、表格问答、文档问答等 ![image](https://img2023. ... »

vipsoft

自然语言处理 Paddle NLP - 文本翻译技术及应用-理论

- 什么是机器翻译 - 机器翻译质量的自动评价 - 从统计机器翻译到神经网络机器翻译 - 多语言/多领域/多模态的翻译应用 - 神经网络机器翻译面临的挑战 视频:https://aistudio.baidu.com/aistudio/course/introduce/24177?sharedLess ... »

vipsoft

自然语言处理 Paddle NLP - 结构化数据问答-理论

NLP问答任务 相似度和规则匹配,都是早期的方法,现在主流的方法,都是基于生成的方法 结构化数据问答,有两种形式,一种是知识图谱形式、一种是关系型数据库形式。 ![image](https://img2023.cnblogs.com/blog/80824/202306/80824-202306130 ... »

vipsoft

自然语言处理 Paddle NLP - 检索式文本问答-理论

问答系统(Question Answering System,QA) 是信息检索系统的一种高级形式,它能用准确、简洁的自然语言回答用户用自然语言提出的问题。其研究兴起的主要原因是人们对快速、准确地获取信息的需求。问答系统是人工智能. 抽取式阅读理解:它的答案一定是段落里的一个片段,所以在训练前,先要 ... »

vipsoft

自然语言处理 Paddle NLP - 情感分析技术及应用SKEP-实践

## Part A. 情感分析任务 众所周知,人类自然语言中包含了丰富的情感色彩:表达人的情绪(如悲伤、快乐)、表达人的心情(如倦怠、忧郁)、表达人的喜好(如喜欢、讨厌)、表达人的个性特征和表达人的立场等等。情感分析在商品喜好、消费决策、舆情分析等场景中均有应用。利用机器自动分析这些情感倾向,不但有 ... »

vipsoft AI