1.首先学习基本的知识,文本分析。学习基本的linux命令,使用脚本对文本进行细粒度的切分,并对模型进行调研

2.分析文本文件中的特征,

3.分析文本文件中上下文之间的关系。

4.编写脚本文件,对脚本预处理,数据清洗,并产生格式化的数据

5.建立模型

6.编写map,reduce过程文件,对数据进行处理,产生结果。

 

相关文章:

  • 2022-12-23
  • 2021-06-12
  • 2021-10-09
  • 2021-08-29
  • 2021-05-19
  • 2021-09-05
  • 2021-05-30
  • 2022-12-23
猜你喜欢
  • 2022-12-23
  • 2021-07-29
  • 2022-12-23
  • 2021-04-29
  • 2021-05-24
  • 2021-04-19
  • 2021-08-27
相关资源
相似解决方案