1.背景

面试的时候常常会被问到一个问题,大型的文件该怎样去重。写一个python脚本是效率非常差的策略。

这里讲下怎样用shell实现。

2.流程

(1)文件分割

用split函数对于文件分割。

split -l 10000 test.txt

-l是依照行分割,10000是每10000行分割成一份文件。分割完会在当前文件夹自己主动生成10000行一例的文件。

(2)去重

sort -u origin.txt -o output.txt

本文来自博客 “李博Garvin“
转载请标明出处:http://blog.csdn.net/buptgshengod]

相关文章:

  • 2022-12-23
  • 2022-12-23
  • 2021-12-02
  • 2021-07-03
  • 2021-12-09
  • 2022-02-19
  • 2021-11-14
猜你喜欢
  • 2021-12-09
  • 2022-01-18
  • 2021-12-05
  • 2022-02-03
  • 2022-12-23
  • 2022-12-23
  • 2022-12-23
相关资源
相似解决方案