一区二区三区在线-一区二区三区亚洲视频-一区二区三区亚洲-一区二区三区午夜-一区二区三区四区在线视频-一区二区三区四区在线免费观看

服務器之家:專注于服務器技術及軟件下載分享
分類導航

Linux|Centos|Ubuntu|系統進程|Fedora|注冊表|Bios|Solaris|Windows7|Windows10|Windows11|windows server|

服務器之家 - 服務器系統 - Linux - linux中去掉文件重復數據行的方法(去重復ip)

linux中去掉文件重復數據行的方法(去重復ip)

2019-11-14 16:05linux教程網 Linux

本文介紹了linux系統中去掉一個文件中重復的數據行的方法,有需要的朋友參考學習下

一、去掉相鄰重復的數據行

 

復制代碼

代碼如下:


$cat data1.txt | uniq 
輸出:
beijing 
wuhan 
beijing 
wuhan 

 

二、去掉所有重復的數據行

 

復制代碼

代碼如下:


$cat data1.txt | sort | uniq 

 

注:
只有uniq命令的話,只是把相鄰的重復的數據行去掉。
如果先 sort 的話,就會把所有重復的數據行變成相鄰的數據行,再 uniq 的話,就去掉所有重復的數據行了。

輸出:
beijing  
wuhan

附:data1.txt

 

復制代碼

代碼如下:


[root@syy ~]# cat data1.txt 
beijing 
beijing 
wuhan 
wuhan 
wuhan 
beijing 
beijing 
beijing 
wuhan 
wuhan 

 

注:在過濾日志中的IP地址很有用。

Linux下刪除大數據文件中部分字段重復的行

最近寫的一個數據采集程序生成了一個含有1千多萬行數據的文件,數據由4個字段組成,按照要求需要刪除第二個字段重復的行,找來找去linux下也沒找到合適的工具,sed/gawk等流處理工具只能針對一行一行處理,并無法找到字段重復的行。看來只好自己python一個程序了,突然想起來利用mysql,于是進行乾坤大挪移:

1. 利用mysqlimport --local dbname data.txt導入數據到表中,表名要與文件名一致
2. 執行下列sql語句(要求唯一的字段為uniqfield)

 

復制代碼

代碼如下:


use dbname;
alter table tablename add rowid int auto_increment not null;
create table t select min(rowid) as rowid from tablename group by uniqfield;
create table t2 select tablename .* from tablename,t where tablename.rowid= t.rowid;</p> <p>drop table tablename;
rename table t2 to tablename;

延伸 · 閱讀

精彩推薦
主站蜘蛛池模板: 动态图啪啪120秒免费看 | 亚洲国产视频一区 | 亚洲另类第一页 | 男人猛戳女人下部30分钟 | 3x免费高清视频 | 国产亚洲精aa在线观看不卡 | 国产综合视频在线 | 80日本xxxxxxxxx96| 色愉拍亚洲偷自拍 | 精品一区二区三区五区六区七区 | 99爱爱| 极品美女a∨片在线看 | 国产精品高清在线 | 亚洲一区二区福利视频 | 污污的动态图合集 | 国产精品视频二区不卡 | 非洲黑人女bbwxxxx | 亚洲成人免费 | 天天爽天天干天天操 | 精选国产AV精选一区二区三区 | 亚洲免费精品 | 2019年国产不卡在线刷新 | 水多多凹凸福利视频导航 | 日本韩国推理片免费观看网站 | 波多野结衣在线观看视频 | 都市风流贵妇激情 | 精品久久一 | 99色亚洲 | 男人含玉势出嫁束器 | 无删减影视免费观看 | 偷拍综合网 | 校服下的白嫩小乳尖h1v1 | h肉动漫在线视频无修无遮挡 | 国产麻豆精品免费视频 | 白丝捆绑调教 | 欧美成狂野欧美在线观看 | 特黄级 | 国产一区二区三区日韩 | 韩国久播影院理论片不卡影院 | 91精品国产麻豆国产自产在线 | 亚洲国产精品一在线观看 |