De acordo com as Leis 12.965/2014 e 13.709/2018, que regulam o uso da Internet e o tratamento de dados pessoais no Brasil, ao me inscrever na newsletter do portal DICAS-L, autorizo o envio de notificações por e-mail ou outros meios e declaro estar ciente e concordar com seus Termos de Uso e Política de Privacidade.
No ecossistema Unix/Linux, a tarefa de identificar ou remover linhas duplicadas é um exemplo clássico de como pequenos utilitários trabalhando juntos resolvem problemas complexos. Se você lida com logs, listas de e-mails ou extração de dados, dominar o sort e o uniq é indispensável.
O comando principal para lidar com duplicatas é o uniq. No entanto, ele possui uma característica importante: o uniq só compara linhas adjacentes. Por isso, quase sempre o utilizaremos em conjunto com o sort.
Se você tem um arquivo e precisa saber quais entradas aparecem mais de uma vez, utilize a opção -d (duplicated):
$ sort arquivo.txt | uniq -d