Cum să eliminați elementele duplicate din CSV sau orice alt fișier din Java?

Publicat: 2021-05-28

Cum să eliminați elementele duplicate din CSV sau orice alt fișier din Java

Găsirea unei linii duplicate dintr-un fișier nu este o problemă dificilă. Dar, uneori, într-o întrebare de interviu, oamenii devin uneori foarte confuzi cu privire la metoda pe care trebuie să o folosească.

În acest tutorial vom trece peste pașii despre cum să eliminați duplicatele dintr-un fișier CSV și orice alt fișier.

Să începem:

Pasul 1.

Creați fișierul CrunchifyFindDuplicateCSV .java

Pasul 2.

  • Pune codul de mai jos în fișier.
  • Folosim BufferedReader pentru a citi fișierele.
  • Una prin adăugarea liniilor la HashSet.
    • Clasa HashSet implementează interfața Set, susținută de un tabel hash (de fapt, o instanță HashMap). Nu oferă nicio garanție cu privire la ordinea de iterație a setului; în special, nu garantează că comanda va rămâne constantă în timp. Această clasă permite elementul nul.
  • Utilizați metoda add() pentru a verifica dacă linia este deja prezentă în Set sau nu.
    • Adaugă elementul specificat la acest set dacă nu este deja prezent. Mai formal, adaugă elementul specificat e la acest set dacă acest set nu conține niciun element e2 astfel încât Objects.equals(e, e2). Dacă acest set conține deja elementul, apelul lasă setul neschimbat și returns false .
  • Odată sărit, vom tipări acea linie ca o linie omisă.

fișier crunchify.csv

CrunchifyFindDuplicateCSV.java

Să rulăm programul Java în IntelliJ IDE.

Iată un rezultat:

Sper că veți găsi util acest program Java, găsiți linii duplicate în CSV sau orice alt fișier.

Cum să găsiți linii duplicate în CSV folosind comanda Linux?

Rezultat:

Cum să eliminați elementele duplicate din fișierul CSV în Linux