Come rimuovere elementi duplicati da CSV o qualsiasi altro file in Java?

Pubblicato: 2021-05-28

Come rimuovere elementi duplicati da CSV o qualsiasi altro file in Java

Trovare righe duplicate da un file non è un problema difficile. Ma a volte in una domanda di intervista, le persone a volte si confondono molto sul metodo che devono usare.

In questo tutorial esamineremo i passaggi su come rimuovere i duplicati da un file CSV e qualsiasi altro file.

Iniziamo:

Passo 1.

Crea file CrunchifyFindDuplicateCSV .java

Passo 2.

  • Metti sotto il codice nel file.
  • Stiamo usando BufferedReader per leggere i file.
  • Uno alla volta aggiungi righe a HashSet.
    • La classe HashSet implementa l'interfaccia Set, supportata da una tabella hash (in realtà un'istanza HashMap). Non fornisce garanzie sull'ordine di iterazione del set; in particolare, non garantisce che l'ordine rimanga costante nel tempo. Questa classe consente l'elemento null.
  • Usa il metodo add() per verificare se la riga è già presente in Set o meno.
    • Aggiunge l'elemento specificato a questo set se non è già presente. Più formalmente, aggiunge l'elemento specificato e a questo insieme se questo insieme non contiene alcun elemento e2 tale che Objects.equals(e, e2). Se questo set contiene già l'elemento, la chiamata lascia il set invariato e returns false .
  • Una volta saltata, stamperemo quella riga come una riga saltata.

crunchify.csv

CrunchifyFindDuplicateCSV.java

Eseguiamo il programma Java in IntelliJ IDE.

Ecco un risultato:

Spero che tu possa trovare utile questo programma Java per trovare righe duplicate in CSV o qualsiasi altro file.

Come trovare righe duplicate in CSV usando il comando Linux?

Risultato:

Come rimuovere elementi duplicati dal file CSV in Linux