Wie entferne ich doppelte Elemente aus CSV oder einer anderen Datei in Java?

Veröffentlicht: 2021-05-28

So entfernen Sie doppelte Elemente aus CSV oder einer anderen Datei in Java

Das Finden doppelter Zeilen aus einer Datei ist kein großes Problem. Aber manchmal sind die Leute in einer Interviewfrage manchmal sehr verwirrt über die Methode, die sie anwenden müssen.

In diesem Tutorial gehen wir Schritte zum Entfernen von Duplikaten aus einer CSV-Datei und jeder anderen Datei durch.

Lass uns anfangen:

Schritt 1.

Datei CrunchifyFindDuplicateCSV .java erstellen

Schritt 2.

  • Fügen Sie den folgenden Code in die Datei ein.
  • Wir verwenden BufferedReader, um Dateien zu lesen.
  • Fügen Sie nach und nach Zeilen zu HashSet hinzu.
    • Die HashSet-Klasse implementiert die Set-Schnittstelle, unterstützt durch eine Hash-Tabelle (eigentlich eine HashMap-Instanz). Es gibt keine Garantien bezüglich der Iterationsreihenfolge des Satzes; insbesondere garantiert sie nicht, dass die Reihenfolge im Laufe der Zeit konstant bleibt. Diese Klasse lässt das Nullelement zu.
  • Verwenden Sie die Methode add(), um zu prüfen, ob die Zeile bereits in Set vorhanden ist oder nicht.
    • Fügt das angegebene Element zu dieser Menge hinzu, falls es noch nicht vorhanden ist. Fügt formaler ausgedrückt das angegebene Element e zu dieser Menge hinzu, wenn diese Menge kein Element e2 enthält, sodass Objects.equals(e, e2). Wenn diese Menge das Element bereits enthält, lässt der Aufruf die Menge unverändert und returns false .
  • Einmal übersprungen, werden wir diese Zeile als übersprungene Zeile drucken.

crunchify.csv-Datei

CrunchifyFindDuplicateCSV.java

Lassen Sie uns das Java-Programm in der IntelliJ IDE ausführen.

Hier ist ein Ergebnis:

Ich hoffe, Sie finden dieses Java-Programm nützlich, um doppelte Zeilen in CSV- oder anderen Dateien zu finden.

Wie finde ich doppelte Zeilen in CSV mit dem Linux-Befehl?

Ergebnis:

So entfernen Sie doppelte Elemente aus der CSV-Datei in Linux