Bagaimana Cara Menghapus Elemen Duplikat dari CSV atau File lain di Java?

Diterbitkan: 2021-05-28

Cara Menghapus Elemen Duplikat dari CSV atau File lainnya di Java

Menemukan baris duplikat dari file bukanlah masalah yang sulit. Namun terkadang dalam sebuah pertanyaan wawancara, orang terkadang menjadi sangat bingung tentang metode yang harus mereka gunakan.

Dalam tutorial ini kita akan membahas langkah-langkah tentang cara menghapus duplikat dari file CSV dan file lainnya.

Mari kita mulai:

Langkah 1.

Buat file CrunchifyFindDuplicateCSV .java

Langkah 2.

  • Masukkan kode di bawah ini ke dalam file.
  • Kami menggunakan BufferedReader untuk membaca file.
  • Satu demi satu tambahkan baris ke HashSet.
    • Kelas HashSet mengimplementasikan antarmuka Set, didukung oleh tabel hash (sebenarnya instance HashMap). Itu tidak menjamin urutan iterasi dari himpunan; khususnya, itu tidak menjamin bahwa pesanan akan tetap konstan dari waktu ke waktu. Kelas ini mengizinkan elemen null.
  • Gunakan metode add() untuk memeriksa apakah baris sudah ada di Set atau tidak.
    • Menambahkan elemen yang ditentukan ke set ini jika belum ada. Lebih formal, tambahkan elemen tertentu e ke set ini jika set ini tidak berisi elemen e2 sehingga Objects.equals(e, e2). Jika set ini sudah berisi elemen, panggilan membiarkan set tidak berubah dan returns false .
  • Setelah dilewati, kami akan mencetak garis itu sebagai garis yang dilewati.

file crunchify.csv

CrunchifyFindDuplicateCSV.java

Mari kita jalankan program Java di IntelliJ IDE.

Berikut adalah hasilnya:

Semoga program Java ini bermanfaat bagi Anda, temukan baris duplikat di CSV atau file lainnya.

Bagaimana menemukan baris duplikat di CSV menggunakan perintah Linux?

Hasil:

Cara Menghapus Elemen Duplikat dari File CSV di Linux