¿Cómo eliminar elementos duplicados de CSV o cualquier otro archivo en Java?

Publicado: 2021-05-28

Cómo eliminar elementos duplicados de CSV o cualquier otro archivo en Java

Encontrar líneas duplicadas de un archivo no es un problema difícil. Pero en algún momento en una pregunta de la entrevista, la gente a veces se confunde mucho sobre el método que tienen que usar.

En este tutorial, repasaremos los pasos sobre cómo eliminar duplicados de un archivo CSV y cualquier otro archivo.

Empecemos:

Paso 1.

Crear archivo CrunchifyFindDuplicateCSV .java

Paso 2.

  • Ponga el siguiente código en el archivo.
  • Estamos usando BufferedReader para leer archivos.
  • Uno por agregar líneas a HashSet.
    • La clase HashSet implementa la interfaz Set, respaldada por una tabla hash (en realidad, una instancia de HashMap). No garantiza el orden de iteración del conjunto; en particular, no garantiza que el orden se mantenga constante en el tiempo. Esta clase permite el elemento nulo.
  • Use el método add () para verificar si la línea ya está presente en Set o no.
    • Agrega el elemento especificado a este conjunto si aún no está presente. De manera más formal, agrega el elemento e especificado a este conjunto si este conjunto no contiene ningún elemento e2, de modo que Objects.equals(e, e2). Si este conjunto ya contiene el elemento, la llamada deja el conjunto sin cambios y returns false .
  • Una vez omitida, imprimiremos esa línea como una línea omitida.

archivo crunchify.csv

CrunchifyFindDuplicateCSV.java

Ejecutemos el programa Java en IntelliJ IDE.

Aquí hay un resultado:

Espero que encuentre útil este programa Java para encontrar líneas duplicadas en CSV o cualquier otro archivo.

¿Cómo encontrar líneas duplicadas en CSV usando el comando Linux?

Resultado:

Cómo eliminar elementos duplicados de un archivo CSV en Linux