Comment supprimer les éléments en double du CSV ou de tout autre fichier en Java ?

Publié: 2021-05-28

Comment supprimer les éléments en double de CSV ou de tout autre fichier en Java

Trouver des lignes en double à partir d'un fichier n'est pas un problème difficile. Mais parfois, dans une question d'entrevue, les gens deviennent parfois très confus quant à la méthode qu'ils doivent utiliser.

Dans ce didacticiel, nous passerons en revue les étapes de suppression des doublons d'un fichier CSV et de tout autre fichier.

Commençons:

Étape 1.

Créer un fichier CrunchifyFindDuplicateCSV .java

Étape 2.

  • Mettez le code ci-dessous dans le fichier.
  • Nous utilisons BufferedReader pour lire les fichiers.
  • Une par une, ajoutez des lignes à HashSet.
    • La classe HashSet implémente l'interface Set, soutenue par une table de hachage (en fait une instance HashMap). Il ne donne aucune garantie quant à l'ordre d'itération de l'ensemble ; en particulier, il ne garantit pas que la commande restera constante dans le temps. Cette classe autorise l'élément null.
  • Utilisez la méthode add() pour vérifier si la ligne est déjà présente dans Set ou non.
    • Ajoute l'élément spécifié à cet ensemble s'il n'est pas déjà présent. Plus formellement, ajoute l'élément spécifié e à cet ensemble si cet ensemble ne contient aucun élément e2 tel que Objects.equals(e, e2). Si cet ensemble contient déjà l'élément, l'appel laisse l'ensemble inchangé et returns false .
  • Une fois sautée, nous imprimerons cette ligne comme une ligne sautée.

fichier crunchify.csv

CrunchifyFindDuplicateCSV.java

Exécutons le programme Java dans IntelliJ IDE.

Voici un résultat :

J'espère que vous trouverez ce programme Java utile pour trouver des lignes en double dans CSV ou tout autre fichier.

Comment trouver des lignes en double dans CSV à l'aide de la commande Linux ?

Résultat:

Comment supprimer les éléments en double d'un fichier CSV sous Linux