如何从 CSV 或 Java 中的任何其他文件中删除重复元素?

已发表: 2021-05-28

如何从 CSV 或 Java 中的任何其他文件中删除重复元素

从文件中查找重复行并不是一个难题。 但有时在面试问题中,人们有时会对他们必须使用的方法感到非常困惑。

在本教程中,我们将介绍如何从 CSV 文件和任何其他文件中删除重复项的步骤。

让我们开始吧:

第1步。

创建文件CrunchifyFindDuplicateCSV .java

第2步。

  • 将以下代码放入文件中。
  • 我们正在使用 BufferedReader 来读取文件。
  • 一个一个地向 HashSet 添加行。
    • HashSet 类实现了 Set 接口,由一个哈希表(实际上是一个 HashMap 实例)支持。 它不保证集合的迭代顺序; 特别是,它不保证订单会随着时间的推移保持不变。 此类允许空元素。
  • 使用方法 add() 检查行中是否已经存在于 Set 中。
    • 如果指定的元素尚不存在,则将其添加到此集合中。 更正式地说,如果此集合不包含元素 e2,例如 Objects.equals(e, e2),则将指定元素 e 添加到此集合。 如果此集合已包含该元素,则调用将保持集合不变并returns false
  • 一旦跳过,我们将把该行打印为跳过的行。

crunchify.csv 文件

CrunchifyFindDuplicateCSV.java

让我们在 IntelliJ IDE 中运行 Java 程序。

这是一个结果:

希望您发现这个 Java 程序对在 CSV 或任何其他文件中查找重复行很有用。

如何使用 Linux 命令在 CSV 中查找重复行?

结果:

如何在 Linux 中从 CSV 文件中删除重复元素