如何從 CSV 或 Java 中的任何其他文件中刪除重複元素?

已發表: 2021-05-28

如何從 CSV 或 Java 中的任何其他文件中刪除重複元素

從文件中查找重複行並不是一個難題。 但有時在面試問題中,人們有時會對他們必須使用的方法感到非常困惑。

在本教程中,我們將介紹如何從 CSV 文件和任何其他文件中刪除重複項的步驟。

讓我們開始吧:

第1步。

創建文件CrunchifyFindDuplicateCSV .java

第2步。

  • 將以下代碼放入文件中。
  • 我們正在使用 BufferedReader 來讀取文件。
  • 一個一個地向 HashSet 添加行。
    • HashSet 類實現了 Set 接口,由一個哈希表(實際上是一個 HashMap 實例)支持。 它不保證集合的迭代順序; 特別是,它不保證訂單會隨著時間的推移保持不變。 此類允許空元素。
  • 使用方法 add() 檢查行中是否已經存在於 Set 中。
    • 如果指定的元素尚不存在,則將其添加到此集合中。 更正式地說,如果此集合不包含元素 e2,例如 Objects.equals(e, e2),則將指定元素 e 添加到此集合。 如果此集合已包含該元素,則調用將保持集合不變並returns false
  • 一旦跳過,我們將把該行打印為跳過的行。

crunchify.csv 文件

CrunchifyFindDuplicateCSV.java

讓我們在 IntelliJ IDE 中運行 Java 程序。

這是一個結果:

希望您發現這個 Java 程序對在 CSV 或任何其他文件中查找重複行很有用。

如何使用 Linux 命令在 CSV 中查找重複行?

結果:

如何在 Linux 中從 CSV 文件中刪除重複元素