重複する要素をCSVまたはJavaの他のファイルから削除する方法は?

公開: 2021-05-28

重複する要素をCSVまたはJavaの他のファイルから削除する方法

ファイルから重複行を見つけることは難しい問題ではありません。 しかし、面接の質問で、人々は時々彼らが使わなければならない方法について非常に混乱することがあります。

このチュートリアルでは、CSVファイルやその他のファイルから重複を削除する方法について説明します。

始めましょう:

ステップ1。

ファイルCrunchifyFindDuplicateCSV作成します

ステップ2。

  • 以下のコードをファイルに入れます。
  • BufferedReaderを使用してファイルを読み取ります。
  • HashSetに行を追加することによって1つずつ。
    • HashSetクラスは、ハッシュテーブル(実際にはHashMapインスタンス)に裏打ちされたSetインターフェイスを実装します。 セットの反復順序については保証されません。 特に、順序が時間の経過とともに一定に保たれることを保証するものではありません。 このクラスはnull要素を許可します。
  • メソッドadd()を使用して、行がSetにすでに存在するかどうかを確認します。
    • 指定された要素がまだ存在しない場合は、このセットに追加します。 より正式には、Objects.equals(e、e2)のような要素e2がこのセットに含まれていない場合、指定された要素eをこのセットに追加します。 このセットにすでに要素が含まれている場合、呼び出しはセットを変更せずに残し、 returns false
  • スキップすると、その行がスキップされた行として出力されます。

crunchify.csvファイル

CrunchifyFindDuplicateCSV.java

IntelliJIDEでJavaプログラムを実行してみましょう。

結果は次のとおりです。

このJavaプログラムが、CSVまたはその他のファイルの重複行を見つけるのに役立つことを願っています。

Linuxコマンドを使用してCSVで重複行を見つける方法は?

結果:

LinuxでCSVファイルから重複要素を削除する方法