Как удалить повторяющиеся элементы из CSV или любого другого файла на Java?

Опубликовано: 2021-05-28

Как удалить повторяющиеся элементы из CSV или любого другого файла в Java

Поиск повторяющихся строк в файле не является сложной задачей. Но иногда в вопросе интервью люди иногда очень путаются в методе, который они должны использовать.

В этом уроке мы рассмотрим шаги по удалению дубликатов из CSV-файла и любого другого файла.

Давайте начнем:

Шаг 1.

Создать файл CrunchifyFindDuplicateCSV .java

Шаг 2.

  • Поместите приведенный ниже код в файл.
  • Мы используем BufferedReader для чтения файлов.
  • По очереди добавляйте строки в HashSet.
    • Класс HashSet реализует интерфейс Set, поддерживаемый хеш-таблицей (фактически экземпляром HashMap). Он не дает никаких гарантий относительно порядка итерации набора; в частности, это не гарантирует, что порядок останется неизменным с течением времени. Этот класс разрешает нулевой элемент.
  • Используйте метод add(), чтобы проверить, присутствует ли строка в Set или нет.
    • Добавляет указанный элемент в этот набор, если он еще не присутствует. Более формально, добавляет указанный элемент e в этот набор, если этот набор не содержит элемента e2, такого что Objects.equals(e, e2). Если этот набор уже содержит элемент, вызов оставляет набор без изменений и returns false .
  • После пропуска мы напечатаем эту строку как пропущенную.

файл crunchify.csv

CrunchifyFindDuplicateCSV.java

Давайте запустим Java-программу в IntelliJ IDE.

Вот результат:

Надеюсь, вы найдете эту Java-программу полезной для поиска повторяющихся строк в CSV или любом другом файле.

Как найти повторяющиеся строки в CSV с помощью команды Linux?

Результат:

Как удалить повторяющиеся элементы из файла CSV в Linux