CSV 또는 Java의 다른 파일에서 중복 요소를 제거하는 방법은 무엇입니까?

게시 됨: 2021-05-28

CSV 또는 Java의 다른 파일에서 중복 요소를 제거하는 방법

파일에서 중복 행을 찾는 것은 어려운 문제가 아닙니다. 하지만 인터뷰 질문에서 사람들은 때때로 그들이 사용해야 하는 방법에 대해 매우 혼란스러워합니다.

이 자습서에서는 CSV 파일 및 기타 파일에서 중복을 제거하는 방법에 대한 단계를 살펴봅니다.

시작하자:

1 단계.

파일 CrunchifyFindDuplicateCSV .java 만들기

2 단계.

  • 아래 코드를 파일에 넣습니다.
  • BufferedReader를 사용하여 파일을 읽습니다.
  • 하나씩 HashSet에 행을 추가합니다.
    • HashSet 클래스는 해시 테이블(실제로는 HashMap 인스턴스)이 지원하는 Set 인터페이스를 구현합니다. 집합의 반복 순서를 보장하지 않습니다. 특히 주문이 시간이 지나도 일정하게 유지된다는 보장은 없습니다. 이 클래스는 null 요소를 허용합니다.
  • add() 메소드를 사용하여 행이 Set에 이미 존재하는지 여부를 확인하십시오.
    • 지정된 요소가 아직 없는 경우 이 세트에 추가합니다. 보다 형식적으로, 이 세트에 Objects.equals(e, e2)와 같은 요소 e2가 포함되어 있지 않으면 지정된 요소 e를 이 세트에 추가합니다. 이 집합에 이미 요소가 포함된 경우 호출은 집합을 변경하지 않고 그대로 두고 returns false .
  • 일단 건너뛰면 해당 줄을 건너뛴 줄로 인쇄합니다.

crunchify.csv 파일

CrunchifyFindDuplicateCSV.java

IntelliJ IDE에서 Java 프로그램을 실행해 봅시다.

결과는 다음과 같습니다.

이 Java 프로그램이 CSV 또는 다른 파일에서 중복 행을 찾는 데 유용하기를 바랍니다.

Linux 명령을 사용하여 CSV에서 중복 행을 찾는 방법은 무엇입니까?

결과:

Linux의 CSV 파일에서 중복 요소를 제거하는 방법