จะลบองค์ประกอบที่ซ้ำกันออกจาก CSV หรือไฟล์อื่นใน Java ได้อย่างไร

เผยแพร่แล้ว: 2021-05-28

วิธีลบองค์ประกอบที่ซ้ำกันออกจาก CSV หรือไฟล์อื่นใน Java

การค้นหาบรรทัดที่ซ้ำกันจากไฟล์นั้นไม่ใช่ปัญหาที่ยาก แต่บางครั้งในคำถามสัมภาษณ์ บางครั้งผู้คนก็สับสนมากเกี่ยวกับวิธีการที่พวกเขาต้องใช้

ในบทช่วยสอนนี้ เราจะอธิบายขั้นตอนต่างๆ เกี่ยวกับวิธีลบรายการที่ซ้ำกันออกจากไฟล์ CSV และไฟล์อื่นๆ

มาเริ่มกันเลย:

ขั้นตอนที่ 1.

สร้างไฟล์ CrunchifyFindDuplicateCSV .java

ขั้นตอนที่ 2.

  • ใส่รหัสด้านล่างลงในไฟล์.
  • เรากำลังใช้ BufferedReader เพื่ออ่านไฟล์
  • ทีละรายการโดยเพิ่มบรรทัดไปที่ HashSet
    • คลาส HashSet ใช้อินเทอร์เฟซ Set ซึ่งได้รับการสนับสนุนจากตารางแฮช (จริงๆ แล้วคืออินสแตนซ์ HashMap) ไม่รับประกันลำดับการทำซ้ำของชุด โดยเฉพาะอย่างยิ่ง ไม่ได้รับประกันว่าคำสั่งซื้อจะคงที่ตลอดเวลา คลาสนี้อนุญาตองค์ประกอบ null
  • ใช้วิธี add() เพื่อตรวจสอบว่ามีบรรทัดอยู่ใน Set หรือไม่
    • เพิ่มองค์ประกอบที่ระบุในชุดนี้หากยังไม่มีอยู่ เป็นทางการมากขึ้น เพิ่มองค์ประกอบที่ระบุ e ให้กับชุดนี้หากชุดนี้ไม่มีองค์ประกอบ e2 ซึ่ง Objects.equals(e, e2) หากชุดนี้มีองค์ประกอบอยู่แล้ว การเรียกจะไม่เปลี่ยนแปลงชุดและ returns false
  • เมื่อข้ามแล้วเราจะพิมพ์บรรทัดนั้นเป็นบรรทัดที่ข้ามไป

ไฟล์ crunchify.csv

CrunchifyFindDuplicateCSV.java

มารันโปรแกรม Java ใน IntelliJ IDE กันเถอะ

นี่คือผลลัพธ์:

หวังว่าคุณจะพบว่าโปรแกรม Java นี้มีประโยชน์ในการค้นหาบรรทัดที่ซ้ำกันใน CSV หรือไฟล์อื่นๆ

จะค้นหาบรรทัดที่ซ้ำกันใน CSV โดยใช้คำสั่ง Linux ได้อย่างไร

ผลลัพธ์:

วิธีลบองค์ประกอบที่ซ้ำกันออกจากไฟล์ CSV ใน Linux