كيفية إزالة العناصر المكررة من CSV أو أي ملف آخر في Java؟

نشرت: 2021-05-28

كيفية إزالة العناصر المكررة من CSV أو أي ملف آخر في Java

العثور على أسطر مكررة من ملف ليس مشكلة صعبة. لكن في وقت ما في سؤال المقابلة ، يشعر الناس أحيانًا بالارتباك الشديد بشأن الطريقة التي يتعين عليهم استخدامها.

سننتقل في هذا البرنامج التعليمي إلى خطوات حول كيفية إزالة التكرارات من ملف CSV وأي ملف آخر.

هيا بنا نبدأ:

الخطوة 1.

قم بإنشاء ملف CrunchifyFindDuplicateCSV .java

الخطوة 2.

  • ضع الكود أدناه في الملف.
  • نحن نستخدم BufferedReader لقراءة الملفات.
  • واحدًا تلو الآخر بإضافة سطور إلى HashSet.
    • تطبق فئة HashSet واجهة Set ، مدعومة بجدول تجزئة (في الواقع مثيل HashMap). لا تقدم أي ضمانات فيما يتعلق بترتيب التكرار للمجموعة ؛ على وجه الخصوص ، لا يضمن أن يظل الطلب ثابتًا بمرور الوقت. تسمح هذه الفئة بالعنصر الفارغ.
  • استخدم طريقة add () للتحقق مما إذا كان الخط موجودًا بالفعل في المجموعة أم لا.
    • يضيف العنصر المحدد إلى هذه المجموعة إذا لم يكن موجودًا بالفعل. بشكل أكثر رسمية ، يضيف العنصر المحدد e إلى هذه المجموعة إذا كانت هذه المجموعة لا تحتوي على عنصر e2 مثل Objects.equals (e ، e2). إذا كانت هذه المجموعة تحتوي بالفعل على العنصر ، فستترك المكالمة المجموعة دون تغيير returns false .
  • بمجرد التخطي ، سنطبع هذا السطر كخط تم تخطيه.

crunchify.csv

CrunchifyFindDuplicateCSV.java

لنقم بتشغيل برنامج Java في IntelliJ IDE.

هذه نتيجة:

آمل أن تجد برنامج Java هذا مفيدًا في العثور على سطور مكررة في CSV أو أي ملف آخر.

كيف تجد الأسطر المكررة في CSV باستخدام أمر Linux؟

نتيجة:

كيفية إزالة العناصر المكررة من ملف CSV في Linux