สำรวจ Pandas GUI [รายการคุณสมบัติที่ดีที่สุดที่คุณควรระวัง]

เผยแพร่แล้ว: 2020-12-31

Pandas เป็นห้องสมุดยอดนิยมสำหรับผู้ที่ชื่นชอบ Data Science รองรับทุกความต้องการในการประมวลผลข้อมูลผ่านรูปแบบตารางที่มีโครงสร้าง รูปแบบวันที่-เวลา และการจัดหา matplotlib API เพื่อดำเนินการวางแผนภายในการดำเนินการเชื่อมโยงแพนด้าในทันที คุณสามารถโหลดข้อมูลจากเว็บไซต์ลงในเฟรมข้อมูลได้โดยตรง ไลบรารีนี้ยังมีประโยชน์อย่างมากในขณะที่ทำการวิเคราะห์ข้อมูลเชิงสำรวจที่เปิดเผยข้อมูลเชิงลึกเกี่ยวกับชุดข้อมูลและการแจกแจงต่างๆ ที่สอดคล้อง

เนื่องจากเครื่องมือต่างๆ ถูกสร้างขึ้นเพื่อปรับปรุงการสำรวจข้อมูลมากขึ้นเรื่อยๆ Pandas GUI จึงเป็นหนึ่งในเครื่องมือที่ใช้แพนด้าเป็นองค์ประกอบหลัก และแสดง GUI แบบมีหน้าต่างพร้อมฟังก์ชันเพิ่มเติมมากมายที่มักจะดำเนินการด้วยตนเอง

อ่าน: 10 โครงการและหัวข้อ Python GUI ที่น่าตื่นเต้นสำหรับผู้เริ่มต้น

มาสำรวจยูทิลิตี้นี้และดูคุณสมบัติที่ดีที่สุดกัน

สารบัญ

คุณสมบัติที่ดีที่สุดของ Python GUI

1. การตั้งค่าพื้นฐาน

มันเป็นแพ็คเกจหลามและดังนั้นจึงสามารถติดตั้งได้อย่างง่ายดายผ่าน PyPI โดยใช้ pip ซึ่งเป็นตัวจัดการแพ็คเกจ Python คำสั่งการติดตั้งสำหรับสิ่งนี้จะเป็น:

pip ติดตั้ง pandasgui

การพึ่งพาทั้งหมดเช่น Pyqt, Plotly จะถูกติดตั้งผ่านคำสั่งนี้ หลังจากการติดตั้งเสร็จสิ้น คุณจะต้องนำเข้าสองโมดูลที่มีแพนด้าและหนึ่งฟังก์ชันจาก pandasgui

นำเข้าแพนด้าเป็น pd

จาก pandasgui นำเข้าโชว์

ฟังก์ชันการแสดงเป็นจุดเริ่มต้นหลักของการแสดงผล GUI ใช้ในชุดข้อมูลที่คุณต้องการทำการวิเคราะห์เป็นวัตถุกรอบข้อมูลของแพนด้า แพ็คเกจนี้มาพร้อมกับชุดข้อมูลที่โหลดไว้ล่วงหน้าเพื่อทดสอบการทำงานของมัน ชุดข้อมูลบางส่วนที่รวมอยู่ในนี้ ได้แก่ iris, titanic, pokemon, car crashes, mpg, ข้อมูลหุ้น, เคล็ด ลับ , mi_manufacturing, gapminder เพื่อจุดประสงค์ในการอธิบาย เราจะเลือกชุดข้อมูลเคล็ดลับ ในการโหลดชุดข้อมูลนี้

จาก pandasgui.datasets เคล็ดลับการนำเข้า

ตอนนี้ขั้นตอนสุดท้ายของโค้ดคือการเรียกใช้ฟังก์ชันการแสดงและใช้ยูทิลิตี GUI:

GUI = แสดง (เคล็ดลับ)

ทันทีที่คุณเรียกใช้สิ่งนี้ แอปพลิเคชันจะแจ้งพร้อมข้อมูลที่กรอกในรูปแบบตารางและแท็บค่าใช้จ่ายบางส่วน ดูภาพด้านล่าง (ภาพทั้งหมดที่นำเสนอในบทความนี้จัดทำโดยผู้เขียน):

2. ฟังก์ชั่นบนหน้าจอต่างๆ

ก่อนสำรวจแท็บต่างๆ ของโปรแกรม เรามาพูดถึงฟังก์ชันหลักบางอย่างบนหน้าจอกันก่อน:

  • หากคุณคลิกที่ส่วนหัวของคอลัมน์ใดๆ (total_bill, วันที่…) ของชุดข้อมูล ข้อมูลจะถูกจัดเรียงตามลำดับจากน้อยไปหามากของคอลัมน์นั้น การคลิกอีกครั้งจะเรียงลำดับจากมากไปหาน้อย และการคลิกถัดไปจะเป็นการรีเซ็ตการจัดเรียง ด้วยวิธีนี้ คุณสามารถจัดเรียงข้อมูลของคุณได้อย่างง่ายดาย ที่นี่เราได้จัดเรียงข้อมูลโดยเรียงลำดับจากมากไปน้อย:

  • คุณสามารถเพิ่ม CSV หลายรายการใน GUI นี้ได้โดยการลากและวาง ไฟล์ทั้งหมดจะแสดงอยู่บนแผงด้านซ้ายทำให้ง่ายต่อการสลับไปมาระหว่างไฟล์เหล่านั้น
  • หากคุณคลิกที่เซลล์ใดๆ ในข้อมูล คุณจะมีตัวเลือกในการแก้ไขค่าโดยตรง นี่คือสิ่งที่คล้ายกับข้อเสนอของ excel และทำให้ pandas GUI มีประโยชน์
  • คุณสามารถเลือกส่วนใดก็ได้ของข้อมูลโดยเลือกเซลล์ที่ต้องการทั้งหมดโดยกดคลิกซ้ายค้างไว้แล้ววางเมาส์เหนือ เซลล์ที่เลือกจะถูกเน้นด้วยสีน้ำเงิน และส่วนที่เลือกนี้สามารถคัดลอกได้ตามที่เป็นอยู่ คุณสามารถวางส่วนนี้ลงในแผ่นงาน Excel หรือแผ่นจดบันทึก!

3. ตัวกรอง

แท็บแรกหลัง data frame คือ filer ที่อนุญาตให้กรองข้อมูลตามเงื่อนไขที่กำหนดไว้ที่นี่ มันใช้ฟังก์ชัน data frame Query() ของ data frame ของแพนด้า ทำให้สามารถกรองส่วนของชุดข้อมูลที่ผู้ใช้ต้องการได้ ในการเข้าถึง เพียงคลิกที่แท็บตัวกรอง จากนั้นสร้างตัวกรองที่สอดคล้องกับชุดข้อมูลของคุณ ตัวอย่างเช่น เราสามารถสมัคร:

เพศ == 'ผู้หญิง' , วัน == 'ศุกร์' และเวลา == 'อาหารกลางวัน'

ชุดข้อมูลผลลัพธ์มีลักษณะดังนี้:

4. สถิติ

ก่อนดำเนินการวิเคราะห์ขั้นสูง ควรพิจารณาประเภทข้อมูลของคุณสมบัติ จำนวน ค่าต่ำสุด-สูงสุด ฯลฯ เพื่อเป็นแนวทางปฏิบัติที่ดี ฟังก์ชัน pandas description() ให้ข้อมูลสรุปนี้ ในการนำเสนอ GUI นี้ แท็บสถิติจะทำงานแบบเดียวกัน จะแสดงชนิดข้อมูล การนับ การนับค่าที่ไม่ซ้ำกัน ค่าเฉลี่ย ส่วนเบี่ยงเบนมาตรฐาน และค่าต่ำสุด-สูงสุด

5. กราฟฟิค

ตามชื่อที่แนะนำ แท็บนี้ให้การเข้าถึงการพล็อตกราฟประเภทต่างๆ ที่มาภายใต้การแสดงข้อมูลเป็นภาพ จำเป็นต้องวางแผนข้อมูลของเราเพื่อให้เราสามารถเปิดเผยข้อเท็จจริงที่สามารถพิสูจน์ว่ามีผลในการวิเคราะห์ที่จะเกิดขึ้นและจะเป็นประโยชน์ในการตัดสินใจว่าคุณลักษณะใดที่เราต้องการเลือกสำหรับการฝึกแบบจำลองของเรา Pandas GUI รองรับฮิสโตแกรม, กระจาย, เส้น, แท่ง, กล่อง, ไวโอลิน, แผนที่ความร้อน, พายและแม้แต่คลาวด์คำ

การกำหนดค่าพล็อตใน GUI นี้เป็นคอลัมน์แบบลากและวางที่ตรงไปตรงมา สมมติว่าคุณต้องการพล็อตพล็อตแบบกระจายสำหรับยอดรวมและทิปที่ให้เกี่ยวกับเวลา เพียงคลิกที่ Grapher เลือก scatter plot แล้วลากยอดรวมไปที่ x ทางด้านขวาของส่วนชื่อคอลัมน์ จากนั้นคลิก เสร็จสิ้น เพื่อแสดงพล็อต

แปลงทั้งหมดที่สร้างโดยแท็บนี้เป็นแบบโต้ตอบเนื่องจากสร้างขึ้นโดยใช้ไลบรารี Plotly

ต้องอ่าน: GitHub กับ GitLab: ความแตกต่างระหว่าง GitHub และ GitLab

6. ผู้ก่อร่างใหม่

แท็บนี้มีฟังก์ชันการทำงานสองแบบ: ตารางเดือยและละลาย ตารางสาระสำคัญเป็นคุณลักษณะที่สำคัญและมีประสิทธิภาพของสถิติที่ช่วยให้ผู้ใช้แปลงคอลัมน์ที่มีค่าหลายค่าลงในคอลัมน์ของตนเองได้ ฟังก์ชันการหลอมละลายเป็นการพลิกกลับของการหมุน อนุญาตให้แปลงคอลัมน์เป็นแถวเดียว ฟังก์ชันทั้งสองนี้มีประโยชน์เมื่อคุณต้องการสรุปข้อมูล

แพนด้ามีฟังก์ชันแยกกันสำหรับทั้งคู่ และ GUI เสนอการลากและวางคอลัมน์เพื่อส่งผ่านเป็นดัชนี คอลัมน์ ค่าในกรณีของ pivot และ id_vars และ value_vars ในกรณีที่ละลาย

บทสรุป

Pandas GUI เป็นโปรเจ็กต์ที่ยอดเยี่ยมที่ช่วยให้ผู้ใช้สามารถประมวลผลชุดข้อมูลแบบมองเห็นได้โดยไม่ต้องใช้รหัสหลัก ชุดข้อมูลที่แก้ไขสามารถส่งออกได้จากตัวเลือกการแก้ไขเมนูด้านบน โปรเจ็กต์ยังขาดคุณสมบัติอีกมากมาย เช่น การค้นหานิพจน์ทั่วไป การเติมค่า Null ที่อาจรวมเข้ากับเวอร์ชันในอนาคตของโปรเจ็กต์นี้ แต่การเป็นโอเพ่นซอร์สก็ยังคงเป็นเครื่องมือที่ยอดเยี่ยมมาก หากคุณกำลังมองหาเครื่องมือที่พร้อมใช้งานในอุตสาหกรรม คุณสามารถลองใช้ Google DataFlow

เรียนรู้ หลักสูตรวิทยาศาสตร์ข้อมูล จากมหาวิทยาลัยชั้นนำของโลก รับโปรแกรม PG สำหรับผู้บริหาร โปรแกรมประกาศนียบัตรขั้นสูง หรือโปรแกรมปริญญาโท เพื่อติดตามอาชีพของคุณอย่างรวดเร็ว

GUI ของ Pandas คืออะไร

Pandas GUI เป็นอินเทอร์เฟซที่น่าทึ่งที่ให้คุณสำรวจกรอบข้อมูลและวิเคราะห์โดยใช้คุณสมบัติต่างๆ ตามไลบรารี Pandas คุณสามารถใช้ฟังก์ชันทั้งหมดโดยไม่ต้องเข้ารหัสโดยใช้เครื่องมือที่ใช้ GUI อย่างง่ายนี้

นักวิทยาศาสตร์ข้อมูลพบว่าเครื่องมือนี้มีประโยชน์มากสำหรับการวิเคราะห์ จัดการ กรองข้อมูล และสร้างพล็อตโดยใช้เครื่องมือนี้ ทั้งหมดนี้สามารถทำได้โดยไม่ต้องใช้โค้ดบรรทัดเดียวโดยใช้หน้าต่าง GUI ของเดสก์ท็อปที่มาพร้อมกับคุณสมบัติมากมายเพื่อให้งานของคุณสำเร็จอย่างมีประสิทธิภาพ

ห้องสมุด Pandas มีฟีเจอร์หลักอะไรบ้าง?

หนึ่งในคุณสมบัติที่ดีที่สุดที่มีให้โดยไลบรารี Pandas คือเฟรมข้อมูลและซีรีย์ที่ให้คุณจัดการข้อมูลได้อย่างง่ายดายและมีประสิทธิภาพ นอกจากนี้ยังมาพร้อมกับวิธีการจัดระเบียบข้อมูลอัจฉริยะเพื่อจัดทำดัชนีข้อมูลของคุณอย่างมีประสิทธิภาพ

นอกเหนือจากคุณสมบัติการจัดการข้อมูลแล้ว ยังมีเครื่องมือแบบบูรณาการเพื่อจัดการกับค่าที่หายไป เพื่อหลีกเลี่ยงผลลัพธ์ที่ผิดพลาด มันยังมาพร้อมกับวิธีการล้างข้อมูลเพื่อให้คุณสามารถเตรียมข้อมูลให้พร้อมสำหรับการวิเคราะห์

วิธีการตั้งค่าห้องสมุด Pandas ในระบบของคุณ?

เนื่องจาก Pandas เป็นแพ็คเกจ Python คุณจึงสามารถติดตั้งได้อย่างง่ายดายโดยใช้ PyPI ผ่านการใช้ pip ซึ่งเป็นตัวจัดการแพ็คเกจ Python ในเอดิเตอร์ของคุณ คุณได้รันคำสั่งต่อไปนี้: “pandasgui” การพึ่งพาทั้งหมดเช่น Pyqt, Plotly จะถูกติดตั้งผ่านคำสั่งนี้ หลังจากการติดตั้งเสร็จสิ้น คุณจะต้องนำเข้าสองโมดูลที่มีแพนด้าและหนึ่งฟังก์ชันจาก pandasgui โมดูลเหล่านี้สามารถติดตั้งได้โดยใช้คำสั่งเหล่านี้: "นำเข้าแพนด้าเป็น pd" และ "จากการแสดงการนำเข้า pandasgui"