สหสัมพันธ์กับการถดถอย: ความแตกต่างระหว่างสหสัมพันธ์และการถดถอย

เผยแพร่แล้ว: 2020-12-17

ความต้องการขั้นพื้นฐานสำหรับความแตกต่างระหว่างคำศัพท์ทั้งสองนั้นเชื่อมโยงกับวิธีการวิเคราะห์ทางสถิติที่นำเสนอเพื่อค้นหาการเชื่อมต่อระหว่างสองตัวแปร การวัดความเชื่อมโยงแต่ละอย่างและผลกระทบของการคาดการณ์เหล่านั้นใช้เพื่อระบุรูปแบบการวิเคราะห์เหล่านั้นในชีวิตประจำวันของเรา

มันค่อนข้างง่ายที่จะสับสนระหว่างคำสองคำนี้ นี่คือความแตกต่างที่จะถูกเน้นด้วยหมายเหตุสำคัญ ความแตกต่างหลักใน สหสัมพันธ์กับการถดถอย คือการวัดระดับความสัมพันธ์ระหว่างสองตัวแปร ให้มันเป็น x และ y ในที่นี้ สหสัมพันธ์มีไว้สำหรับการวัดดีกรี ในขณะที่การถดถอยเป็นพารามิเตอร์ที่กำหนดว่าตัวแปรหนึ่งส่งผลต่ออีกตัวแปรหนึ่งอย่างไร

หลักสูตร AI ออนไลน์ที่ดีที่สุด จากมหาวิทยาลัยชั้นนำของโลก – ปริญญาโท โปรแกรม Executive Post Graduate และหลักสูตรประกาศนียบัตรขั้นสูงใน ML & AI เพื่อติดตามอาชีพของคุณอย่างรวดเร็ว

ต้องอ่าน: การถดถอยเชิงเส้นพหุคูณใน R

สารบัญ

ค่าสัมประสิทธิ์สหสัมพันธ์

ค่าสัมประสิทธิ์สหสัมพันธ์ใช้วัด ระดับความสัมพันธ์ ในตัวแปร และมักเรียกว่าสัมประสิทธิ์สหสัมพันธ์ของเพียร์สัน ซึ่งมาจากแหล่งกำเนิด วิธีนี้ใช้สำหรับปัญหาการเชื่อมโยงเชิงเส้น คิดว่ามันเป็นการรวมกันของความหมายของคำ ความเชื่อมโยงระหว่างสองตัวแปร คือ ความสัมพันธ์

เมื่อตัวแปรมีแนวโน้มที่จะเปลี่ยนจากที่หนึ่งไปยังอีกที่หนึ่ง ไม่ว่าทางตรงหรือทางอ้อม จะถือว่ามีความสัมพันธ์กัน มีป้ายกำกับว่าไม่มีผลกระทบของตัวแปรหนึ่งกับอีกตัวแปรหนึ่ง เพื่อสร้างการแสดงคุณภาพที่ดีขึ้น ให้เราสมมติตัวแปรดังกล่าวและตั้งชื่อตัวแปรเหล่านี้ว่า x และ y

ค่าสัมประสิทธิ์สหสัมพันธ์ถูกวัดในระดับที่มีค่าตั้งแต่ +1 ถึง 0 และ -1 เมื่อตัวแปรทั้งสองเพิ่มขึ้น สหสัมพันธ์จะเป็นบวก และหากตัวแปรหนึ่งเพิ่มขึ้น และอีกตัวแปรหนึ่งลดลง สหสัมพันธ์จะเป็นค่าลบ

ในการวัดการเปลี่ยนแปลงในแต่ละหน่วยทั้งสองนี้ ถือว่าเป็นค่าบวกและค่าลบ

การเปลี่ยนแปลงเชิงบวกแสดงว่าตัวแปร x และ y มีการเคลื่อนที่ไปในทิศทางเดียวกัน

การเปลี่ยนแปลงเชิงลบแสดงว่าตัวแปร x และ y กำลังเคลื่อนที่ไปในทิศทางตรงกันข้าม

หากตัวแปรมีผลในเชิงบวกหรือเชิงลบ จะสร้างโอกาสในการทำความเข้าใจธรรมชาติของแนวโน้มในอนาคตและคาดการณ์ความต้องการที่ดีที่สุด สมมติฐานนี้จะขึ้นอยู่กับธรรมชาติของตัวแปรทั้งหมด และจะกำหนดลักษณะของเหตุการณ์ทางกายภาพหรือดิจิทัล

แหล่งประโยชน์หลักของความสัมพันธ์คืออัตราการสรุปที่กระชับและชัดเจนซึ่งกำหนดลักษณะของตัวแปรทั้งสองนั้นค่อนข้างสูงเมื่อเทียบกับวิธีการถดถอย

การถดถอย

การถดถอยสามารถกำหนดเป็นพารามิเตอร์เพื่ออธิบายความสัมพันธ์ระหว่างตัวแปรสองตัวที่แยกจากกัน เป็นคุณลักษณะที่ต้องพึ่งพาอาศัยกันมากขึ้น โดยที่การกระทำของตัวแปรหนึ่งส่งผลต่อผลลัพธ์ของตัวแปรอื่น เพื่อให้เข้าใจได้ง่ายที่สุด การถดถอยช่วยระบุว่าตัวแปรส่งผลกระทบซึ่งกันและกันอย่างไร

การวิเคราะห์ตามการถดถอยช่วยในการหาสถานะความสัมพันธ์ระหว่างสองตัวแปร สมมติว่า x และ y ที่ช่วยสร้างประมาณการเหตุการณ์และโครงสร้างเพื่อให้การคาดการณ์ในอนาคตมีความเกี่ยวข้องมากขึ้น

จุดประสงค์ของการวิเคราะห์ตามการถดถอยคือการประมาณค่าของตัวแปรสุ่มที่อิงจากตัวแปรทั้งสองทั้งหมด กล่าวคือ x และ y การวิเคราะห์การถดถอยเชิงเส้นมีความสอดคล้องและเหมาะสมที่สุด และเหมาะกับจุดข้อมูลเกือบทั้งหมด ข้อได้เปรียบหลักที่อิงจากการถดถอยคือการวิเคราะห์โดยละเอียดที่สร้างขึ้น ซึ่งซับซ้อน กว่าสหสัมพันธ์ ซึ่งจะสร้างสมการที่สามารถใช้ในการปรับโครงสร้างข้อมูลให้เหมาะสมสำหรับสถานการณ์ในอนาคต

อ่าน: แบบจำลองการถดถอย 6 ประเภทใน ML

สหสัมพันธ์กับการถดถอย

ด้านล่างนี้คือตัวอย่างสำคัญบางส่วนที่จะช่วยสร้างมุมมองที่ดีขึ้นในการสร้างความแตกต่างและความเข้าใจระหว่างทั้งสอง

  • การถดถอยจะให้ความสัมพันธ์เพื่อทำความเข้าใจผลกระทบที่ x มีต่อ y ต่อการเปลี่ยนแปลงและในทางกลับกัน ด้วยความสัมพันธ์ที่เหมาะสม x และ y สามารถแลกเปลี่ยนและรับผลลัพธ์เดียวกันได้
  • ความสัมพันธ์ขึ้นอยู่กับรูปแบบทางสถิติเดียวหรือจุดข้อมูล ในขณะที่การถดถอยเป็นแง่มุมที่แตกต่างไปจากเดิมอย่างสิ้นเชิงเมื่อใช้สมการและแสดงด้วยเส้น
  • ความสัมพันธ์ช่วยสร้างและกำหนดความสัมพันธ์ระหว่างสองตัวแปร และในทางกลับกัน การถดถอยช่วยค้นหาว่าตัวแปรหนึ่งส่งผลต่ออีกตัวแปรอย่างไร
  • ข้อมูลที่แสดงในการถดถอยจะกำหนดรูปแบบสาเหตุและผลกระทบเมื่อการเปลี่ยนแปลงเกิดขึ้นในตัวแปร เมื่อการเปลี่ยนแปลงเป็นไปในทิศทางเดียวกันหรือตรงกันข้ามสำหรับตัวแปรทั้งสอง สำหรับความสัมพันธ์ในที่นี้ ตัวแปรจะมีการเคลื่อนที่แบบเอกพจน์ในทิศทางใดก็ได้
  • ในความสัมพันธ์ x และ y สามารถแลกเปลี่ยนกันได้ ในการถดถอย จะใช้ไม่ได้
  • การคาดการณ์และการปรับให้เหมาะสมจะใช้ได้เฉพาะกับวิธีการถดถอยและจะไม่สามารถใช้งานได้ในการวิเคราะห์สหสัมพันธ์
  • เหตุและผลจะต้องพยายามสร้างโดยการถดถอย

เมื่อใดควรใช้

  • ความสัมพันธ์ – เมื่อมีความต้องการทันทีสำหรับทิศทางที่จะเข้าใจ ความสัมพันธ์ระหว่างตัวแปรสองตัวหรือมากกว่าจะเกี่ยวข้อง
  • การถดถอย – เมื่อมีข้อกำหนดในการปรับให้เหมาะสมและอธิบายการตอบสนองเชิงตัวเลขจาก y ถึง x เพื่อทำความเข้าใจและสร้างการประมาณว่า y มีอิทธิพลอย่างไร x

สรุป

เมื่อมองหาวิธีแก้ปัญหาเพื่อสร้างแบบจำลอง สมการ หรือการคาดการณ์การตอบสนอง การถดถอยเป็นวิธีที่ดีที่สุด หากมองหาการตอบสนองอย่างรวดเร็วเกี่ยวกับบทสรุปเพื่อระบุจุดแข็งของความสัมพันธ์ ความสัมพันธ์จะเป็นทางเลือกที่ดีที่สุด

หากคุณสนใจที่จะเรียนรู้เพิ่มเติมเกี่ยวกับแมชชีนเลิร์นนิง โปรดดูที่ IIIT-B & upGrad's Executive PG Program in Machine Learning & AI ซึ่งออกแบบมาสำหรับมืออาชีพที่ทำงานและมีการฝึกอบรมที่เข้มงวดมากกว่า 450 ชั่วโมง กรณีศึกษาและการมอบหมายมากกว่า 30 รายการ IIIT -B สถานะศิษย์เก่า 5+ โครงการหลักที่ปฏิบัติได้จริง & ความช่วยเหลืองานกับ บริษัท ชั้นนำ

อะไรคือความแตกต่างระหว่างการวิเคราะห์การถดถอยและสหสัมพันธ์?

สหสัมพันธ์และการถดถอยเป็นการวิเคราะห์สองประเภทที่อิงจากการแจกแจงของตัวแปรหลายตัว มีประโยชน์ในการอธิบายประเภทและระดับของการเชื่อมต่อระหว่างตัวแปรเชิงปริมาณที่ต่อเนื่องกันสองตัว แม้ว่าแนวคิดทางคณิตศาสตร์ทั้งสองนี้จะศึกษาพร้อมกัน แต่ก็ชัดเจนจากคำอธิบายข้างต้นว่ามีความแตกต่างที่สำคัญระหว่างความสัมพันธ์และการถดถอย เมื่อนักวิจัยต้องการตรวจสอบว่าตัวแปรที่กำลังตรวจสอบมีความเกี่ยวข้องหรือไม่ และถ้าเป็นเช่นนั้น ความสัมพันธ์ของตัวแปรนั้นแข็งแกร่งเพียงใด จะใช้ความสัมพันธ์ ค่าสัมประสิทธิ์สหสัมพันธ์ของเพียร์สันมักถูกมองว่าเป็นการวัดความสัมพันธ์ที่แม่นยำที่สุด ในการวิเคราะห์การถดถอย ความสัมพันธ์เชิงฟังก์ชันระหว่างตัวแปรสองตัวถูกสร้างขึ้นเพื่อทำการประมาณการเหตุการณ์ในอนาคต

ฉันควรใช้การวิเคราะห์การถดถอยเมื่อใด

เมื่อคุณต้องการประมาณค่าที่ขึ้นต่อกันอย่างต่อเนื่องจากชุดของปัจจัยอิสระ คุณจะใช้การวิเคราะห์การถดถอย ควรใช้การถดถอยโลจิสติกหากตัวแปรตามเป็นขั้วคู่ (การถดถอยทั้งแบบลอจิสติกและเชิงเส้นจะทำให้เกิดผลที่คล้ายกัน ถ้าการแยกส่วนระหว่างสองระดับของตัวแปรตามนี้อยู่ใกล้ 50-50) ในการถดถอย ตัวแปรอิสระอาจเป็นแบบต่อเนื่องหรือแบบขั้วก็ได้ ในการวิเคราะห์การถดถอย สามารถใช้ตัวแปรอิสระที่มีระดับมากกว่าสองระดับได้ แต่จะต้องแปลงเป็นตัวแปรที่มีเพียงสองระดับก่อน

ความแตกต่างระหว่างความชันสหสัมพันธ์และความชันถดถอยคืออะไร?

ทิศทางและความแรงของความสัมพันธ์ระหว่างตัวแปรตัวเลขสองตัวคือ X และ Y วัดจากสหสัมพันธ์ ซึ่งอยู่ระหว่าง -1.0 ถึง 1.0 เสมอ Y = a + bX เป็นสมการถดถอยเชิงเส้นอย่างง่ายที่เชื่อมต่อ X กับ Y ทั้งสองวัดระดับและทิศทางของลิงก์ระหว่างตัวแปรตัวเลขสองตัว ความชันถดถอย (b) จะเป็นลบหากความสัมพันธ์ (r) เป็นลบ ความชันถดถอยจะเป็นบวกหากความสัมพันธ์เป็นบวก