คำถาม Guesstimate ยอดนิยมและวิธีการให้ข้อมูลสำหรับวิทยาศาสตร์ข้อมูล [2022]
เผยแพร่แล้ว: 2021-01-06Guesstimate คืออะไร?
Guesstimate เป็นวิธีการทางทฤษฎีและการประเมิน ช่วยให้คุณทำงานได้อย่างมีประสิทธิภาพด้วยระดับความแม่นยำที่สูงขึ้น เป็นการศึกษา ข้อมูล เพื่อรวบรวมผลลัพธ์ นอกจากนี้ยังเป็นส่วนสำคัญของ Business Analyst หรือ Data Science และ Data Architects หรือ Data Techies
- ความหมาย: มันเกี่ยวกับการทำความเข้าใจปัญหาที่คุณต้องการแก้ไข และจุดประสงค์ของสิ่งนั้นคืออะไร เหตุใดคุณจึงต้องการแก้ปัญหา
- คำจำกัดความ: เกี่ยวกับวัตถุเฉพาะและอินพุตและเอาต์พุตของโฟลว์ของกระบวนการ ถ้าจะให้อธิบายเป็นคำ
- Guessing : มันเกี่ยวกับความคิดและข้อสรุป- คุณกำลังสร้างวัตถุเฉพาะในปัญหาของคุณ
- ประมาณการ: เป็นเรื่องเกี่ยวกับค่าประมาณของตัวเลขในปัญหาที่กำหนด
- เกิดความคิด : นำแนวคิดไปปฏิบัติด้วยการวิจัยและพัฒนา
เมื่อคำถามที่คาดเดาได้สามารถถามถึงขนาดของตลาดได้ ก็จะเรียกว่าคำถาม "การกำหนดขนาดตลาด"
ต่อไปนี้เป็นคำถามพื้นฐานเกี่ยวกับการคาดเดา:
- มีกี่คนที่ใส่สีน้ำเงินในนิวยอร์คในวันจันทร์ทั่วไป?
- คุณสามารถใส่ลูกเทนนิสลงในเครื่องบินได้กี่ลูก?
จะเข้าใกล้ Guesstimate ได้อย่างไร?
กระบวนการแก้ปัญหาการคาดเดาสามารถจัดการได้ค่อนข้างดี:
- ดูพารามิเตอร์ที่เป็นไปได้ที่อาจส่งผลต่อปริมาณสุดท้ายและประมาณการตัวเลข
- ถอยหลังหนึ่งก้าวแล้วคิด
- ชี้แจงความคิดของคุณ
- แสดงความคิดเห็นของคุณ
- วิธีคณิตศาสตร์อย่างง่าย -
วิธีนี้มักใช้เมื่อจำนวนที่จะคาดเดาเป็นอัตราส่วนของบางประเภท ภารกิจคือการได้ตัวเศษและส่วนจากนั้นเราก็ทำเสร็จแล้ว!
1. วิธีต่อหัว-
วิธีนี้ใช้เมื่อตัวเลขที่จะคาดเดาสามารถคิดได้ว่าเป็นรายการบริโภคในระดับบุคคล ครัวเรือน หรือประชากรภายในภูมิศาสตร์
2. แนวทางอุปทานและอุปสงค์-
แนวทางนี้ต้องการการคิดตัวเลขที่คาดเดาจากด้านอุปทานหรืออุปสงค์ (หรือทั้งสองอย่าง) ของรายการ
โดยทั่วไป คุณสามารถเสนอการคาดเดาได้ด้วยวิธีใดวิธีหนึ่งจากสองวิธีต่อไปนี้
- วิธีจากบนลงล่าง
- วิธีจากล่างขึ้นบน
จากบนลงล่าง คุณเริ่มต้นด้วยจักรวาลที่ใหญ่ที่สุดเท่าที่จะเป็นไปได้ ซึ่งการคาดเดาของคุณเป็นส่วนหนึ่ง
โดยมีฐานกว้างที่สุดอยู่ด้านบน สำหรับจักรวาลนี้ คุณจะต้องใช้ชุดเงื่อนไขหรือตัวกรองต่อไป (แต่คุณต้องการจะใส่มันอย่างไร) ที่จะลดจำนวนจากจักรวาลให้เป็นตัวเลขที่เหมาะสมสำหรับการคาดเดาของคุณ
กุญแจสำคัญในการประเมินจากบนลงล่างคือ:
- มันคือการระบุจักรวาลเริ่มต้นอย่างแม่นยำ
- ระบุเงื่อนไข/ตัวกรองและส่วนที่เกี่ยวข้องอย่างแม่นยำซึ่งนำไปใช้กับปัญหาการคาดเดาของคุณได้อย่างแม่นยำ
- เซ็กเมนต์: บ่อยครั้ง คุณจะต้องแบ่งจักรวาลออกเป็นบัคเก็ตและใช้ตัวกรองต่างๆ กับแต่ละเซ็กเมนต์
เคล็ดลับสำหรับคำถามคาดเดาสำหรับ Data Science:
- ฝึกการนำเสนอ: เราต้องฝึกการนำเสนอต่อผู้ชมของโซลูชันเฉพาะที่คุณทำเสร็จแล้ว
- การวิเคราะห์การปฏิบัติ: การ วิเคราะห์มีบทบาทสำคัญในการทำให้กระบวนการคิดเกี่ยวกับปัญหาที่กำหนด
- ฝึกฝนกับตัวเลข: การเล่นกับตัวเลขหรือการสร้างตรรกะที่กำหนดเองนั้นสำคัญเสมอ
ขณะแก้คำถามที่คาดเดาสำหรับ Data Science คุณต้องเข้าใจประเด็นเหล่านี้:
- คุณกำลังอธิบายสิ่งนี้กับคนที่ไม่อยู่ในหัวของคุณ วิธีแก้ปัญหาไม่เหมาะสำหรับคุณ
- ในขณะเดียวกัน อย่าลืมว่าอย่าเปลี่ยนแต่ละแง่มุมเป็นการคาดเดาแบบใหม่ทั้งหมด! เป็นเรื่องง่ายที่จะได้รับอิทธิพลจากสติปัญญาและความสามารถในการวิเคราะห์ของคุณ
- มุ่งเน้นไปที่คำถาม คุณเคยได้ยินเกี่ยวกับการวิเคราะห์อัมพาตหรือไม่?
อะไรคือจุดประสงค์ของคำถามคาดเดาสำหรับ Data Science?
- เพื่อทำความเข้าใจความสามารถของคุณที่จะเข้าใจสถานการณ์
- เพื่อทำความเข้าใจขอบเขตความสามารถของคุณในการเชื่อมต่อสิ่งต่าง ๆ เพื่อเข้าถึงคำตอบ
- เพื่อทราบจุดแข็งของคุณในการจัดลำดับความสำคัญและยกเลิกพารามิเตอร์ต่างๆ
- เพื่อให้เข้าใจว่าคุณทำงานกับข้อมูลไม่เพียงพอได้ดีเพียงใด
ต่อไปนี้เป็นคำถามที่คาดเดาได้สำหรับ Data Science-
คำถาม:1 สร้างการทดสอบด้วยอัลกอริทึม k-mean บนชุดข้อมูล UCI Iris:
ในการทดลองนี้ ทำคลัสเตอร์ k-mean โดยใช้คุณลักษณะทั้งหมดในชุดข้อมูล จากนั้นเปรียบเทียบผลลัพธ์การจัดกลุ่มกับป้ายกำกับคลาสจริงสำหรับตัวอย่างทั้งหมด
ใช้โมดูล Multiclass Logistic Regression เพื่อดำเนินการจำแนกประเภทหลายคลาส และเปรียบเทียบประสิทธิภาพกับการทำคลัสเตอร์ k-mean
คำถาม:2 ในรูปแบบง่ายๆ อธิบาย Precision & Recall?
คำถาม:3 หากคุณได้รับชุดข้อมูล คุณจะตัดสินใจเลือกอัลกอริทึม ML ใดสำหรับผู้ใช้อย่างไร
คำถาม:4 จะดีกว่าไหมถ้ามีผลบวกลวงมากเกินไป? หรือเชิงลบเท็จมากเกินไป?
คำถาม:5 ความถูกต้องของแบบจำลองและประสิทธิภาพของแบบจำลองคืออะไร? คุณสามารถใช้สถานการณ์ใดได้บ้าง

คำถาม:6 คุณแน่ใจได้อย่างไรว่าคุณไม่ได้ฟิตหุ่นกับนางแบบมากเกินไป อธิบายด้วยตัวอย่าง
คำถาม:7 เมื่อคุณเรียกใช้อัลกอริธึมทรีการจัดหมวดหมู่แบบไบนารีนั้นค่อนข้างง่าย ในอัลกอริธึมไบนารี ทรีตัดสินใจอย่างไรว่าตัวแปรใดที่จะแยกที่โหนดรูทและโหนดย่อยที่ประสบความสำเร็จ
คำถาม:8 NumPy และ SciPy อธิบายได้อย่างไร?
คำถาม:9 เขียนโปรแกรมการเรียนรู้ของเครื่องขั้นพื้นฐานเพื่อตรวจสอบความถูกต้องของชุดข้อมูลที่นำเข้าชุดข้อมูลโดยใช้ตัวแยกประเภทใด ๆ
คำถาม:10 สร้างอัลกอริธึมการถดถอยเพื่อทำนายราคารถยนต์ตามตัวแปรต่างๆ
คำถาม:11 พัฒนาโมเดลที่ใช้คุณลักษณะเครือข่ายต่างๆ เพื่อตรวจหากิจกรรมเครือข่ายที่เป็นส่วนหนึ่งของการบุกรุก/การโจมตีโดยใช้การจำแนกประเภทไบนารี
คำถาม:12 จะจัดกลุ่ม (การจัดกลุ่ม) อย่างไรเพื่อค้นหาองค์กรที่คล้ายคลึงกันตามคำอธิบาย Wikipedia
คำถาม:13 คุณจะทำนายได้อย่างไรว่าใครจะต่ออายุการสมัครรับข้อมูลในเดือนหน้า
- คุณต้องใช้ข้อมูลใดในการแก้ปัญหานี้
- คุณจะวิเคราะห์แบบไหน?
- ต้องใช้อัลกอริทึมของแบบจำลองการคาดการณ์แบบใด
คำถาม:14 คุณจะจับคู่ชื่อเล่น (อเลน บ็อบ อเล็กซ์ ทิม ฯลฯ) กับชื่อจริงอย่างไร
คำถาม:15 สร้างการคาดการณ์ว่าเที่ยวบินของผู้โดยสารตามกำหนดการล่าช้าหรือไม่โดยใช้ตัวแยกประเภทไบนารีที่มี R หรือสคริปต์หลาม
คำถาม:16 ทำนายราคารถยนต์โดยใช้การถดถอยเชิงเส้นพร้อมเตรียมและทำความสะอาดข้อมูลโดยลบคอลัมน์การสูญเสียที่เป็นมาตรฐาน
เนื่องจากมีค่าที่ขาดหายไปจำนวนมาก ให้สร้างการทดสอบและแบบจำลอง
คำถาม:17 คุณสามารถแบ่งคน 14 คนออกเป็น 4 ทีมจาก 5 คนได้กี่วิธี?
คำถาม :18 พื้นที่ใต้เส้นโค้งปกติมาตรฐานคือ?
- มากกว่า 1
- เท่ากับ 1
- น้อยกว่า 1
คำถาม:19 สร้างอัลกอริธึมการถดถอยเพื่อทำนายราคารถยนต์ตามตัวแปรต่างๆ
คำถาม:20 ผู้จัดการของคุณขอให้สร้างแบบจำลองป่าสุ่มที่มีต้นไม้ 10,000 ต้นระหว่างการฝึก และคุณได้รับข้อผิดพลาดในการฝึกเป็น 0.00 แต่ในการทดสอบ ข้อผิดพลาดในการตรวจสอบความถูกต้องคือ 34.23 อะไรพื้นฐานที่คุณจะถือว่าสิ่งที่ผิดพลาด? คุณจะตรวจสอบโมเดลของคุณอย่างไรหากโมเดลไม่ได้รับการฝึกฝนอย่างสมบูรณ์
คำถาม:21 'คนที่ซื้อสิ่งนี้ ก็ซื้อด้วย…' คำแนะนำที่เห็นใน Amazon นั้นอิงตามอัลกอริทึมใด
คำถาม:22 อัลกอริทึมใดที่ลิงก์ในคำแนะนำที่คุณเห็นว่าเป็น 'ข่าวและมุมมองของวันนี้'
อ่าน: คำถามสัมภาษณ์วิทยาศาสตร์ข้อมูล
บทสรุป
เราหวังว่าบทความนี้จะช่วยให้คุณเข้าใจคำถามเกี่ยวกับการคาดเดาสำหรับวิทยาศาสตร์ข้อมูลและวิธีเอาชนะคำถามเหล่านั้น คุณจะพบบทความที่เป็นประโยชน์เพิ่มเติมเช่นนี้ที่ upGrad; เรามีหลักสูตรที่หลากหลาย, MBA, วิทยาศาสตร์ข้อมูล, การเรียนรู้ของเครื่อง ฯลฯ เราให้คำปรึกษาจากบุคคลที่ดีที่สุดในอุตสาหกรรม!
หากคุณสนใจที่จะเรียนรู้ Data Science และเลือกประกอบอาชีพในสาขานี้ โปรดดูที่ IIIT-B & upGrad's Executive PG Program in Data Science ซึ่งสร้างขึ้นสำหรับมืออาชีพที่ทำงานและมีกรณีศึกษาและโครงการมากกว่า 10 รายการ เวิร์กช็อปภาคปฏิบัติ , การให้คำปรึกษากับผู้เชี่ยวชาญในอุตสาหกรรม, ตัวต่อตัวกับที่ปรึกษาในอุตสาหกรรม, การเรียนรู้มากกว่า 400 ชั่วโมงและความช่วยเหลือด้านงานกับบริษัทชั้นนำ
อะไรคือขั้นตอนในอุดมคติในการแก้ปัญหาการคาดเดา?
ก่อนตอบคำถามที่เป็นการคาดเดา คุณควรคำนึงถึงบางประเด็นเพื่อให้ได้แนวคิดที่ดีกว่า ประเด็นเหล่านี้มีดังนี้ - ก่อนเริ่มตอบ คุณควรเคลียร์ข้อสงสัยทั้งหมดเกี่ยวกับคำถาม คุณสามารถถามคำถามที่เกี่ยวข้องได้มากเท่าที่คุณต้องการกับผู้สัมภาษณ์ แต่พยายามหลีกเลี่ยงคำถามที่นำไปสู่การคำนวณเชิงตัวเลข สิ่งนี้อาจส่งผลเสียต่อผู้สัมภาษณ์ ขอแนะนำให้ติดคำถามใช่หรือไม่ใช่เพื่อหลีกเลี่ยงความประทับใจที่ไม่ดี อย่าพยายามแก้ปัญหาทั้งหมดในคราวเดียว ให้แยกปัญหาออกเป็นปัญหาย่อยที่เล็กกว่า แล้วพยายามแก้ปัญหาที่เล็กกว่าแต่ละปัญหา จำไว้ว่าอย่าแบ่งปัญหาของคุณออกเป็น 6 ขั้นตอน วิธีนี้จะช่วยให้คุณได้คำตอบแม้ผ่านการคำนวณที่ยาวนาน
Guesstimate คืออะไร?
Guesstimate คือทั้งหมดที่เกี่ยวกับการทำความเข้าใจปัญหาและค้นหาแนวทางที่ถูกต้องในการแก้ปัญหา เป็นวิธีการเชิงทฤษฎีและการประเมิน สิ่งที่สำคัญที่สุดในคำถามเหล่านี้คือคุณอธิบายวิธีแก้ปัญหาอย่างไร
แขกรับเชิญอาจรู้สึกเหมือนเป็นงานที่น่ากลัว โดยเฉพาะอย่างยิ่งเมื่อคุณดูคำถามที่ถามเป็นครั้งแรก ตั้งแต่ขนาดตลาดของกลุ่มบริษัทขนาดใหญ่ไปจนถึงรายได้และจำนวนประชากร การคำนวณปริมาณบางส่วนเหล่านี้แม้กระทั่งใกล้กับสนามเบสบอลนั้นแทบจะเป็นไปไม่ได้เลย
แนวทางต่าง ๆ ในการแก้ปัญหาการคาดเดามีอะไรบ้าง
วิธีคณิตศาสตร์อย่างง่าย - วิธีการนี้ส่วนใหญ่จะใช้ในกรณีที่จำนวนที่จะประมาณเป็นอัตราส่วนบางประเภท วิธีต่อหัว - วิธีนี้ใช้เมื่อตัวเลขที่จะคาดเดาสามารถคิดได้ว่าเป็นรายการบริโภคที่ระดับบุคคล ครัวเรือน หรือประชากรภายในภูมิศาสตร์ แนวทางอุปทานและอุปสงค์ - แนวทางนี้ต้องการให้คุณคิดถึงตัวเลขจากด้านอุปทานหรือด้านอุปสงค์