คำถาม Guesstimate ยอดนิยมและวิธีการให้ข้อมูลสำหรับวิทยาศาสตร์ข้อมูล [2022]

เผยแพร่แล้ว: 2021-01-06

Guesstimate คืออะไร?

Guesstimate เป็นวิธีการทางทฤษฎีและการประเมิน ช่วยให้คุณทำงานได้อย่างมีประสิทธิภาพด้วยระดับความแม่นยำที่สูงขึ้น เป็นการศึกษา ข้อมูล เพื่อรวบรวมผลลัพธ์ นอกจากนี้ยังเป็นส่วนสำคัญของ Business Analyst หรือ Data Science และ Data Architects หรือ Data Techies

  1. ความหมาย: มันเกี่ยวกับการทำความเข้าใจปัญหาที่คุณต้องการแก้ไข และจุดประสงค์ของสิ่งนั้นคืออะไร เหตุใดคุณจึงต้องการแก้ปัญหา
  2. คำจำกัดความ: เกี่ยวกับวัตถุเฉพาะและอินพุตและเอาต์พุตของโฟลว์ของกระบวนการ ถ้าจะให้อธิบายเป็นคำ
  3. Guessing : มันเกี่ยวกับความคิดและข้อสรุป- คุณกำลังสร้างวัตถุเฉพาะในปัญหาของคุณ
  4. ประมาณการ: เป็นเรื่องเกี่ยวกับค่าประมาณของตัวเลขในปัญหาที่กำหนด
  5. เกิดความคิด : นำแนวคิดไปปฏิบัติด้วยการวิจัยและพัฒนา

เมื่อคำถามที่คาดเดาได้สามารถถามถึงขนาดของตลาดได้ ก็จะเรียกว่าคำถาม "การกำหนดขนาดตลาด"

ต่อไปนี้เป็นคำถามพื้นฐานเกี่ยวกับการคาดเดา:

  • มีกี่คนที่ใส่สีน้ำเงินในนิวยอร์คในวันจันทร์ทั่วไป?
  • คุณสามารถใส่ลูกเทนนิสลงในเครื่องบินได้กี่ลูก?

จะเข้าใกล้ Guesstimate ได้อย่างไร?

กระบวนการแก้ปัญหาการคาดเดาสามารถจัดการได้ค่อนข้างดี:

  1. ดูพารามิเตอร์ที่เป็นไปได้ที่อาจส่งผลต่อปริมาณสุดท้ายและประมาณการตัวเลข
  2. ถอยหลังหนึ่งก้าวแล้วคิด
  3. ชี้แจงความคิดของคุณ
  4. แสดงความคิดเห็นของคุณ
  5. วิธีคณิตศาสตร์อย่างง่าย -

วิธีนี้มักใช้เมื่อจำนวนที่จะคาดเดาเป็นอัตราส่วนของบางประเภท ภารกิจคือการได้ตัวเศษและส่วนจากนั้นเราก็ทำเสร็จแล้ว!

1. วิธีต่อหัว-

วิธีนี้ใช้เมื่อตัวเลขที่จะคาดเดาสามารถคิดได้ว่าเป็นรายการบริโภคในระดับบุคคล ครัวเรือน หรือประชากรภายในภูมิศาสตร์

2. แนวทางอุปทานและอุปสงค์-

แนวทางนี้ต้องการการคิดตัวเลขที่คาดเดาจากด้านอุปทานหรืออุปสงค์ (หรือทั้งสองอย่าง) ของรายการ

โดยทั่วไป คุณสามารถเสนอการคาดเดาได้ด้วยวิธีใดวิธีหนึ่งจากสองวิธีต่อไปนี้

  • วิธีจากบนลงล่าง
  • วิธีจากล่างขึ้นบน

จากบนลงล่าง คุณเริ่มต้นด้วยจักรวาลที่ใหญ่ที่สุดเท่าที่จะเป็นไปได้ ซึ่งการคาดเดาของคุณเป็นส่วนหนึ่ง

โดยมีฐานกว้างที่สุดอยู่ด้านบน สำหรับจักรวาลนี้ คุณจะต้องใช้ชุดเงื่อนไขหรือตัวกรองต่อไป (แต่คุณต้องการจะใส่มันอย่างไร) ที่จะลดจำนวนจากจักรวาลให้เป็นตัวเลขที่เหมาะสมสำหรับการคาดเดาของคุณ

กุญแจสำคัญในการประเมินจากบนลงล่างคือ:

  1. มันคือการระบุจักรวาลเริ่มต้นอย่างแม่นยำ
  2. ระบุเงื่อนไข/ตัวกรองและส่วนที่เกี่ยวข้องอย่างแม่นยำซึ่งนำไปใช้กับปัญหาการคาดเดาของคุณได้อย่างแม่นยำ
  3. เซ็กเมนต์: บ่อยครั้ง คุณจะต้องแบ่งจักรวาลออกเป็นบัคเก็ตและใช้ตัวกรองต่างๆ กับแต่ละเซ็กเมนต์

เคล็ดลับสำหรับคำถามคาดเดาสำหรับ Data Science:

  1. ฝึกการนำเสนอ: เราต้องฝึกการนำเสนอต่อผู้ชมของโซลูชันเฉพาะที่คุณทำเสร็จแล้ว
  2. การวิเคราะห์การปฏิบัติ: การ วิเคราะห์มีบทบาทสำคัญในการทำให้กระบวนการคิดเกี่ยวกับปัญหาที่กำหนด
  3. ฝึกฝนกับตัวเลข: การเล่นกับตัวเลขหรือการสร้างตรรกะที่กำหนดเองนั้นสำคัญเสมอ

ขณะแก้คำถามที่คาดเดาสำหรับ Data Science คุณต้องเข้าใจประเด็นเหล่านี้:

  • คุณกำลังอธิบายสิ่งนี้กับคนที่ไม่อยู่ในหัวของคุณ วิธีแก้ปัญหาไม่เหมาะสำหรับคุณ
  • ในขณะเดียวกัน อย่าลืมว่าอย่าเปลี่ยนแต่ละแง่มุมเป็นการคาดเดาแบบใหม่ทั้งหมด! เป็นเรื่องง่ายที่จะได้รับอิทธิพลจากสติปัญญาและความสามารถในการวิเคราะห์ของคุณ
  • มุ่งเน้นไปที่คำถาม คุณเคยได้ยินเกี่ยวกับการวิเคราะห์อัมพาตหรือไม่?

อะไรคือจุดประสงค์ของคำถามคาดเดาสำหรับ Data Science?

  • เพื่อทำความเข้าใจความสามารถของคุณที่จะเข้าใจสถานการณ์
  • เพื่อทำความเข้าใจขอบเขตความสามารถของคุณในการเชื่อมต่อสิ่งต่าง ๆ เพื่อเข้าถึงคำตอบ
  • เพื่อทราบจุดแข็งของคุณในการจัดลำดับความสำคัญและยกเลิกพารามิเตอร์ต่างๆ
  • เพื่อให้เข้าใจว่าคุณทำงานกับข้อมูลไม่เพียงพอได้ดีเพียงใด

ต่อไปนี้เป็นคำถามที่คาดเดาได้สำหรับ Data Science-

คำถาม:1 สร้างการทดสอบด้วยอัลกอริทึม k-mean บนชุดข้อมูล UCI Iris:

ในการทดลองนี้ ทำคลัสเตอร์ k-mean โดยใช้คุณลักษณะทั้งหมดในชุดข้อมูล จากนั้นเปรียบเทียบผลลัพธ์การจัดกลุ่มกับป้ายกำกับคลาสจริงสำหรับตัวอย่างทั้งหมด

ใช้โมดูล Multiclass Logistic Regression เพื่อดำเนินการจำแนกประเภทหลายคลาส และเปรียบเทียบประสิทธิภาพกับการทำคลัสเตอร์ k-mean

คำถาม:2 ในรูปแบบง่ายๆ อธิบาย Precision & Recall?

คำถาม:3 หากคุณได้รับชุดข้อมูล คุณจะตัดสินใจเลือกอัลกอริทึม ML ใดสำหรับผู้ใช้อย่างไร

คำถาม:4 จะดีกว่าไหมถ้ามีผลบวกลวงมากเกินไป? หรือเชิงลบเท็จมากเกินไป?

คำถาม:5 ความถูกต้องของแบบจำลองและประสิทธิภาพของแบบจำลองคืออะไร? คุณสามารถใช้สถานการณ์ใดได้บ้าง

คำถาม:6 คุณแน่ใจได้อย่างไรว่าคุณไม่ได้ฟิตหุ่นกับนางแบบมากเกินไป อธิบายด้วยตัวอย่าง

คำถาม:7 เมื่อคุณเรียกใช้อัลกอริธึมทรีการจัดหมวดหมู่แบบไบนารีนั้นค่อนข้างง่าย ในอัลกอริธึมไบนารี ทรีตัดสินใจอย่างไรว่าตัวแปรใดที่จะแยกที่โหนดรูทและโหนดย่อยที่ประสบความสำเร็จ

คำถาม:8 NumPy และ SciPy อธิบายได้อย่างไร?

คำถาม:9 เขียนโปรแกรมการเรียนรู้ของเครื่องขั้นพื้นฐานเพื่อตรวจสอบความถูกต้องของชุดข้อมูลที่นำเข้าชุดข้อมูลโดยใช้ตัวแยกประเภทใด ๆ

คำถาม:10 สร้างอัลกอริธึมการถดถอยเพื่อทำนายราคารถยนต์ตามตัวแปรต่างๆ

คำถาม:11 พัฒนาโมเดลที่ใช้คุณลักษณะเครือข่ายต่างๆ เพื่อตรวจหากิจกรรมเครือข่ายที่เป็นส่วนหนึ่งของการบุกรุก/การโจมตีโดยใช้การจำแนกประเภทไบนารี

คำถาม:12 จะจัดกลุ่ม (การจัดกลุ่ม) อย่างไรเพื่อค้นหาองค์กรที่คล้ายคลึงกันตามคำอธิบาย Wikipedia

คำถาม:13 คุณจะทำนายได้อย่างไรว่าใครจะต่ออายุการสมัครรับข้อมูลในเดือนหน้า

  • คุณต้องใช้ข้อมูลใดในการแก้ปัญหานี้
  • คุณจะวิเคราะห์แบบไหน?
  • ต้องใช้อัลกอริทึมของแบบจำลองการคาดการณ์แบบใด

คำถาม:14 คุณจะจับคู่ชื่อเล่น (อเลน บ็อบ อเล็กซ์ ทิม ฯลฯ) กับชื่อจริงอย่างไร

คำถาม:15 สร้างการคาดการณ์ว่าเที่ยวบินของผู้โดยสารตามกำหนดการล่าช้าหรือไม่โดยใช้ตัวแยกประเภทไบนารีที่มี R หรือสคริปต์หลาม

คำถาม:16 ทำนายราคารถยนต์โดยใช้การถดถอยเชิงเส้นพร้อมเตรียมและทำความสะอาดข้อมูลโดยลบคอลัมน์การสูญเสียที่เป็นมาตรฐาน

เนื่องจากมีค่าที่ขาดหายไปจำนวนมาก ให้สร้างการทดสอบและแบบจำลอง

คำถาม:17 คุณสามารถแบ่งคน 14 คนออกเป็น 4 ทีมจาก 5 คนได้กี่วิธี?

คำถาม :18 พื้นที่ใต้เส้นโค้งปกติมาตรฐานคือ?

  • มากกว่า 1
  • เท่ากับ 1
  • น้อยกว่า 1

คำถาม:19 สร้างอัลกอริธึมการถดถอยเพื่อทำนายราคารถยนต์ตามตัวแปรต่างๆ

คำถาม:20 ผู้จัดการของคุณขอให้สร้างแบบจำลองป่าสุ่มที่มีต้นไม้ 10,000 ต้นระหว่างการฝึก และคุณได้รับข้อผิดพลาดในการฝึกเป็น 0.00 แต่ในการทดสอบ ข้อผิดพลาดในการตรวจสอบความถูกต้องคือ 34.23 อะไรพื้นฐานที่คุณจะถือว่าสิ่งที่ผิดพลาด? คุณจะตรวจสอบโมเดลของคุณอย่างไรหากโมเดลไม่ได้รับการฝึกฝนอย่างสมบูรณ์

คำถาม:21 'คนที่ซื้อสิ่งนี้ ก็ซื้อด้วย…' คำแนะนำที่เห็นใน Amazon นั้นอิงตามอัลกอริทึมใด

คำถาม:22 อัลกอริทึมใดที่ลิงก์ในคำแนะนำที่คุณเห็นว่าเป็น 'ข่าวและมุมมองของวันนี้'

อ่าน: คำถามสัมภาษณ์วิทยาศาสตร์ข้อมูล

บทสรุป

เราหวังว่าบทความนี้จะช่วยให้คุณเข้าใจคำถามเกี่ยวกับการคาดเดาสำหรับวิทยาศาสตร์ข้อมูลและวิธีเอาชนะคำถามเหล่านั้น คุณจะพบบทความที่เป็นประโยชน์เพิ่มเติมเช่นนี้ที่ upGrad; เรามีหลักสูตรที่หลากหลาย, MBA, วิทยาศาสตร์ข้อมูล, การเรียนรู้ของเครื่อง ฯลฯ เราให้คำปรึกษาจากบุคคลที่ดีที่สุดในอุตสาหกรรม!

หากคุณสนใจที่จะเรียนรู้ Data Science และเลือกประกอบอาชีพในสาขานี้ โปรดดูที่ IIIT-B & upGrad's Executive PG Program in Data Science ซึ่งสร้างขึ้นสำหรับมืออาชีพที่ทำงานและมีกรณีศึกษาและโครงการมากกว่า 10 รายการ เวิร์กช็อปภาคปฏิบัติ , การให้คำปรึกษากับผู้เชี่ยวชาญในอุตสาหกรรม, ตัวต่อตัวกับที่ปรึกษาในอุตสาหกรรม, การเรียนรู้มากกว่า 400 ชั่วโมงและความช่วยเหลือด้านงานกับบริษัทชั้นนำ

อะไรคือขั้นตอนในอุดมคติในการแก้ปัญหาการคาดเดา?

ก่อนตอบคำถามที่เป็นการคาดเดา คุณควรคำนึงถึงบางประเด็นเพื่อให้ได้แนวคิดที่ดีกว่า ประเด็นเหล่านี้มีดังนี้ - ก่อนเริ่มตอบ คุณควรเคลียร์ข้อสงสัยทั้งหมดเกี่ยวกับคำถาม คุณสามารถถามคำถามที่เกี่ยวข้องได้มากเท่าที่คุณต้องการกับผู้สัมภาษณ์ แต่พยายามหลีกเลี่ยงคำถามที่นำไปสู่การคำนวณเชิงตัวเลข สิ่งนี้อาจส่งผลเสียต่อผู้สัมภาษณ์ ขอแนะนำให้ติดคำถามใช่หรือไม่ใช่เพื่อหลีกเลี่ยงความประทับใจที่ไม่ดี อย่าพยายามแก้ปัญหาทั้งหมดในคราวเดียว ให้แยกปัญหาออกเป็นปัญหาย่อยที่เล็กกว่า แล้วพยายามแก้ปัญหาที่เล็กกว่าแต่ละปัญหา จำไว้ว่าอย่าแบ่งปัญหาของคุณออกเป็น 6 ขั้นตอน วิธีนี้จะช่วยให้คุณได้คำตอบแม้ผ่านการคำนวณที่ยาวนาน

Guesstimate คืออะไร?

Guesstimate คือทั้งหมดที่เกี่ยวกับการทำความเข้าใจปัญหาและค้นหาแนวทางที่ถูกต้องในการแก้ปัญหา เป็นวิธีการเชิงทฤษฎีและการประเมิน สิ่งที่สำคัญที่สุดในคำถามเหล่านี้คือคุณอธิบายวิธีแก้ปัญหาอย่างไร
แขกรับเชิญอาจรู้สึกเหมือนเป็นงานที่น่ากลัว โดยเฉพาะอย่างยิ่งเมื่อคุณดูคำถามที่ถามเป็นครั้งแรก ตั้งแต่ขนาดตลาดของกลุ่มบริษัทขนาดใหญ่ไปจนถึงรายได้และจำนวนประชากร การคำนวณปริมาณบางส่วนเหล่านี้แม้กระทั่งใกล้กับสนามเบสบอลนั้นแทบจะเป็นไปไม่ได้เลย

แนวทางต่าง ๆ ในการแก้ปัญหาการคาดเดามีอะไรบ้าง

วิธีคณิตศาสตร์อย่างง่าย - วิธีการนี้ส่วนใหญ่จะใช้ในกรณีที่จำนวนที่จะประมาณเป็นอัตราส่วนบางประเภท วิธีต่อหัว - วิธีนี้ใช้เมื่อตัวเลขที่จะคาดเดาสามารถคิดได้ว่าเป็นรายการบริโภคที่ระดับบุคคล ครัวเรือน หรือประชากรภายในภูมิศาสตร์ แนวทางอุปทานและอุปสงค์ - แนวทางนี้ต้องการให้คุณคิดถึงตัวเลขจากด้านอุปทานหรือด้านอุปสงค์