การพัฒนาโครงการ AI – ผู้จัดการโครงการควรเตรียมตัวอย่างไร
เผยแพร่แล้ว: 2022-03-11ฟังเวอร์ชั่นเสียงของบทความนี้
ในฐานะผู้จัดการโครงการ คุณอาจเคยมีส่วนร่วมในโครงการไอทีหลายโครงการตลอดอาชีพการงานของคุณ ครอบคลุมโครงสร้างเสาหินที่ซับซ้อนไปจนถึงเว็บแอป SaaS อย่างไรก็ตาม ด้วยความก้าวหน้าของปัญญาประดิษฐ์และแมชชีนเลิร์นนิง โครงการใหม่ที่มีความต้องการและปัญหาที่แตกต่างกันกำลังจะเกิดขึ้นอย่างรวดเร็ว
ด้วยการเพิ่มขึ้นของเทคโนโลยีเหล่านี้ มันจึงกลายเป็น "สิ่งที่น่ายินดี" น้อยลง และจำเป็นสำหรับผู้จัดการโครงการด้านเทคนิคที่จะมีความสัมพันธ์ที่ดีกับแนวคิดเหล่านี้ จากข้อมูลของ Gartner ภายในปี 2020 AI จะสร้างงาน 2.3 ล้านตำแหน่ง เกิน 1.8 ล้านตำแหน่งที่จะกำจัดออกไป ซึ่งจะสร้างมูลค่าธุรกิจได้ 2.9 ล้านล้านดอลลาร์ภายในปี 2021 CEO ของ Google ได้กล่าวไว้ว่า “AI เป็นหนึ่งในสิ่งสำคัญที่สุด มนุษยชาติกำลังทำงานอยู่ มันลึกซึ้งกว่า […] ไฟฟ้าหรือไฟ”
ด้วยแอปพลิเคชั่นของปัญญาประดิษฐ์ที่ขัดขวางอุตสาหกรรมต่างๆ ตั้งแต่การเงินไปจนถึงการดูแลสุขภาพ PM ด้านเทคนิคที่สามารถเข้าใจโอกาสนี้ต้องเข้าใจว่าการจัดการโครงการ AI มีความแตกต่างกันอย่างไร และพวกเขาจะเตรียมตัวอย่างไรให้ดีที่สุดสำหรับภูมิทัศน์ที่เปลี่ยนแปลงไป
ทฤษฎี
ความหมายทั้งหมด: AI กับ ML
ก่อนที่จะเจาะลึกลงไป สิ่งสำคัญคือต้องมีความเข้าใจอย่างถ่องแท้ว่า AI คืออะไรจริงๆ ด้วยคำศัพท์ต่างๆ มากมายที่มักใช้สลับกันได้ เรามาเจาะลึกลงไปในคำจำกัดความที่พบบ่อยที่สุดก่อน
ปัญญาประดิษฐ์ (AI)
AI เป็นสาขาวิชาวิทยาการคอมพิวเตอร์ที่อุทิศให้กับการแก้ปัญหาที่ต้องใช้สติปัญญาของมนุษย์ เช่น การจดจำรูปแบบ การเรียนรู้ และลักษณะทั่วไป
ในช่วงไม่กี่ปีที่ผ่านมามีการใช้คำนี้มากเกินไปเพื่อแสดงถึงปัญญาประดิษฐ์ทั่วไป (AGI) ซึ่งหมายถึงโปรแกรมคอมพิวเตอร์ที่รู้จักตนเองซึ่งสามารถรับรู้ได้จริง อย่างไรก็ตาม ระบบ AI ส่วนใหญ่ในอนาคตอันใกล้จะเป็นสิ่งที่นักวิทยาศาสตร์คอมพิวเตอร์เรียกว่า "AI แคบ" ซึ่งหมายความว่าระบบ AI จะได้รับการออกแบบมาเพื่อทำงานด้านความรู้ความเข้าใจเพียงอย่างเดียว แทนที่จะ "คิด" ด้วยตนเองจริงๆ
การเรียนรู้ของเครื่อง (ML)
การเรียนรู้ด้วยเครื่องเป็นส่วนย่อยของปัญญาประดิษฐ์ที่ใช้เทคนิคทางสถิติเพื่อให้คอมพิวเตอร์สามารถเรียนรู้จากข้อมูลโดยไม่ต้องตั้งโปรแกรมไว้อย่างชัดเจน
บริษัทหลายแห่งใช้ AI และ ML สลับกันได้ในช่วงไม่กี่ปีที่ผ่านมา เนื่องจากความสำเร็จของวิธีการเรียนรู้ด้วยเครื่องบางอย่างในด้าน AI เพื่อความชัดเจน แมชชีนเลิร์นนิงหมายถึงความสามารถของโปรแกรมในการ เรียนรู้ ในขณะที่ปัญญาประดิษฐ์ครอบคลุมการเรียนรู้ร่วมกับฟังก์ชันอื่นๆ
หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับโครงข่ายประสาทเทียมและการเรียนรู้เชิงลึก โปรดดูภาคผนวกท้ายบทความนี้
ความแตกต่างที่สำคัญ: AI กับอัลกอริทึมมาตรฐาน
ประเด็นสำคัญของ AI คืออัลกอริธึมใช้ข้อมูลจำนวนมากในการปรับโครงสร้างภายใน เพื่อให้เมื่อมีการนำเสนอข้อมูลใหม่ ข้อมูลดังกล่าวจะถูกจัดหมวดหมู่ตามข้อมูลก่อนหน้านี้ที่ให้ไว้ เราเรียกสิ่งนี้ว่า "การเรียนรู้" จากข้อมูลแทนที่จะดำเนินการตามคำแนะนำในการจัดหมวดหมู่ที่เขียนไว้ในโค้ดอย่างเคร่งครัด
ลองนึกภาพว่าเราต้องการเขียนโปรแกรมที่สามารถแยกรถยนต์ออกจากรถบรรทุกได้ ในแนวทางการเขียนโปรแกรมแบบดั้งเดิม เราจะพยายามเขียนโปรแกรมที่มองหาคุณลักษณะเฉพาะที่บ่งบอกถึงลักษณะ เช่น ล้อที่ใหญ่ขึ้นหรือตัวรถที่ยาวขึ้น เราจะต้องเขียนโค้ดโดยเจาะจงเพื่อกำหนดลักษณะของคุณลักษณะเหล่านี้และตำแหน่งที่ควรพบในภาพถ่าย การเขียนโปรแกรมดังกล่าวและทำให้มันทำงานได้อย่างน่าเชื่อถือนั้นยากมาก เป็นไปได้ว่าจะให้ผลทั้งผลบวกลวงและผลลบลวง จนถึงขั้นสุดท้ายอาจไม่สามารถใช้งานได้เลย
นี่คือจุดที่อัลกอริธึม AI มีประโยชน์มาก เมื่ออัลกอริทึม AI ได้รับการฝึกฝน เราสามารถแสดงตัวอย่างได้มากมาย และปรับโครงสร้างภายในเพื่อเริ่มตรวจจับคุณสมบัติที่เกี่ยวข้องกับการจำแนกประเภทรูปภาพที่ประสบความสำเร็จ แทนที่จะอาศัยคำจำกัดความของคุณสมบัติคงที่และกำหนดไว้
การจัดการโครงการ AI ในทางปฏิบัติ
Data Is King
มนุษย์ไม่ได้เก่งในการจัดการกับข้อมูลจำนวนมาก และบางครั้งปริมาณของข้อมูลที่มีอยู่ก็ทำให้เราไม่สามารถใช้ข้อมูลได้โดยตรง นี่คือที่มาของระบบ AI
แนวคิดหลักเกี่ยวกับระบบ AI ก็คือการคาดคะเนนั้นดีพอๆ กับข้อมูลเท่านั้น ตัวอย่างเช่น อัลกอริธึมที่มีจุดข้อมูลนับล้านจุดจะมีประสิทธิภาพเหนือกว่าอัลกอริธึมเดียวกันที่มีจุดข้อมูล 10,000 จุด นอกจากนี้ BCG รายงานว่า “หลายบริษัทไม่เข้าใจถึงความสำคัญของข้อมูลและการฝึกอบรมเพื่อความสำเร็จของ AI บ่อยครั้ง ข้อมูลที่ดีกว่ามีความสำคัญต่อการสร้างระบบอัจฉริยะมากกว่าอัลกอริธึมที่เปลือยเปล่าได้ดีกว่า มากที่สุดเท่าที่การเลี้ยงดูมักจะมีค่ามากกว่าธรรมชาติของมนุษย์”
ด้วยความรู้นี้ การเตรียมและทำความสะอาดข้อมูลจึงเป็นสิ่งที่จะแพร่หลายมากขึ้นในกระบวนการโครงการ ขั้นตอนนี้มักจะเป็นส่วนที่ใช้แรงงานมากที่สุดในการสร้างระบบ AI เนื่องจากธุรกิจส่วนใหญ่ไม่มีข้อมูลพร้อมในรูปแบบที่ถูกต้อง ดังนั้นจึงอาจใช้เวลาสักครู่สำหรับนักวิเคราะห์ข้อมูลในการดำเนินการตามขั้นตอนที่สำคัญนี้
นอกจากนี้ การตั้งค่าโครงสร้างพื้นฐานของข้อมูลและงานการล้างข้อมูลมีความเป็นเส้นตรงมากกว่าการพัฒนาซอฟต์แวร์ทั่วไป และอาจต้องใช้วิธีการจัดการโครงการที่แตกต่างกัน
โดยสรุป อาจใช้เวลานานกว่ามากในการสร้างโครงสร้างพื้นฐานข้อมูลที่ถูกต้องและเตรียมข้อมูลที่จะใช้ มากกว่าการสร้างโมเดลการเรียนรู้ของเครื่องเพื่อเรียกใช้ข้อมูล นี่เป็นข้อพิจารณาที่สำคัญสำหรับผู้จัดการโครงการในขณะที่พวกเขาจัดการทีมและคิดเกี่ยวกับขอบเขต AI และการประมาณการโครงการ
นอกจากนี้ ชุดข้อมูลควรได้รับการอัปเดตอย่างต่อเนื่องด้วยข้อมูลใหม่ การเข้าถึงชุดข้อมูลที่ไม่ซ้ำกันอาจเป็นปัจจัยในการตัดสินใจหลักในการกำหนดว่าผลิตภัณฑ์ ML ใดประสบความสำเร็จมากที่สุด สิ่งสำคัญคือต้องติดตามข้อมูลล่าสุดอยู่เสมอเพื่อให้ได้ประสิทธิภาพที่ดีที่สุดสำหรับโปรเจ็กต์ ML ของคุณ แม้กระทั่งหลังการเปิดตัว
วงจรชีวิตการพัฒนา AI
พวกคุณส่วนใหญ่จะคุ้นเคยกับวงจรการพัฒนาระบบมาตรฐาน (SDLC) ควบคู่ไปกับวิธีการและเทคโนโลยีต่างๆ ที่ก่อตัวขึ้น สิ่งสำคัญคือต้องสังเกตว่าการพัฒนา AI จะนำความท้าทายชุดใหม่มาสู่ภาคสนาม เราสามารถแบ่งวงจรชีวิตการพัฒนา AI ออกเป็นขั้นตอนเหล่านี้: แนวคิดและการค้นพบข้อมูล การจัดลำดับความสำคัญของ MVP และการพัฒนา MVP ให้เป็นผลิตภัณฑ์ที่มีคุณสมบัติครบถ้วน
แนวคิดและการค้นพบข้อมูล
ในขั้นแรกนี้ จุดเน้นควรอยู่ที่ สองสิ่งสำคัญ: ผู้ใช้ปลายทางของผลิตภัณฑ์ ML และพูลข้อมูลใดที่พร้อมใช้งาน
โดยการเข้าหาปัญหาจากทั้งสองฝ่ายที่เป็นอิสระ เทคนิคเหล่านี้สามารถช่วยผู้จัดการโครงการให้แคบลงโอกาสของผลิตภัณฑ์ ML ที่มีอยู่ภายในบริษัทได้อย่างรวดเร็ว ในระหว่างระยะนี้ PM ระดับสูงจะได้ประโยชน์จากความรู้เกี่ยวกับพื้นที่การเรียนรู้ของเครื่อง เพื่อให้เข้าใจถึงความยากลำบากในการแก้ไขปัญหาบางอย่างได้ดีขึ้น สิ่งต่าง ๆ ดำเนินไปอย่างรวดเร็วในด้าน ML และปัญหาที่ยากบางอย่างสามารถทำให้ง่ายขึ้นได้มากโดยการพัฒนาใหม่ในการวิจัย
ตามที่กล่าวไว้ก่อนหน้านี้ เมื่อข้อมูลถูกค้นพบแล้ว จะต้องได้รับการทำความสะอาดและเตรียมการ งานเฉพาะนี้มักจะทำในขั้นตอนเชิงเส้น ซึ่งไม่เข้ากับวิธีการทั่วไปของโครงการอย่าง Agile หรือ Waterfall แม้ว่าจะ สามารถ บังคับให้เข้าสู่การวิ่งเร็วได้ โดยทั่วไป การล้างข้อมูลจะดำเนินการซ้ำๆ โดยค่อยๆ เพิ่มขนาดของชุดข้อมูลและเตรียมชุดข้อมูลควบคู่ไปกับความพยายามในการพัฒนาอื่นๆ
การจัดลำดับความสำคัญของผลิตภัณฑ์ที่มีศักยภาพขั้นต่ำ (MVP)
ความจริงที่ว่ามันจะดีกว่าที่จะมีต้นแบบที่ใช้งานได้ของผลิตภัณฑ์ขนาดเล็ก แทนที่จะเป็นขนาดใหญ่ที่ยังไม่เสร็จ ยังคงยืนอยู่ที่นี่ด้วยผลิตภัณฑ์การเรียนรู้ของเครื่อง ML MVP ใหม่ควรได้รับการจัดลำดับความสำคัญตามความเร็วในการจัดส่งและมูลค่าที่มีต่อบริษัท หากคุณสามารถส่งมอบผลิตภัณฑ์ได้ แม้จะมีขนาดเล็กกว่า แต่ด้วยความรวดเร็ว อาจเป็นผลดีและชนะอย่างรวดเร็วสำหรับทั้งทีม คุณควรจัดลำดับความสำคัญของผลิตภัณฑ์เหล่านี้ก่อน
การเตรียม MVP เหล่านี้ในรูปแบบ Agile แบบคลาสสิกเป็นความคิดที่ดีและทีมพัฒนาควรมุ่งเน้นที่การนำเสนอแบบจำลอง ML ตามชุดข้อมูลที่มีการปรับปรุงอย่างต่อเนื่องซึ่งจัดเตรียมโดยทีมข้อมูลอย่างอิสระ ความแตกต่างที่สำคัญที่นี่คือ ทีมข้อมูลไม่จำเป็นต้องทำงานผ่านโครงสร้าง Sprint เดียวกันกับทีมที่สร้าง MVP
MVP สู่ผลิตภัณฑ์เต็มรูปแบบ
ขั้นตอนนี้เป็นขั้นตอนที่โครงสร้างพื้นฐานของข้อมูลกลายเป็นกุญแจสำคัญ หากผลิตภัณฑ์ ML ของคุณต้องการการเข้าถึง API ความถี่สูงจากทั่วโลก ตอนนี้คุณควรพิจารณาว่าคุณจะปรับขนาดโครงสร้างพื้นฐานเพื่อรองรับผลิตภัณฑ์ ML ได้อย่างไร
นี่คือจุดที่ต้องมีการประเมินการเปลี่ยนแปลงในโมดูล ML อย่างรอบคอบ เพื่อหลีกเลี่ยงการทำลายประสิทธิภาพของผลิตภัณฑ์ปัจจุบัน การฝึกอบรมโมดูล ML ใหม่ด้วยอัลกอริธึมหรือชุดข้อมูลใหม่ไม่ได้ทำให้ประสิทธิภาพเชิงเส้นเพิ่มขึ้นเสมอไป ดังนั้นจึงจำเป็นต้องมีการทดสอบจำนวนมากก่อนที่จะปรับใช้จริง การทดสอบโมดูล ML สำหรับกรณี Edge และการโจมตีแบบ Generative Adversarial Network (GAN) ที่อาจเกิดขึ้นยังอยู่ในช่วงเริ่มต้น แต่เป็นสิ่งที่ผู้จัดการโครงการควรคำนึงถึงเมื่อใช้งานผลิตภัณฑ์ ML ที่ใช้งานอยู่
บทบาทสำคัญในวงจรการพัฒนา AI
ข้อกำหนดที่มีข้อมูลจำนวนมากในการพัฒนาแอปพลิเคชัน ML ได้นำบทบาทใหม่มาสู่ SDLC ของผลิตภัณฑ์ AI ในการเป็นผู้จัดการโครงการที่ยอดเยี่ยมในด้านแอปพลิเคชัน ML คุณต้องคุ้นเคยกับสามบทบาทต่อไปนี้: นักวิทยาศาสตร์ข้อมูล วิศวกรข้อมูล และวิศวกรโครงสร้างพื้นฐาน แม้ว่าบางครั้งจะถูกซ่อนอยู่ภายใต้ชื่ออื่นๆ รวมถึงวิศวกรแมชชีนเลิร์นนิง วิศวกรโครงสร้างพื้นฐานของแมชชีนเลิร์นนิง หรือนักวิทยาศาสตร์แมชชีนเลิร์นนิง สิ่งสำคัญคือต้องมีความเข้าใจอย่างถ่องแท้เกี่ยวกับตำแหน่งหลักเหล่านี้และผลกระทบต่อกระบวนการพัฒนา ML
นักวิทยาศาสตร์ข้อมูล
นักวิทยาศาสตร์ข้อมูลคือบุคคลที่สร้างแบบจำลองการเรียนรู้ของเครื่อง พวกเขาสังเคราะห์แนวคิดโดยอาศัยความเข้าใจอย่างลึกซึ้งเกี่ยวกับสถิติประยุกต์ การเรียนรู้ของเครื่อง และการวิเคราะห์ จากนั้นจึงนำข้อมูลเชิงลึกไปใช้เพื่อแก้ปัญหาทางธุรกิจที่แท้จริง
บางครั้งนักวิทยาศาสตร์ข้อมูลถูกมองว่าเป็นนักวิเคราะห์ข้อมูลเวอร์ชันขั้นสูง อย่างไรก็ตาม นักวิทยาศาสตร์ด้านข้อมูลมักจะมีทักษะในการเขียนโปรแกรมที่แข็งแกร่ง มีความสามารถในการประมวลผลข้อมูลจำนวนมากที่ครอบคลุมทั่วทั้งศูนย์ข้อมูล และมีความเชี่ยวชาญในการเรียนรู้ของเครื่อง
พวกเขายังคาดหวังให้มีความเข้าใจที่ดีเกี่ยวกับโครงสร้างพื้นฐานของข้อมูลและการทำเหมืองข้อมูลขนาดใหญ่ ตลอดจนสามารถดำเนินการสำรวจด้วยตนเอง ดูข้อมูลและค้นหาเพื่อค้นหาเบาะแสเบื้องต้นและข้อมูลเชิงลึกภายใน
ทักษะพื้นฐาน: Python, R, Scala, Apache Spark, Hadoop, Machine Learning, Deep Learning, สถิติ, Data Science, Jupyter, RStudio
วิศวกรข้อมูล
วิศวกรข้อมูลคือวิศวกรซอฟต์แวร์ที่เชี่ยวชาญในการสร้างซอฟต์แวร์และโครงสร้างพื้นฐานที่จำเป็นสำหรับผลิตภัณฑ์ ML พวกเขามักจะมุ่งเน้นไปที่สถาปัตยกรรมที่ครอบคลุม และแม้ว่าพวกเขาอาจไม่ใช่ผู้เชี่ยวชาญในการเรียนรู้ของเครื่อง การวิเคราะห์ หรือข้อมูลขนาดใหญ่ พวกเขาควรมีความเข้าใจที่ดีในหัวข้อเหล่านี้เพื่อทดสอบซอฟต์แวร์และโครงสร้างพื้นฐาน นี่เป็นสิ่งจำเป็นเพื่อให้โมเดลการเรียนรู้ของเครื่องที่สร้างขึ้นโดยนักวิทยาศาสตร์ข้อมูลสามารถนำไปใช้งานและเปิดเผยสู่โลกแห่งความเป็นจริงได้สำเร็จ
ทักษะพื้นฐาน: Python, Hadoop, MapReduce, Hive, Pig, Data Streaming, NoSQL, SQL, การเขียนโปรแกรม, DashDB, MySQL, MongoDB, Cassandra
วิศวกรโครงสร้างพื้นฐาน
วิศวกรโครงสร้างพื้นฐานดูแลแกนหลักของผลิตภัณฑ์ ML: เลเยอร์โครงสร้างพื้นฐาน แม้ว่าวิศวกรข้อมูลอาจสร้างโครงสร้างพื้นฐานนี้บางส่วน แต่ก็มักจะสร้างขึ้นบนเลเยอร์ที่จัดเตรียมและตกลงกันโดยทีมโครงสร้างพื้นฐาน
วิศวกรโครงสร้างพื้นฐานอาจทำงานในทีม ML หลายทีม โดยมีเป้าหมายในการสร้างสภาพแวดล้อมที่ปรับขนาดได้และมีประสิทธิภาพ ซึ่งแอป ML สามารถปรับขนาดเพื่อรองรับผู้ใช้หลายล้านคน วิศวกรโครงสร้างพื้นฐานไม่เพียงแต่ดูแลระดับซอฟต์แวร์ของแพลตฟอร์มเท่านั้น แต่ยังประสานงานกับพันธมิตรศูนย์ข้อมูลเพื่อให้แน่ใจว่าทุกอย่างทำงานได้อย่างราบรื่น ตั้งแต่ตำแหน่งทางภูมิศาสตร์ของข้อมูลที่โฮสต์ไปจนถึงฮาร์ดแวร์ เนื่องจากประเด็นเหล่านี้มีความสำคัญมากขึ้นสำหรับโครงการ ML วิศวกรโครงสร้างพื้นฐานจึงมีความสำคัญมากขึ้นเรื่อยๆ ในบริษัทที่ขับเคลื่อนด้วย AI
ทักษะพื้นฐาน: Kubernetes, Mesos, EKS, GKE, Hadoop, Spark, HDFS, CEPH, AWS, การประมวลผลแบบคลาวด์, การดำเนินงานของศูนย์ข้อมูล, โครงสร้างพื้นฐานคอมพิวเตอร์แบบครบวงจร, โครงสร้างพื้นฐานด้านไอที, การจัดการบริการ
ความท้าทายทั่วไปในวันนี้
ด้วยการเกิดขึ้นของผลิตภัณฑ์ที่ใช้ AI และ ML ผู้จัดการโครงการได้รับการคาดหวังให้ต้องเผชิญกับความท้าทายทั้งที่คุ้นเคยและจากต่างประเทศโดยสิ้นเชิง นายกรัฐมนตรีระดับสูงตระหนักดีถึงปัญหาที่อาจเกิดขึ้นเหล่านี้ตลอดกระบวนการ ตั้งแต่การกำหนดขอบเขตโครงการจนเสร็จสิ้น
ตรวจสอบความเป็นจริง
แม้จะได้รับความนิยมและสัญญาว่า AI ก็มีโอกาสที่ดีที่ปัญหาที่คุณกำลังพยายามแก้ไขไม่จำเป็นต้องใช้โซลูชัน AI ที่ซับซ้อน
ปัญหาการคาดการณ์จำนวนมากสามารถแก้ไขได้โดยใช้แบบที่ง่ายกว่าและในบางกรณี แบบจำลองการถดถอยทางสถิติที่เชื่อถือได้มากขึ้น เป็นสิ่งสำคัญมากสำหรับ PM ที่จะต้องตรวจสุขภาพจิตก่อนเริ่มโครงการเพื่อให้แน่ใจว่าปัญหานั้นต้องการการเรียนรู้ของเครื่องจริงๆ
บางครั้งก็ควรเริ่มต้นด้วยแบบจำลองทางสถิติที่ง่ายกว่าและดำเนินการควบคู่ไปกับโซลูชันที่ใช้การเรียนรู้ของเครื่อง ตัวอย่างเช่น หากคุณกำลังสร้างเอ็นจินการแนะนำ อาจเป็นการดีที่จะเริ่มต้นด้วยโซลูชันที่ง่ายกว่าด้วยวงจรการพัฒนาที่เร็วขึ้น โดยให้พื้นฐานที่ดีว่าโมเดล ML ที่ตามมาควรมีประสิทธิภาพดีกว่า

ขอบเขต AI คืบคลาน
สาเหตุที่พบบ่อยที่สุดของการคืบคลานของขอบเขตในโครงการ ML เกี่ยวข้องกับการ พยายามทำหลายๆ อย่างพร้อมกันมากเกินไป และประเมินความพยายามที่จำเป็นในการเตรียมข้อมูล ต่ำไป
ในการแก้ไขปัญหาแรก ให้จัดการผู้มีส่วนได้ส่วนเสียเพื่อให้พวกเขาเข้าใจว่า เป็นการดีกว่าที่จะเริ่มต้นด้วยชัยชนะอย่างรวดเร็ว มากกว่าแผนที่ยิ่งใหญ่ สื่อสารแนวทางนี้อย่างต่อเนื่องตลอดทั้งโครงการ ในขณะที่คุณสร้างและทดสอบ
เริ่มต้นด้วยคุณลักษณะอะตอมมิกขนาดเล็กที่สามารถกำหนดและทดสอบได้ง่าย หากคุณพบว่าตัวเองมีงานที่ซับซ้อน ให้พยายามแบ่งงานออกเป็นงานที่เรียบง่ายซึ่งเป็นผู้รับมอบฉันทะที่ดีสำหรับงานหลักของคุณ การสื่อสารว่าภารกิจเหล่านี้ควรทำให้สำเร็จได้ง่ายเพียงใด
ตัวอย่างเช่น หากคุณกำลังพยายามคาดการณ์ว่าผู้ใช้จะคลิกโฆษณาใดโฆษณาหนึ่ง ขั้นแรกให้ลองคาดเดาว่าผู้ใช้ปิดโฆษณาทั้งหมดหรือไม่ ในแนวทางนี้ ปัญหาจะง่ายขึ้นและสามารถปรับให้เหมาะสมและคาดการณ์ได้ดีขึ้นโดยแบบจำลอง ML ปัจจุบัน Facebook ได้สร้างซีรีส์ที่ยอดเยี่ยมในหัวข้อนี้อย่างลึกซึ้งยิ่งขึ้น โดยเน้นที่ไปป์ไลน์ ML ตั้งแต่เริ่มก่อตั้งจนถึงการส่งมอบโมเดล
ในการจัดการกับผู้ร่วมให้ข้อมูลคนที่สองของขอบเขตการคืบ ตรวจสอบว่าคุณสามารถเตรียมข้อมูลเพื่อรองรับโครงการ ML ของคุณ สมมติว่าคุณมีข้อมูลที่จำเป็น ในรูปแบบที่จำเป็น เป็นข้อผิดพลาดทั่วไปที่ PM สร้างขึ้นเมื่อเพิ่งเริ่มต้นกับโปรเจ็กต์ ML เนื่องจากการเตรียมและทำความสะอาดข้อมูลมักเป็นส่วนที่ยาวกว่าในกระบวนการโปรเจ็กต์ ML การจัดการขั้นตอนนี้จึงเป็นสิ่งสำคัญ ตรวจสอบให้แน่ใจว่านักวิทยาศาสตร์ข้อมูลของคุณมีสิทธิ์เข้าถึงข้อมูลที่ถูกต้อง และสามารถตรวจสอบคุณภาพและความถูกต้องได้ ก่อนที่ จะใช้คุณลักษณะ ML ที่ต้องการสร้าง
เตรียมที่จะทำฉลากข้อมูลและทำความสะอาดเป็นแบบฝึกหัดต่อเนื่องตลอดทั้งโครงการ ไม่ใช่แค่ในฐานะผู้ริเริ่ม เนื่องจากโครงการจะได้รับประโยชน์จากข้อมูลที่ดีขึ้นและมากขึ้นเสมอ ด้วยขั้นตอนนี้ไม่ใช่งานที่น่าดึงดูดใจที่สุด ให้แบ่งงานนี้ออกเป็น sprints เพื่อให้ทีมข้อมูลของคุณสามารถสัมผัสถึงความคืบหน้าของความพยายามของพวกเขา แทนที่จะต้องเผชิญกับงานในมือที่ไม่รู้จบ
บางครั้งบริษัทจ้างการติดฉลากข้อมูลให้กับบุคคลที่สาม แม้ว่าสิ่งนี้จะช่วยประหยัดเวลาและค่าใช้จ่ายล่วงหน้า แต่ก็สามารถสร้างข้อมูลที่ไม่น่าเชื่อถือ ซึ่งท้ายที่สุดแล้วจะเป็นอุปสรรคต่อความสำเร็จของแบบจำลอง ML ของคุณ เพื่อหลีกเลี่ยงปัญหานี้ ให้ใช้เทคนิคการทับซ้อนหลายส่วน โดยที่ข้อมูลทุกชิ้นจะถูกตรวจสอบโดยฝ่ายต่างๆ และใช้เฉพาะเมื่อผลลัพธ์ตรงกันเท่านั้น
เมื่อวางแผนโครงการ ควรจัดสรรเวลาให้เพียงพอสำหรับทีมข้อมูลเพื่อทำการปรับเปลี่ยนในกรณีที่ข้อกำหนดการติดฉลากของคุณเปลี่ยนแปลงกลางโครงการและจำเป็นต้องมีการติดฉลากใหม่
สุดท้าย ให้ตรวจสอบว่าข้อมูลของคุณสามารถใช้ได้อย่างง่ายดายด้วยวิธี ML ที่มีอยู่ แทนที่จะสร้างวิธี ML ใหม่ เนื่องจากการเริ่มจากศูนย์อาจทำให้เวลาและขอบเขตของโครงการเพิ่มขึ้นอย่างมาก โปรดทราบว่าหากคุณพยายามแก้ปัญหา ML ที่ยังไม่ได้รับการแก้ไข มีโอกาสสูงที่คุณจะล้มเหลว แม้ว่าแมชชีนเลิร์นนิงจะประสบความสำเร็จและมีงานวิจัยจำนวนมากที่ตีพิมพ์ การแก้ปัญหา ML อาจเป็นความพยายามที่ยากมาก เป็นเรื่องง่ายที่สุดเสมอที่จะเริ่มต้นด้วยพื้นที่ของ ML ซึ่งมีตัวอย่างและอัลกอริทึมดีๆ มากมาย และพยายามปรับปรุงให้ดีขึ้นแทนที่จะพยายามคิดค้นสิ่งใหม่
การเรียนรู้ของเครื่อง ความคาดหวัง และ UX
PM ทุกคนควรพร้อมที่จะคิดเกี่ยวกับประสบการณ์ผู้ใช้ของผลิตภัณฑ์ AI ที่พวกเขากำลังสร้างและวิธีจัดการทีมที่สร้างพวกเขาให้ดีที่สุด Google เขียนบทความที่ยอดเยี่ยมเกี่ยวกับวิธีการคิดของพวกเขาเกี่ยวกับ UX และ AI โดยเน้นที่ปฏิสัมพันธ์ของมนุษย์
ประเด็นนี้มีความสำคัญอย่างยิ่งหากผลิตภัณฑ์ ML ของคุณต้องโต้ตอบกับผู้ปฏิบัติงานหรือต้องถูกแทนที่โดยพวกเขา การออกแบบควรเพิ่มความเครียดขั้นต่ำที่จำเป็นให้กับผู้ปฏิบัติงานและผู้ใช้ระบบ ตัวอย่างเช่น แชทบ็อตมักใช้การเรียนรู้ของเครื่อง แต่ผู้ปฏิบัติงานที่เป็นมนุษย์สามารถเข้ามาแทนที่ได้
นอกจากนี้ยังมีความเป็นไปได้ที่ผู้มีส่วนได้ส่วนเสียอาจคาดหวังมากขึ้นจากผลิตภัณฑ์การเรียนรู้ด้วยเครื่องมากกว่าสิ่งที่พวกเขาสามารถให้ได้ ซึ่งมักเป็นปัญหาที่เกิดจากโฆษณาที่สร้างขึ้นโดยสื่อเมื่อเขียนเกี่ยวกับผลิตภัณฑ์ AI ดังนั้นจึงเป็นเรื่องสำคัญที่ผู้จัดการโครงการจะต้องตั้งความคาดหวังที่สมเหตุสมผล
อย่าลืมอธิบายว่าจริง ๆ แล้วเครื่องมือ AI คืออะไรและสามารถบรรลุผลสำหรับผู้มีส่วนได้ส่วนเสียของคุณ เพื่อให้คุณสามารถจัดการความคาดหวังของพวกเขาได้ดีพอก่อนที่จะทดสอบเครื่องมือ UX ที่ดีนั้นยอดเยี่ยม แต่ไม่สามารถมอบคุณค่าให้กับผู้ใช้ด้วยความคาดหวังที่ไม่สมจริง ดังนั้นจึงจำเป็นสำหรับ PM ที่เกี่ยวข้องในการจัดการสิ่งเหล่านี้และให้ความรู้ผู้มีส่วนได้ส่วนเสียเกี่ยวกับ AI และความสามารถที่เป็นจริง
การประกันคุณภาพ (QA) และแนวทางการทดสอบใน ML
AI ในรูปแบบปัจจุบันเป็นสาขาที่ค่อนข้างใหม่ ไม่เคยมีแอปพลิเคชันมากมายที่ใช้การเรียนรู้เชิงลึกเพื่อให้บรรลุเป้าหมายมาก่อน การพัฒนาใหม่เหล่านี้มาพร้อมกับชุดของความท้าทายโดยเฉพาะในการทดสอบ
แม้ว่าจะค่อนข้างง่ายในการทดสอบซอฟต์แวร์มาตรฐานที่มี "ชุดกฎ" ที่ชัดเจนซึ่งเขียนโดยบุคคล แต่การทดสอบแบบจำลองการเรียนรู้ของเครื่องอย่างละเอียดจะยากกว่ามาก โดยเฉพาะอย่างยิ่งโมเดลที่สร้างขึ้นโดยใช้โครงข่ายประสาทเทียม ในปัจจุบัน แบบจำลอง ML ส่วนใหญ่ได้รับการทดสอบโดยนักวิทยาศาสตร์ข้อมูลเอง แต่มีวิธีการทดสอบที่ตกลงร่วมกับทีม QA มาตรฐานเพียงไม่กี่วิธีเพื่อให้แน่ใจว่าผลิตภัณฑ์ ML จะไม่ล้มเหลวในลักษณะที่ไม่คาดคิด
ด้วยวิธีการใหม่ๆ ในการจัดการผลลัพธ์ของโมเดลที่รู้จัก เช่น การโจมตี GAN การทดสอบแบบจำลองที่ครอบคลุมจะมีความสำคัญมากขึ้น สิ่งนี้จะกลายเป็นสิ่งสำคัญสำหรับโปรเจ็กต์ ML จำนวนมาก และเราจะได้เห็นการทดสอบประเภท "การผสานรวม" เพิ่มเติมสำหรับโมเดล ML ในอีกไม่กี่ปีข้างหน้า สำหรับโปรเจ็กต์ธรรมดาๆ ส่วนใหญ่ สิ่งนี้อาจไม่ใช่ปัญหาที่จับต้องได้ในขณะนี้ แต่สิ่งสำคัญคือต้องคำนึงถึงสิ่งนี้ หากคุณกำลังสร้างผลิตภัณฑ์ ML ที่สำคัญต่อภารกิจ
ML Model การโจรกรรมและการลอกเลียนแบบ
เนื่องจากบทความ Wired นี้ได้รับการตีพิมพ์ และบทความต้นฉบับถูกนำเสนอในการประชุม USENIX Security ในปี 2016 เป็นที่แน่ชัดว่ามีความเป็นไปได้ที่จะลอกเลียนแบบจำลอง ML แบบสด
สิ่งนี้ยังค่อนข้างยากที่จะทำให้สำเร็จ แต่ถ้าคุณมีโมเดลที่ทำงานผ่าน API ที่เปิดเผยต่อสาธารณะ สิ่งสำคัญคือต้องตระหนักถึงความเป็นไปได้นี้ ตามทฤษฎีแล้ว บุคคลที่มีสิทธิ์เข้าถึงจำนวนมากสามารถฝึกเครือข่ายของตนเองโดยอิงจากเครือข่ายของคุณ และคัดลอกความสามารถในการคาดการณ์ของคุณอย่างมีประสิทธิภาพ
สิ่งนี้ยังค่อนข้างจำกัดในแง่ของความเป็นไปได้ แต่อย่าลืมทำงานร่วมกับทีมของคุณในกลยุทธ์การป้องกันสำหรับการโจมตีที่เป็นไปได้ หากสิ่งนี้เป็นปัญหาสำหรับโครงการของคุณ
การขาดแคลนผู้มีความสามารถ
ด้วยความต้องการผู้เชี่ยวชาญด้าน AI ระดับโลกในปัจจุบัน การแข่งขันเพื่อให้ได้ผู้มีความสามารถที่เหมาะสมจึงรุนแรง ในความเป็นจริง New York Times รายงานว่าผู้เชี่ยวชาญด้าน AI ระดับโลกสามารถทำเงินได้ถึง 1 ล้านเหรียญต่อปีจากการทำงานให้กับโรงไฟฟ้าเทคโนโลยีขนาดใหญ่ใน Silicon Valley ในฐานะ PM ในขณะที่คุณมองหาผู้เชี่ยวชาญด้าน AI เพื่อเข้าร่วมทีมของคุณ ให้ตระหนักถึงการเปลี่ยนแปลงเหล่านี้เนื่องจากอาจส่งผลกระทบต่อรอบการจ้างงาน งบประมาณ หรือคุณภาพของงานที่ทำ
ปัญหาการขาดแคลนนี้ขยายไปถึงความคิดริเริ่มในการสร้างอัลกอริธึมการเรียนรู้เชิงลึกที่ใหม่และเป็นจริงสำหรับวิศวกรข้อมูลและนักวิทยาศาสตร์คุณภาพสูง
คนที่มีความสามารถมากที่สุดหลายคนเข้าร่วมการแข่งขันแมชชีนเลิร์นนิง เช่น Kaggle ซึ่งพวกเขาหวังว่าจะชนะเงินรางวัล $100,000 เหนือจากการแก้ปัญหาแมชชีนเลิร์นนิงที่ยากลำบาก หากเป็นการยากที่จะจ้างผู้เชี่ยวชาญ ML ในพื้นที่ คุณควรมองหาวิธีแก้ปัญหาแบบนอกกรอบ เช่น การจ้างผู้รับเหมาที่เชี่ยวชาญจากระยะไกล หรือดำเนินการแข่งขัน Kaggle ของคุณเองสำหรับปัญหา ML ที่ยากที่สุด
ความท้าทายทางกฎหมายและจริยธรรม
ความท้าทายทางกฎหมายและจริยธรรมของ AI ในการจัดการโครงการมีสองเท่า
ความท้าทายชุดแรกเกิดจากข้อมูลที่ใช้ในการฝึกโมเดล ML จำเป็นอย่างยิ่งที่จะต้องเข้าใจว่าข้อมูลที่คุณใช้มีที่มาจากที่ใด และโดยเฉพาะอย่างยิ่ง คุณมีสิทธิ์ที่จะใช้ข้อมูลนั้นและใบอนุญาตที่อนุญาตให้คุณใช้ข้อมูลได้หรือไม่
คุณควรปรึกษาทนายความของคุณเพื่อแก้ปัญหาดังกล่าวก่อนที่จะปรับใช้แบบจำลองที่ได้รับการฝึกอบรมเกี่ยวกับข้อมูลซึ่งคุณอาจไม่มีใบอนุญาตที่ถูกต้อง เนื่องจากนี่เป็นฟิลด์ที่ค่อนข้างใหม่ คำตอบเหล่านี้จำนวนมากจึงไม่ชัดเจน แต่ PM ควรตรวจสอบให้แน่ใจว่าทีมของพวกเขาใช้เฉพาะชุดข้อมูลที่พวกเขามีสิทธิ์ใช้เท่านั้น
นี่คือรายการชุดข้อมูลที่เปิดเผยต่อสาธารณะสำหรับการฝึกอัลกอริทึม ML ของคุณ
ความท้าทายชุดที่สองมาจากการทำให้มั่นใจว่าระบบของคุณไม่มีอคติที่เป็นระบบ มีหลายกรณีของปัญหาดังกล่าวในช่วงไม่กี่ปีที่ผ่านมา ซึ่งบริษัทกล้องแห่งหนึ่งต้องยอมรับว่าเทคโนโลยีการจดจำรอยยิ้มของบริษัทจะตรวจจับเฉพาะคนจากเชื้อชาติใดโดยเฉพาะ เนื่องจากได้รับการฝึกอบรมเฉพาะจากข้อมูลที่มีใบหน้าจากเผ่าพันธุ์นั้น อีกตัวอย่างหนึ่งมาจากบริษัทซอฟต์แวร์ขนาดใหญ่แห่งหนึ่ง ซึ่งต้องถอนตัวบอท Twitter ที่เรียนรู้ด้วยตนเองหลังจากเรียนรู้ไปสองสามวัน เนื่องจากความพยายามร่วมกันของกลุ่มโทรลล์ทางอินเทอร์เน็ตได้ทำให้เกิดการล้อเลียนทางเชื้อชาติและการสมรู้ร่วมคิดที่ดุร้ายซ้ำแล้วซ้ำเล่า
ระดับของปัญหาเหล่านี้อาจมีเพียงเล็กน้อยหรือเป็นการทำลายโครงการ ดังนั้นเมื่อพัฒนาระบบที่มีความสำคัญ PMs ควรตรวจสอบให้แน่ใจว่าพวกเขาพิจารณาถึงความเป็นไปได้ดังกล่าวและป้องกันไม่ให้เกิดปัญหาโดยเร็วที่สุด
รากฐานที่ดีนำไปสู่โครงสร้างที่แข็งแรง
โดยสรุป การปฏิวัติ AI ที่กำลังจะเกิดขึ้นทำให้เกิดชุดของโปรเจ็กต์แบบไดนามิกที่น่าสนใจซึ่งมักจะมาพร้อมกับกระบวนการพัฒนาที่ปรับเปลี่ยน รูปแบบต้นแบบของทีมที่แตกต่างกัน และความท้าทายใหม่
ผู้จัดการโครงการด้านเทคนิคระดับสูงไม่เพียงแต่มีความเข้าใจพื้นฐานของ AI เป็นอย่างดีเท่านั้น แต่ยังรวมถึงสัญชาตญาณความยากของแต่ละขั้นตอนของโครงการ และสิ่งที่เป็นไปได้อย่างแท้จริงในการสร้างร่วมกับทีมของพวกเขา เนื่องจาก AI ไม่ใช่โซลูชันเชิงพาณิชย์ (COTS) เชิงพาณิชย์ แม้แต่บริษัทที่เลือกซื้อผลิตภัณฑ์ ML บางประเภทก็ยังต้องลงทุนในการทดสอบสิ่งใหม่ ๆ และจัดการข้อมูลและโครงสร้างพื้นฐานอย่างถูกต้อง
เป็นที่ชัดเจนว่าประเภทผลิตภัณฑ์ซอฟต์แวร์และกระบวนการสร้างผลิตภัณฑ์กำลังเปลี่ยนแปลงไปพร้อมกับการเกิดขึ้นของ AI ผู้จัดการโครงการที่สามารถเข้าใจและดำเนินการตามแนวคิดใหม่เหล่านี้จะมีบทบาทสำคัญในการสร้างผลิตภัณฑ์การเรียนรู้ของเครื่องในอนาคต
วัสดุเพิ่มเติมจากผู้เขียน
ทฤษฎีเพิ่มเติม: DLs และ NNs
นอกเหนือจากการใช้ปัญญาประดิษฐ์ (AI) และการเรียนรู้ของเครื่อง (ML) ทั่วไปแล้ว ผู้จัดการโครงการยังสามารถได้รับประโยชน์จากการตระหนักถึงความแตกต่างของการเรียนรู้เชิงลึก (DL) และโครงข่ายประสาทเทียม (NN)
การเรียนรู้เชิงลึก (DL)
การเรียนรู้เชิงลึกเป็นส่วนหนึ่งของวิธีการเรียนรู้ด้วยเครื่องในวงกว้างโดยอิงจากการแสดงข้อมูลการเรียนรู้ ซึ่งต่างจากอัลกอริธึมเฉพาะงานแบบคลาสสิก
โมเดลการเรียนรู้เชิงลึกที่ทันสมัยส่วนใหญ่ใช้โครงข่ายประสาทเทียม แม้ว่าจะสามารถใช้วิธีการอื่นๆ ได้หลายวิธี
โครงข่ายประสาทเทียม (NN)
โครงข่ายประสาทเทียมได้รับแรงบันดาลใจทางชีวภาพ โครงสร้างทางคณิตศาสตร์ที่เชื่อมต่อกัน ซึ่งช่วยให้ระบบ AI สามารถเรียนรู้จากข้อมูลที่นำเสนอได้
เราสามารถจินตนาการว่าเครือข่ายเหล่านี้เป็นประตูเล็กๆ นับล้านที่เปิดหรือปิดได้ ขึ้นอยู่กับการป้อนข้อมูลของเรา ความสำเร็จของเทคนิคเหล่านี้เกิดจากการเติบโตของพลังการประมวลผลของ GPU ในช่วงไม่กี่ปีที่ผ่านมา ทำให้เราสามารถปรับ "ประตูเล็กๆ" เหล่านั้นภายในเครือข่ายประสาทได้อย่างรวดเร็ว
โครงข่ายประสาทมีหลายประเภท แต่ละเครือข่ายมีกรณีการใช้งานเฉพาะและระดับความซับซ้อนของตัวเอง คุณอาจเห็นคำต่างๆ เช่น CNN (convolutional neural network) หรือ RNN (recurrent neural network) ที่ใช้อธิบายสถาปัตยกรรมโครงข่ายประสาทเทียมประเภทต่างๆ
เพื่อให้เข้าใจถึงรูปลักษณ์และการทำงานได้ดียิ่งขึ้น ต่อไปนี้คือการแสดงภาพ 3 มิติที่ยอดเยี่ยมว่าโครงข่ายประสาท "มีลักษณะอย่างไร" ในขณะที่ทำงานอยู่
สนใจเรียนรู้เพิ่มเติมเกี่ยวกับ AI ไหม
หลังจากอ่านบทความนี้แล้ว หากคุณอยากสำรวจเรื่องนี้ให้ลึกขึ้นอีกนิด เราขอแนะนำให้คุณตรวจสอบแหล่งข้อมูลเหล่านี้:
การทำความเข้าใจโครงข่ายประสาทเทียม
หากคุณต้องการเจาะลึกถึงกลไกการทำงานของโครงข่ายประสาทเทียม เราขอแนะนำให้คุณดูซีรีส์ 3Blue1Brown บนโครงข่ายประสาทเทียมบน YouTube ในความคิดของฉัน นี่เป็นคำอธิบายเชิงลึกที่ดีที่สุดของโครงข่ายประสาทเทียม มันถูกจัดส่งในเงื่อนไขที่เรียบง่ายและไม่จำเป็นต้องมีความรู้ล่วงหน้า
ติดตามข่าวสารล่าสุดเกี่ยวกับ AI News
หากคุณต้องการติดตามความก้าวหน้าล่าสุดในเทคโนโลยี AI โดยไม่ต้องเสียเวลาอ่านบทความวิชาการ ผมขอแนะนำเอกสารสองนาทีต่อไปนี้ ช่องนี้ให้ข้อมูลอัปเดตรายสัปดาห์เกี่ยวกับเทคนิค AI ใหม่ที่น่าประทับใจที่สุดและการนำไปใช้งาน
การเรียนรู้พื้นฐานของการพัฒนา ML
หากคุณต้องการตะลุยโค้ดด้วยตัวเอง และคุณมีทักษะ Python พื้นฐานอยู่บ้าง ลองใช้ Fast.ai หลักสูตรของพวกเขาช่วยให้ทุกคนที่มีทักษะการพัฒนาขั้นพื้นฐานเริ่มทดลองและเล่นกับโครงข่ายประสาทเทียม
พื้นฐานของการเรียนรู้ของเครื่อง
คำแนะนำนี้มีไว้สำหรับผู้ที่ต้องการเริ่มต้นจากจุดเริ่มต้นและพยายามทำความเข้าใจและนำการเรียนรู้ของเครื่องไปใช้
สร้างโดย Andrew Ng ในตำนานซึ่งเปิดตัว Coursera ด้วยหลักสูตรนี้ ต้องใช้เวลาลงทุนเป็นจำนวนมาก อย่างน้อย 6 เดือน แต่ก็เป็นวิธีที่มีประสิทธิผลอย่างยิ่งในการใช้เวลาในวันเสาร์
หมายเหตุ: คำจำกัดความของคำสำคัญได้รับการดัดแปลงมาจากวิกิพีเดีย