ต้องการเป็นนักวิเคราะห์ข้อมูลหรือไม่? นี่คือทักษะและเครื่องมือชั้นยอดที่จะเป็นผู้เชี่ยวชาญ
เผยแพร่แล้ว: 2017-02-16ตัวเลขกระทืบและรูปแบบการจำกลายเป็นมาตรฐานทองคำในอุตสาหกรรมไอที งานนักวิเคราะห์ข้อมูลอยู่ในความต้องการ งานที่มีอนาคตสดใสที่สุดของ LinkedIn ประจำปี 2560 ระบุว่า Data Engineer อยู่ที่อันดับ 9 และ Analytics Manager ทำให้อันดับที่ 18
การศึกษาอื่นของ Glassdoor เกี่ยวกับ 50 Best Jobs ในอเมริกาทำให้ Data Scientist อยู่ในตำแหน่งสูงสุด โดย Data Engineer เข้ามาใกล้อันดับ 3 และ Analytics Manager อยู่ในอันดับที่ 5 ที่น่าอิจฉา อย่างไรก็ตาม การคว้าตำแหน่งสูงสุดไม่ใช่เรื่องง่าย คุณต้องมีคลังทักษะในการวิเคราะห์ข้อมูล หากคุณต้องการติดตามการเติบโตแบบปีต่อปีและแพ็กเกจค่าจ้างที่คุ้มค่าด้วยความก้าวหน้าในอาชีพที่สำคัญนี้
ในขณะที่อินเทอร์เน็ตเต็มไปด้วยแหล่งข้อมูลฟรีเกี่ยวกับวิธีการเชี่ยวชาญพื้นฐานของวิทยาศาสตร์ข้อมูล การวิเคราะห์ความรู้สึก และการเรียนรู้ของเครื่องอย่างรวดเร็ว Analytics India Magazine และ UpGrad ช่วยคุณตัดขาดจากอุปสรรคโดยระบุทักษะพื้นฐาน 5 ประการที่จำเป็นในการเป็นนักวิเคราะห์ข้อมูล
อะไรที่ขัดขวางบทบาทของ Martech ทั้ง 4 อย่างนี้? การวิเคราะห์ข้อมูล!สารบัญ
นำตัวเองให้เป็นผู้นำในงาน Data Analyst ด้วยทักษะเหล่านี้
เริ่มต้นด้วยพื้นฐานสองสามอย่าง:
ประวัติการศึกษา

ไม่ใช่ทุกคนที่สามารถเป็นนักวิเคราะห์ข้อมูลได้ คุณต้องมีพื้นฐานทาง คณิตศาสตร์ และ สถิติ อย่างเป็นธรรมชาติ หลายปีของการเรียนรู้แคลคูลัสและความน่าจะเป็นจะมีประโยชน์ ปริญญา วิทยาการคอมพิวเตอร์ เป็นข้อได้เปรียบเพิ่มเติมเสมอ
สถิติ: ในการเป็นนักวิเคราะห์ข้อมูลอย่างเต็มตัว จำเป็นต้องมีพื้นฐานทางสถิติอย่างละเอียดถี่ถ้วน ความเชี่ยวชาญด้านสถิติจะช่วยให้คุณ เข้าใจอัลกอริทึม อย่างลึกซึ้งและเมื่อใดควรใช้
ปัดฝุ่นสถิติประยุกต์ พีชคณิตเชิงเส้น การวิเคราะห์จริง ทฤษฎีกราฟ และการวิเคราะห์เชิงตัวเลข พีชคณิตเชิงเส้นเกี่ยวข้องกับการถดถอย การทำความเข้าใจโครงสร้างข้อมูล และการเตรียมข้อมูลสำหรับการสร้างแบบจำลองข้อมูลแบบกำหนดและคาดการณ์
คุณจะเปลี่ยนไปใช้ Data Analytics ได้อย่างไรทักษะการเขียนโปรแกรม
1) ภาษาทางสถิติ:
SAS vs R vs Python : เป็นคำถามที่ต้องใช้ข้อมูลส่วนใหญ่เมื่อต้องเลือกเครื่องมือวิเคราะห์ที่เลือก แม้ว่า SAS (แพง) และ Python (เรียกเก็บเงินสำหรับการประมวลผลข้อมูลในระดับต่ำ) นั้นง่ายต่อการเรียนรู้ แต่ R (ภาษาการเขียนโปรแกรมระดับต่ำ) ก็มีชัย เหนือกว่าด้วยความสามารถในการคำนวณขั้นสูง ความสามารถด้านกราฟิกที่ดีขึ้น และเครื่องมือขั้นสูง
เนื่องจาก R เป็น โอเพ่นซอร์ส คุณลักษณะและแพ็คเกจจึงถูกเพิ่มอย่างรวดเร็วเมื่อเทียบกับ SAS อีกเหตุผลหนึ่งที่ R เฟื่องฟู ก็คือมีระบบนิเวศขนาดใหญ่สำรองไว้ซึ่งรักษาความเร็วให้ทันด้วยคุณสมบัติที่หลากหลาย

เคล็ดลับสำหรับมือโปร : R ดึงดูดใจทางการค้าให้กลายเป็นชื่อครัวเรือน (อ่านว่า บริษัทที่เน้นด้านไอที/เทคโนโลยี) และในขณะที่ SAS ยังคงถูกใช้อย่างแพร่หลายในองค์กรต่างๆ ภาษาทางสถิตินี้ก็ยังเป็นที่ดึงดูดใจ แต่ R มีเส้นโค้งการเรียนรู้ที่สูงชัน
2) แบบสอบถามภาษา:
SQL: หนึ่งในภาษา การ สืบค้นที่เก่าแก่ที่สุด SQL เป็นภาษาฐานข้อมูลเอนกประสงค์ซึ่งใช้สำหรับ แบบสอบถามเชิงวิเคราะห์และเชิงธุรกรรม SQL ถูกใช้เป็นหลักในการดำเนินการแบบวันต่อวันและไม่สามารถรองรับข้อมูลระดับเพตะไบต์ได้ โปรแกรมต่างๆ เช่น บทช่วยสอน Unity สามารถช่วยให้คุณทำความคุ้นเคยกับ PHP และ MySQL ในเชิงลึกยิ่งขึ้น
Hive : ภาษาที่ใช้ค้นหา Hadoop นี้ถูกคิดค้นโดยทีม Data Infrastructure ของ Facebook นับตั้งแต่วันที่ Hive เป็นโอเพ่นซอร์สในปี 2008 Hive ได้กลายเป็น ตัวเลือกยอดนิยมสำหรับนักวิเคราะห์ธุรกิจ โซลูชันคลังข้อมูลโอเพนซอร์สที่ใช้ภาษาประเภท SQL ที่เรียกว่า HQL สามารถรองรับเทราไบต์และเพตะไบต์ของข้อมูลซึ่งต่างจาก SQL ข้อเสียคือ รองรับเฉพาะข้อมูลที่มีโครงสร้างเท่านั้น
5 บทบาทใหม่ในการวิเคราะห์ข้อมูลที่จะกำหนดอนาคตของการธนาคาร 
PIG: หนึ่งในข้อได้เปรียบที่ใหญ่ที่สุดสำหรับ Pig คือสามารถประมวลผลข้อมูลที่มีโครงสร้างและไม่มีโครงสร้าง และ ทำงานบน MapReduce เป็นภาษาที่ใช้สำหรับโปรแกรมเมอร์ส่วนใหญ่ที่มักจะเขียนสคริปต์ สิ่งที่คุณต้องทำคือเรียนรู้ Pig Latin ที่ช่วยจัดการกับโครงสร้าง/ไม่มีโครงสร้างและกึ่งโครงสร้าง ได้ง่ายขึ้นเมื่อเทียบกับ Hive นี่เป็นเกร็ดประวัติศาสตร์เล็กน้อย – Pig ถูกสร้างขึ้นใน Yahoo ในปี 2549 เพื่อทำงาน MapReduce
คำแนะนำอย่างมืออาชีพ: ความรู้เกี่ยวกับ SQL จะช่วยในการรวบรวม Pig and Hive
3) ภาษาสคริปต์:
MATLAB: มันเป็น ภาษาที่ใช้สำหรับการทำเหมืองข้อมูล บางคนอาจโต้แย้งว่าความนิยมลดลง มันจะไม่เจ็บที่จะใส่มันในคลังแสงของคุณ โปรดจำไว้ว่า MATLAB มีมาช้านานแล้ว โดยถูกคิดค้นขึ้นในช่วงปลายยุค 70 เพื่อเป็นเครื่องมือสำหรับการวิเคราะห์ข้อมูล
Python: นี่คือหนึ่งในภาษาสคริปต์ที่ได้รับความนิยมมากที่สุด และความนิยมของมันมาจากสแต็กปัจจุบัน ไลบรารีหลัก NumPy, SciPy, Pandas, matplotlib, IPython สมบูรณ์แบบสำหรับการสร้างแบบจำลองและการวิเคราะห์ มีข้อเสียเปรียบประการหนึ่ง – ความสามารถในการปรับขนาดสำหรับชุดข้อมูลขนาดใหญ่


คำแนะนำแบบมือโปร: Python มีชุมชนที่เข้มแข็ง และเหมาะสำหรับการ ขูดเว็บไซต์และวิศวกรรมข้อมูล คาดเดาอะไร? มันง่ายมากที่ผู้ที่มีพื้นฐานที่ไม่ใช่การเขียนโปรแกรมก็สามารถเชี่ยวชาญได้!
การเรียนรู้ของเครื่อง
การเรียนรู้ของเครื่อง (ML) ไม่ได้เป็นเพียงคำศัพท์เท่านั้น กำลังค้นหาประโยชน์มากมายจากทุกโดเมนและได้รับความสนใจอย่างมาก ดังนั้นจึงกลายเป็นทักษะที่จำเป็นที่ผู้เชี่ยวชาญด้านข้อมูลต้องมี ใน ML การถดถอย การจำแนกประเภท และการแบ่งส่วน เป็นพื้นที่การเรียนรู้แบบกว้างๆ ที่นักวิเคราะห์ควรให้ความสำคัญ
6 แนวโน้มการวิเคราะห์ข้อมูลที่น่าติดตามในปี 2560!การแสดงข้อมูล
คุณมีข้อมูลทั้งหมดนี้ ตอนนี้คุณจะทำให้มันมีชีวิตได้อย่างไร? งานของคุณในฐานะนักวิเคราะห์ข้อมูลคือจัดทำ รายงานที่น่าสนใจ ค้นหาแนวโน้ม และสื่อสารสิ่งที่ค้นพบเหล่านี้ กับผู้เชี่ยวชาญระดับแนวหน้า เครื่องมือสร้างภาพข้อมูลที่จะเชี่ยวชาญ ได้แก่ Tableau, Microsoft Power BI, Oracle Visual Analyser, SAS Visual Analytics ถ้าคุณชอบ R คุณสามารถใช้ แพ็คเกจ ggplot เพื่อสร้างแผนภูมิและกราฟเชิงโต้ตอบระดับสูงได้
เคล็ดลับอย่างมืออาชีพ : อย่าเพียงแค่เรียนรู้เครื่องมือ ลองทำความเข้าใจแรงจูงใจของการเข้ารหัสข้อมูลด้วยสายตาด้วย

คู่มือการเริ่มต้นใช้งาน Data Analytics
ทำความเข้าใจฐานข้อมูล
ใช้เพื่อทำความเข้าใจลูกค้าให้ดีขึ้น โดยพื้นฐานแล้ว การวิเคราะห์ฐานข้อมูลขยายจากการวิเคราะห์พื้นฐานไปจนถึงการทำเหมืองข้อมูลที่ซับซ้อนผ่านเครื่องมือต่างๆ – ระบบข้อมูลทางภูมิศาสตร์ (GIS) หรือการวิเคราะห์ข้อความ ขั้นตอนพื้นฐานสำหรับการวิเคราะห์ฐานข้อมูลคือการแยก ล้าง ผสาน วิเคราะห์ และนำไปใช้
ชำระเงิน: เงินเดือนนักวิเคราะห์ข้อมูลในอินเดีย
Data Munging หรือ Data Wrangling
ก่อนที่คุณจะเริ่มแยกข้อมูลเชิงลึกจากรีมของข้อมูล ข้อมูลจะต้องได้รับการล้าง พูดง่ายๆ ก็คือ ต้องมีบางคนทำหน้าที่ภารโรง ซึ่งหมายความว่า ทำความสะอาดข้อมูลด้วยตนเองและประมวลผล ในรูปแบบที่เป็นหนึ่งเดียวก่อนที่จะวิเคราะห์ จนถึงตอนนี้มีการใช้ excel เพื่อทำความสะอาดและเพิ่มคุณค่าให้กับข้อมูล แต่ Stanford ได้เปิดตัวเครื่องมือแบบอินเทอร์แอกทีฟ ซึ่งเรียกว่า Wrangler ที่อยู่ระหว่างดำเนินการ
เคล็ดลับแบบมือโปร: ลองใช้ Wrangler และดูว่าคุณจัดการข้อมูลในโลกแห่งความเป็นจริงและส่งออกเพื่อใช้ใน Tableau หรือ R ได้อย่างไร

นักวิเคราะห์ข้อมูลไม่ต้องการทักษะขั้นสูงเช่นนักวิทยาศาสตร์ข้อมูล อย่างไรก็ตาม เนื่องจากบทบาทเหล่านี้มีหลายแง่มุมและการเรียนรู้เป็นกระบวนการที่ต่อเนื่อง ด้วยแหล่งข้อมูลเพิ่มเติม คุณก็สามารถเป็นนักวิทยาศาสตร์ข้อมูลรุ่นเยาว์ได้เช่นกัน
โดยพื้นฐานแล้ว คณิตศาสตร์และสถิติ (32%) วิทยาการคอมพิวเตอร์ (19%) และวิศวกรรมศาสตร์ (16%) เป็นสาขาวิชาที่สำคัญที่สุดสำหรับนักวิทยาศาสตร์ข้อมูล โดยทั่วไปแล้วนักวิเคราะห์ข้อมูลควรมีความเชี่ยวชาญด้านภาษา เช่น SAS และ/หรือ R
ฉันจะเพิ่มเงินเดือนเป็นสองเท่าได้อย่างไร การวิเคราะห์ข้อมูลคือคำตอบของคุณขอแนะนำสำหรับผู้ที่มีพื้นฐานด้านวิทยาการคอมพิวเตอร์ให้รู้จักการเข้ารหัส Python, Hadoop และ SQL นอกจากนี้ การทำงานกับข้อมูลที่ไม่มีโครงสร้างเป็นส่วนสำคัญของงานวิเคราะห์ข้อมูล เป็นความคิดที่ดีที่จะทำความคุ้นเคยกับฐานข้อมูลที่ไม่มีโครงสร้าง ยิ่งไปกว่านั้น นักวิเคราะห์ข้อมูลจะต้องซึมซับคุณสมบัติ เช่น การพัฒนาความเฉียบแหลมทางธุรกิจ หรือทักษะการสื่อสาร/การนำเสนอที่ดี เนื่องจากทักษะเหล่านี้จะช่วยให้นำหน้าเกมได้
เรียนรู้ หลักสูตรวิทยาศาสตร์ข้อมูล ออนไลน์จากมหาวิทยาลัยชั้นนำของโลก รับโปรแกรม PG สำหรับผู้บริหาร โปรแกรมประกาศนียบัตรขั้นสูง หรือโปรแกรมปริญญาโท เพื่อติดตามอาชีพของคุณอย่างรวดเร็ว
โพสต์นี้เผยแพร่ครั้งแรกในนิตยสาร Analytics India
ภาษาการเข้ารหัสใดที่ต้องการสำหรับ Data Analytics
Python เป็นภาษาโปรแกรมวิเคราะห์ข้อมูลที่ใช้มากที่สุดในโลก เป็นภาษาโปรแกรมโอเพนซอร์สที่เป็นมิตรกับผู้ใช้ซึ่งมีมาตั้งแต่ปี มันยังเป็นหนึ่งในภาษาโปรแกรมที่สะดวกที่สุดที่มีอยู่เนื่องจากรูปแบบที่เรียบง่ายและไม่มีความยุ่งยากซับซ้อน ซึ่งช่วยในการเน้นที่ภาษาธรรมชาติ สคริปต์ของ Python อาจถูกสร้างขึ้นและดำเนินการได้เร็วกว่าภาษาโปรแกรมอื่น ๆ เนื่องจากความง่ายในการทำความเข้าใจและการใช้งาน
หัวข้อทางคณิตศาสตร์ที่จำเป็นสำหรับการวิเคราะห์ข้อมูลมีอะไรบ้าง
ความรู้เกี่ยวกับเลขคณิตพื้นฐานมีความสำคัญมากสำหรับผู้เริ่มต้นเกี่ยวกับวิทยาศาสตร์ข้อมูลในสาขาอื่นๆ คุณจะต้องมีความเข้าใจอย่างถ่องแท้ในวิชาคณิตศาสตร์ เช่นเดียวกับความสามารถในการรวมตัวเลขเพื่อสร้างการวัดใหม่อย่างน่าเชื่อถือ เพื่อตอบสนองความต้องการทางการค้าทั่วไป เช่น ดอกเบี้ยทบต้นหรือค่าเสื่อมราคา นักวิเคราะห์ข้อมูลควรทำความคุ้นเคยกับสถิติและคณิตศาสตร์ด้วย สถิติและความน่าจะเป็น พีชคณิต (พื้นฐานและเชิงเส้น) แคลคูลัส และคณิตศาสตร์แบบไม่ต่อเนื่องเป็นสาขาวิชาคณิตศาสตร์พื้นฐานสี่สาขาสำหรับนักวิเคราะห์ข้อมูล
การเรียนรู้ Data Analytics คุ้มค่าหรือไม่
การวิเคราะห์ข้อมูลอาจจำเป็นต้องมีความเข้าใจล่วงหน้าในบางพื้นที่ เช่น ภาษาโปรแกรม เช่น R, Python และอื่นๆ รวมถึงแนวคิดทางคณิตศาสตร์และสถิติ อย่างไรก็ตาม หัวข้อเหล่านี้สามารถศึกษาได้ด้วย Data Analytics คุณสามารถได้รับโอกาสในการจ้างงานที่หลากหลายโดยการเรียนรู้การวิเคราะห์ข้อมูล ซึ่งรวมถึงนักวิเคราะห์ธุรกิจ นักวิทยาศาสตร์ข้อมูล และนักวิเคราะห์ข้อมูล งานเหล่านี้จ่ายได้ดีและมีโอกาสก้าวหน้าที่สำคัญกว่า อาชีพเหล่านี้เกี่ยวข้องกับการจัดเรียงข้อมูลเพื่อให้ทั้งคนและหุ่นยนต์สามารถเข้าใจได้
