หนึ่งวันในชีวิตของนักวิทยาศาสตร์ข้อมูล

คู่มืออาชีพนักวิทยาศาสตร์ข้อมูลของ BrainStation สามารถช่วยให้คุณก้าวแรกสู่อาชีพที่ร่ำรวยในด้านวิทยาศาสตร์ข้อมูล อ่านต่อไปเพื่อดูภาพรวมว่า Data Scientists ใช้เวลาในที่ทำงานอย่างไร



มาเป็นนักวิทยาศาสตร์ข้อมูล

พูดคุยกับที่ปรึกษาการเรียนรู้เพื่อเรียนรู้เพิ่มเติมว่าหลักสูตรติวเข้มและหลักสูตรของเราสามารถช่วยให้คุณเป็นนักวิทยาศาสตร์ข้อมูลได้อย่างไร



การคลิกส่งแสดงว่าคุณยอมรับ เงื่อนไข .



ส่ง

ส่งไม่ได้! รีเฟรชหน้าแล้วลองอีกครั้งไหม

เรียนรู้เพิ่มเติมเกี่ยวกับ Data Science Bootcamp ของเรา

ขอขอบคุณ!

เราจะติดต่อกลับไปในไม่ช้า



ดูหน้า Data Science Bootcamp

หนึ่งวันในชีวิตของนักวิทยาศาสตร์ข้อมูล

ในทุกสาขาวิชาที่ตรวจสอบในการสำรวจทักษะดิจิทัลของ Brainstation วิทยาศาสตร์ข้อมูลอาจครอบคลุมการใช้งานที่หลากหลายที่สุด แม้ว่าวิทยาศาสตร์ข้อมูลจะมีมานานหลายทศวรรษแล้ว แต่เพิ่งจะบานเต็มที่ เมื่อความพร้อมใช้งานของข้อมูลเพิ่มขึ้น บริษัทต่างๆ ได้ตระหนักว่าวิทยาศาสตร์ข้อมูลมีความสำคัญเพียงใด Briana Brownell ผู้ก่อตั้งและซีอีโอของ Pure Strategy และ Data Scientist เป็นเวลา 13 ปีกล่าว ปัจจุบันทุกบริษัทจำเป็นต้องให้ความสำคัญกับเทคโนโลยีบางส่วน ตัวอย่างเช่น ในสัปดาห์นี้ แมคโดนัลด์จ่ายเงินประมาณ 300 ล้านดอลลาร์เพื่อซื้อบริษัทข้อมูลขนาดใหญ่ของตัวเอง

ไม่น่าแปลกใจเลยที่การแข่งขันของ Data Scientists นั้นสูงอย่างไม่น่าเชื่อ ในเวลาเพียงสองปี ความต้องการคาดว่าจะเพิ่มขึ้นร้อยละ 28 เทียบเท่ากับงานใหม่ประมาณ 2.7 ล้านตำแหน่ง นั่นเป็นการเปิดกว้างมากกว่าที่ผู้สำเร็จการศึกษาใหม่จะสามารถเติมเต็มได้ ซึ่งหมายความว่าพนักงานด้านเทคนิคในสาขาอื่น ๆ จะต้องปรับปรุงทักษะและเปลี่ยนเป็นข้อมูลเพื่อตอบสนองความต้องการนี้

อันที่จริง การสำรวจของเราชี้ให้เห็นว่าสิ่งนี้กำลังเกิดขึ้นแล้ว ผู้เชี่ยวชาญด้านข้อมูลประมาณสี่ในห้าเริ่มอาชีพทำอย่างอื่น และ 65 เปอร์เซ็นต์ของนักวิทยาศาสตร์ข้อมูลทั้งหมดทำงานในสาขานี้มาเป็นเวลาห้าปีหรือน้อยกว่านั้น การไหลบ่าเข้ามาของความคิดใหม่นี้มีผลสองด้าน Brownell กล่าว; ด้านหนึ่งมีแนวคิดใหม่ๆ เข้ามามากมาย เธอกล่าว เมื่อฉันดูเนื้อหาบางส่วนที่ออกมาจากชุมชนวิทยาศาสตร์ข้อมูล ฉันรู้สึกประหลาดใจที่มีนวัตกรรมมากมาย ด้านพลิกกลับเป็นแนวโน้มที่จะคิดค้นล้อใหม่



ความต้องการสูงสำหรับ Data Scientists นั้นยอดเยี่ยมหากคุณเป็นหนึ่งเดียวกัน (หรือกำลังคิดที่จะเป็นหนึ่งเดียวกัน) แต่สำหรับนายจ้าง การสรรหาบุคลากรอาจเป็นความท้าทายที่น่ากลัว ที่นี่ การปรับทักษะใหม่เป็นวิธีแก้ปัญหาที่ชัดเจน การฝึกอบรมพนักงานปัจจุบันในสาขาวิทยาศาสตร์ข้อมูลอาจคุ้มทุนมากกว่าการตามล่าหาพนักงานใหม่

แม้ว่าคุณจะวางแผนที่จะจ้างทีม Data Science ใหม่ แต่องค์กรของคุณโดยรวมอาจจำเป็นต้องปรับปรุงการรู้เท่าทันข้อมูล คำเตือนของ Brownell ทุกคนต้องการทำงานบางอย่างที่มีผลกระทบต่อสถานที่ทำงาน ซึ่งทำให้ชีวิตของผู้คนดีขึ้น เธอกล่าว หากวัฒนธรรมบริษัทของคุณไม่เป็นเช่นนั้น [your Data Scientists] สามารถสร้างผลกระทบได้ ก็แทบจะเป็นไปไม่ได้เลยที่จะจ้าง ความเป็นผู้นำจะต้องมีความสามารถไม่เพียงแต่สื่อสารกับผู้ที่มีแนวโน้มว่าจะจ้างได้ว่าพวกเขาจะสามารถมีส่วนร่วมได้อย่างไร—แต่ต้องเข้าใจข้อเสนอที่ทีมวิทยาศาสตร์ข้อมูลของพวกเขาเสนอในที่สุดเช่นกัน

น่าเสียดายที่ Brownell กล่าวว่า บริษัทส่วนใหญ่ที่ไม่สบายใจคือบริษัทที่ไม่ได้คิดออก แบบสำรวจของเราสนับสนุนสิ่งนี้: ผู้ตอบแบบสอบถามส่วนใหญ่ (52 เปอร์เซ็นต์) อธิบายระดับของการรู้เท่าทันข้อมูลทั่วทั้งองค์กรว่าเป็นระดับพื้นฐาน โดยมีระดับกลางเป็นคำตอบที่พบบ่อยที่สุดถัดไป (31 เปอร์เซ็นต์) นี่แสดงให้เห็นว่าการฝึกอบรมด้านวิทยาศาสตร์ข้อมูลพื้นฐานบางอย่างอาจเป็นประโยชน์สำหรับบริษัทส่วนใหญ่โดยเฉพาะในด้านความเป็นผู้นำ



ความจำเป็นในการปรับปรุงการรู้เท่าทันข้อมูลและการสื่อสารนั้นเพิ่มมากขึ้นโดยวิธีการจัดโครงสร้างทีมวิทยาศาสตร์ข้อมูลส่วนใหญ่: ในฐานะทีมที่ไม่ต่อเนื่อง โดยปกติจะมี 10 คนหรือน้อยกว่า (ตาม 71 เปอร์เซ็นต์ของผู้ตอบแบบสอบถาม) และมักมีห้าคนหรือน้อยกว่า (38 เปอร์เซ็นต์) ). ทีมที่แน่นแฟ้นเหล่านี้ไม่สามารถแยกออกได้ บุคคลที่ทำงานในบริษัทขนาดใหญ่มักจะอยู่ในกลุ่มเฉพาะด้านวิทยาศาสตร์ข้อมูลขนาดเล็ก และลูกค้าของพวกเขาอยู่ในองค์กร—ส่วนอื่น ๆ ขององค์กร Brownell อธิบาย ดังนั้นจึงเป็นทีมที่ต้องดำเนินการในพื้นที่ต่างๆ มากมายขององค์กร

วิทยาศาสตร์ข้อมูลคืออะไรกันแน่?

การรับรู้ทั่วไป (นักวิทยาศาสตร์ข้อมูลบีบอัดตัวเลข) อยู่ไม่ไกลเกินไป Brownell กล่าว มีชุดข้อมูลจำนวนมากที่จำเป็นต้องมีการเปิดเผยข้อมูลเชิงลึก ซึ่งเกี่ยวข้องกับขั้นตอนมากมาย เช่น การสร้างแบบจำลองและการล้างข้อมูล และแม้กระทั่งการตัดสินใจว่าต้องการข้อมูลใด แม้ว่าในท้ายที่สุดแล้ว ความพยายามนี้จะเน้นไปที่เป้าหมาย: โดยพื้นฐานแล้ว คุณต้องทำอะไรบางอย่างกับข้อมูล

สำหรับเรื่องนั้น ข้อมูลไม่ใช่ตัวเลขเสมอไป ในขณะที่ผู้ตอบแบบสอบถามส่วนใหญ่ (73 เปอร์เซ็นต์) ระบุว่าพวกเขาทำงานกับข้อมูลตัวเลข 61 เปอร์เซ็นต์กล่าวว่าพวกเขายังทำงานกับข้อความ, 44 เปอร์เซ็นต์กับข้อมูลที่มีโครงสร้าง, 13 เปอร์เซ็นต์สำหรับรูปภาพและ 12 เปอร์เซ็นต์สำหรับกราฟิก (และชนกลุ่มน้อยขนาดเล็กใช้งานได้กับวิดีโอและเสียง —6 เปอร์เซ็นต์ และ 4 เปอร์เซ็นต์ ตามลำดับ) ผลการสำรวจเหล่านี้ชี้ให้เห็นถึงวิธีที่วิทยาศาสตร์ข้อมูลขยายออกไปไกลกว่าตารางทางการเงิน เกณฑ์คนสำหรับโครงการเช่นการเพิ่มความพึงพอใจของลูกค้าหรือการรวบรวมข้อมูลเชิงลึกอันมีค่าจากท่อดับเพลิงของโซเชียลมีเดีย

ด้วยเหตุนี้ ในสาขาวิทยาศาสตร์ข้อมูลจึงมีความหลากหลายอย่างมาก Brownell กล่าว ทุกอุตสาหกรรมมีความเฉพาะตัวในเรื่องประเภทของข้อมูลที่นักวิทยาศาสตร์ข้อมูลทำงาน ประเภทของผลลัพธ์ที่พวกเขาคาดหวัง และวิธีการที่สอดคล้องกับโครงสร้างความเป็นผู้นำของบริษัท อย่างไรก็ตาม เป้าหมายคือการใช้ประโยชน์จากข้อมูลเพื่อช่วยให้บริษัทตัดสินใจได้ดีขึ้นในทุกกรณี นั่นอาจทำให้ผลิตภัณฑ์ดีขึ้น เข้าใจตลาดที่พวกเขาต้องการเข้าไป รักษาลูกค้ามากขึ้น เข้าใจการใช้กำลังแรงงาน เข้าใจวิธีการจ้างงานที่ดี—สิ่งที่แตกต่างกัน

งานวิทยาศาสตร์ข้อมูล

ในบางพื้นที่ของเทคโนโลยี การกลายเป็นคนทั่วไปอาจเป็นจุดเริ่มต้นที่ดีที่สุดของคุณ—ไม่ใช่ด้วยวิทยาศาสตร์ข้อมูล นายจ้างมักมองหาทักษะเฉพาะทางในอุตสาหกรรมของตน เนื่องจากวิทยาการข้อมูลมีหลายรสชาติ แบบสำรวจของเราจึงเจาะลึกลงไป โดยตรวจสอบหมวดหมู่งานหลักห้าประเภท: นักวิเคราะห์ข้อมูล นักวิจัย นักวิเคราะห์ธุรกิจ ผู้จัดการข้อมูลและการวิเคราะห์ และนักวิทยาศาสตร์ข้อมูลอย่างเหมาะสม

ในบรรดาตำแหน่งงานทั้งหมด การทะเลาะวิวาทข้อมูลและการล้างข้อมูลใช้เวลานานมาก แต่เพื่ออะไร โดยส่วนใหญ่ เป้าหมายคือการเพิ่มประสิทธิภาพแพลตฟอร์ม ผลิตภัณฑ์ หรือระบบที่มีอยู่ (45 เปอร์เซ็นต์) หรือเพื่อพัฒนาแพลตฟอร์มใหม่ (42 เปอร์เซ็นต์) จากการเจาะลึกลงไปอีก เราพบว่าการเพิ่มประสิทธิภาพโซลูชันที่มีอยู่มักจะตกเป็นของนักวิเคราะห์ธุรกิจและนักวิเคราะห์ข้อมูล ในขณะที่การพัฒนาโซลูชันใหม่ๆ มักตกเป็นของนักวิทยาศาสตร์ข้อมูลและนักวิจัยมากกว่า

เทคนิคที่ Data Scientist ใช้แตกต่างกันไปตามความเชี่ยวชาญเฉพาะทางเช่นกัน การถดถอยเชิงเส้นเป็นเครื่องมือทั่วไปในทุกประเภท โดย 54 เปอร์เซ็นต์ของผู้ตอบแบบสอบถามอ้างถึง แต่มีความประหลาดใจเล็กน้อยเมื่อเราดูซอฟต์แวร์ที่ผู้คนใช้

Excel ซึ่งเป็นเครื่องมือหลักของการจัดการชุดข้อมูลนั้นมีอยู่ทั่วไป โดยมีผู้ตอบแบบสำรวจถึง 81 เปอร์เซ็นต์ และเป็นเครื่องมือที่ได้รับความนิยมมากที่สุดในทุกหมวด ยกเว้น Data Scientists ที่เหมาะสม (ซึ่งส่วนใหญ่ใช้ Python บ่อยที่สุด—และยังอ้างถึงชุดเครื่องมือที่ใหญ่กว่าหมวดหมู่อื่นๆ ด้วย) ). อะไรทำให้ Excel หลีกเลี่ยงไม่ได้แม้แต่ในปี 2019

สิ่งที่ฉันชอบเกี่ยวกับ Excel คือการที่มันช่วยให้คุณเห็นข้อมูลและสัมผัสได้ถึงความรู้สึกที่เป็นธรรมชาติ Brownell อธิบาย เรายังใช้ Python เป็นจำนวนมาก และในกรณีนั้น เมื่อคุณทำการวิเคราะห์ในไฟล์ข้อมูล ไฟล์นั้นจะถูกซ่อนไว้ เว้นแต่คุณจะตั้งโปรแกรมส่วนหนึ่งของโค้ดของคุณโดยเฉพาะเพื่อให้เห็นภาพข้อมูลดิบที่คุณกำลังวิเคราะห์ คุณจะไม่เห็นมัน ในขณะที่ Excel อยู่ตรงหน้าคุณ ที่มีข้อดีมากมาย บางครั้งคุณอาจพบปัญหาเกี่ยวกับไฟล์ข้อมูล ฉันไม่เห็น Excel หายไปจากการวิเคราะห์เลย

ที่กล่าวว่ายังคงมีรายการยาวของโปรแกรมอื่น ๆ ที่ใช้ในภาคสนาม - ไม่น่าแปลกใจเลยที่ความหลากหลาย SQL (43 เปอร์เซ็นต์) และ Python (26 เปอร์เซ็นต์) เป็นผู้นำในด้านความนิยม โดยมี Tableau (23 เปอร์เซ็นต์), R (16 เปอร์เซ็นต์), Jupyter Notebooks (14 เปอร์เซ็นต์) และอีกไม่กี่คนที่ทำคะแนนได้เป็นจำนวนมาก ไม่ต้องพูดถึงสิ่งที่ยิ่งใหญ่ 32% ของผู้ตอบแบบสอบถามที่อ้างถึงเครื่องมืออื่นๆ แม้จะระบุรายชื่อยาวเหยียดอยู่แล้วก็ตาม

อนาคตของวิทยาศาสตร์ข้อมูลคืออะไร?

สุดท้าย เราถามถึงแนวโน้มที่จะกำหนดทิศทางดิจิทัลในอีก 5-10 ปีข้างหน้า แมชชีนเลิร์นนิงและ AI ซึ่งทั้งคู่มีแอปพลิเคชันภายในวิทยาศาสตร์ข้อมูล เป็นผู้ตอบแบบสอบถามด้านการพัฒนาคาดว่าจะส่งผลกระทบมากที่สุดอย่างท่วมท้นที่ 80 เปอร์เซ็นต์และ 79 เปอร์เซ็นต์ตามลำดับ แม้ว่าปัจจุบันน้อยกว่าหนึ่งในสี่ (23 เปอร์เซ็นต์) ของพวกเขาทำงานร่วมกับ AI

ปัญญาประดิษฐ์สามารถเปลี่ยนวิทยาศาสตร์ข้อมูลได้อย่างแน่นอน Brownell ซึ่งบริษัทผู้พัฒนาผลิตภัณฑ์ AI ยืนยันว่า นั่นเป็นความรุ่งโรจน์ของวิธีการเรียนรู้ที่ไม่มีผู้ดูแลจริงๆ เรามีเวลาเหลือเฟือที่จะดูชุดข้อมูลเหล่านี้ และโดยเฉพาะอย่างยิ่งกับชุดข้อมูลขนาดใหญ่ มันยากมากที่จะทำทุกอย่าง เครื่องมือ AI สามารถช่วยเปิดเผยบางสิ่งที่คุณอาจไม่คิดว่าจะมองหา เราเคยมีสิ่งนั้นเกิดขึ้นอย่างแน่นอน

แนวโน้มอื่นๆ ที่ Data Scientist คาดว่าจะครองในอนาคตอันใกล้นี้ ได้แก่ อินเทอร์เน็ตของสรรพสิ่ง (51 เปอร์เซ็นต์), บล็อกเชน (50 เปอร์เซ็นต์) และอีคอมเมิร์ซ (36 เปอร์เซ็นต์), ความเป็นจริงเสริมและความเป็นจริงเสมือน (38 เปอร์เซ็นต์และ 27 เปอร์เซ็นต์) และแม้แต่เสียง- จากประสบการณ์ (25 เปอร์เซ็นต์)—การจัดแสดงที่สำคัญทั้งหมด และทุกด้านที่วิทยาศาสตร์ข้อมูลสามารถนำไปใช้ให้เกิดประโยชน์ได้

Kategori: ข่าว