“Data is the New Oil” หรือข้อมูลเปรียบเสมือนน้ำมัน เป็นคำพูดที่เรามักจะได้ยินกันบ่อยมากขึ้นในวงการของโลกธุรกิจ แต่ในฝั่งของวงการเทคโนโลยี เรียกได้ว่าแทบทุกคนรู้เป็นอย่างดีเหมือนเป็นยีนส์หนึ่งในโครงสร้างพันธุกรรมเข้าไปแล้ว อย่างไรก็ตามหากเราในฐานะคนธรรมดาตระหนักคิดถึงคำว่า “Data is the New Oil”เราอาจมองภาพไม่ออกว่าข้อมูลมันจะสามารถเทียบเท่ากับน้ำมันได้อย่างไร มันมีประโยชน์ขนาดไหน และมีมูลค่าอย่างไร
กว่าจะเป็นน้ำมันที่เรานำมาใช้ต้องผ่านโรงกลั่นฉันใด ข้อมูลที่มากมายมหาศาลย่อมต้องผ่านการกลั่นฉันนั้น เพียงแต่วิธีการกลั่นกรองหรือวิเคราะห์ข้อมูลอาจดูแปลกใหม่และไม่ตายตัว ฉะนั้นจึงต้องมีคนที่สามารถเข้าใจถึงคุณค่าของข้อมูลที่กระจัดกระจายอย่างมหาศาล และรู้วิธีการจัดระเบียบ วิเคราะห์ และสังเคราะห์มันออกมายังไง และคน ๆ นั้นคือ Data Scientist หรือ นักวิทยาศาสตร์ข้อมูล ที่เรากำลังจะพูดถึงในบทความนี้นั่นเอง
Data Scientist คือใคร ทำอะไร?
Data Scientist หรือแปลเป็นไทยว่านักวิทยาศาสตร์ข้อมูล ไม่ใช่นักวิทยาศาสตร์ที่ต้องทำงานในห้องทดลอง แต่อาชีพนี้เกิดขึ้นเพื่อตอบสนองโลกไอทีและโลกธุรกิจในปัจจุบัน นับว่าเป็นอาชีพใหม่ที่กำลังมาแรงและเริ่มเป็นที่รู้จักกันแล้ว จากที่กล่าวไปข้างต้นว่าอาชีพนี้ต้องตอบโจทย์ทางด้านธุรกิจและมีความชำนาญด้านเทคโนโลยีด้วย ดังนั้นจึงต้องเป็นรับบทบาทนักคณิตศาสตร์ นักสถิติ นักวิทยาการคอมพิวเตอร์ นักวิเคราะห์ นักการตลาด และนักธุรกิจ ฉะนั้นอาชีพนี้จึงเป็นอาชีพที่หาตัวจับยาก นอกจากนั้นยังเป็นอาชีพที่มีรายได้สูงอีกด้วย
หน้าที่หลักของ Data scientist คือวิเคราะห์ข้อมูลเชิงสถิติเพื่อหาข้อสรุปจากข้อมูลที่มี และนำข้อมูลนั้นไปใช้ต่อยอดหรือส่งต่อไปให้กับผู้อื่นหรือฝ่ายอื่นที่จะสามารถนำไปใช้ประยุกต์เข้ากับงานของตนเอง หากแบ่งหน้าที่ของ Data scientist ให้ลึกลงไปอีกอาจแบ่งได้ดังนี้
- Understand Business Problems เข้าใจปัญหาที่ต้องการแก้ลงมือแก้ไข ซึ่งจะสามารถเข้าใจได้ก็ต่อเมื่อมีการตั้งคำถาม (Define Question) ตั้งวัตถุประสงค์ (Define Objective of The Problem)
- Data Acquisition คือการเก็บรวบรวมข้อมูล ไม่ว่าจะเป็นข้อมูลจากการสอบถาม จากการทำแบบประเมิน จากฐานข้อมูลที่มีอยู่แล้ว และ/หรืออื่น ๆ
- Data Preparation การเตรียมข้อมูล ไม่ว่าจะเป็นการตัดข้อมูลที่ไม่จำเป็นหรือเป็นข้อมูลเท็จทิ้งไป รวมถึงจัดและปรับแต่งข้อมูลให้พร้อมสำหรับการนำไปวิเคราะห์
- Exploratory Data Analysis (EDA) คือการวิเคราะห์ข้อมูลที่จำเป็นก่อนจะนำไปวิเคราะห์ข้อมูลแบบอื่น ๆ ข้อมูลจากการวิเคราะห์ในขั้นนี้จะช่วยให้เห็นภาพรวมของกลุ่มเป้าหมายที่เป็นผู้ให้ข้อมูลและสามารถทำให้เห็น Insight ของกลุ่มเป้าหมายได้ด้วย
- Data Modeling คือการออกแบบโมเดลที่จะสามารถนำข้อมูลที่ได้เข้ามาวิเคราะห์ในเชิงลึกและใช้ให้เกิดประโยชน์รวมถึงตอบโจทย์ที่ต้องการมากขึ้น ขั้นตอนนี้รวมถึงการทดสอบข้อมูลหลาย ๆ ครั้งเพื่อหาโมเดลที่เหมาะสมกับข้อมูลที่สุด
- Visualization และ Communication คือการนำผลการวิเคราะห์ข้อมูลทั้งหมดมาประมวลผลเป็นภาพเพื่อให้ง่านต่อการสื่อสารและง่ายต่อการสร้างความเข้าใจ
- Deploy and Maintains / Optimization คือการดูแลลระบบหรือโมเดลที่ถูกออกแบบมาให้สามารถใช้การได้อย่างมีประสิทธิภาพและรักษามาตรฐานให้ดีอยู่อย่างสม่ำเสมอนั่นเอง ทั้งนี้อาจหมายรวมถึงการร่วมมือกับฝ่ายอื่นเช่น Data Engineer เพื่อพัฒนาระบบให้ดีขึ้นกว่าเดิมและประมวลผลได้ง่ายขึ้นโดยใช้ทรัพยากรน้อยลง
จากหน้าที่ของ Data Scientist ที่กล่าวมาข้างต้น ทำให้เห็นว่าการจะประกอบอาชีพนี้ได้ต้องมีความชำนาญเฉพาะด้าน และในขณะเดียวกันต้องมีทักษะที่สำคัญด้านอื่น ๆ อีกด้วย เป็นเหตุผลสำคัญว่าเหตุใดอาชีพนี้จึงมีความต้องการในตลาดสูง และมีราคาที่บริษัทยอมจ่ายเงินให้ค่อนข้างมาก นอกจากความสำคัญที่มีต่อบริษัทแล้วอาชีพนี้มีความสำคัญอย่างไรอีก?
ขณะที่สถาบัน McKindsey วิเคราะห์ว่าข้อมูลมหาศาลหรือ Big Data สามารถเปลี่ยนเป็นมูลค่าได้มากถึง 3 ล้านล้านดอลลาร์จากเพียง 7 บริษัทใหญ่เท่านั้น และเมื่อ 5 บริษัทยักษ์ใหญ่ได้แก่ Amazon, Google, Apple, Microsoft และ Facebook นอกจากจะถือครองข้อมูลจำนวนมหาศาลของผู้ใช้งานแล้วยังมีรายได้ติดอันดับ top 10 ของสหรัฐอเมริกาด้วย (และในระดับโลก) สังเกตได้ว่าเม็ดเงินและจำนวนข้อมูลขนั้นสัมพันธ์ไปในทิศทางเดียวกันอย่างไม่น่าเชื่อ จึงเกิดเป็นประเด็นสำคัญที่นักเศรษฐศาสตร์ให้ความสนใจมากขึ้น
Data Scientist และ เศรษฐกิจ
“นักเศรษฐศาสตร์กำลังตื่นเต้นกับ ความสามารถในการวิเคราะห์และการประเมินข้อมูลจำนวนมหาศาลที่แพร่หลายเป็นวงกว้าง เพราะข้อมูลเหล่านี้ล้วนมีผลต่อการเปลี่ยนแปลงเศรษฐกิจทั้งสิ้น”
Suresh Naidu รองศาสตราจารย์คณะเศรษฐศาสตร์ มหาวิทยาลัยโคลัมเบีย
Erik Brynjolfsson จาก MIT พบว่าบริษัทที่มีการใช้ข้อมูลมาช่วยในการตัดสินใจสามารถเติบโตได้มากกว่า 5-6% เมื่อเทียบกับบริษัทที่มีขนาดเดียวกัน นอกจากนี้การอ้างอิงจากข้อมูลประกอบกับการใช้เทคโนโลยีเข้ามาช่วยสามารถช่วยให้บริษัทสามารถคำนวณเงินในการลงทุนได้แม่นยำขึ้นและยังเพิ่มมูลค่าทางการตลาดให้กับบริษัทได้เช่นกัน
นอกจากนี้ยังมีการศึกษาจาก The Omidyar Network พบว่าผลของนโยบาย Open Data หรือการที่ทุกคนสามารถนำข้อมูลไปใช้ได้โดยอิสระ สามารถเพิ่มรายได้อยู่ในระหว่าง 7 – 9.5 แสนล้านดอลลาร์สหรัฐเลยทีเดียว และยังพบว่านโยบายดังกล่าวนี้ช่วยลดการคอรัปชั่น กระตุ้นการอยากทำงาน และยังส่งเสริมด้านการค้าระหว่างประเทศอีกด้วย
หรือแม้กระทั่งที่ใกล้ตัวเราที่สุดคือโฆษณาสินค้า บริษัทเจ้าของผลิตภัณฑ์ล้วนมีข้อมูลด้านการซื้อขายของเรา และสามารถรู้ว่าในช่วงไหนเรากำลังสนใจอะไรจึงสามารถยิงโฆษณาที่สอดคล้องกับความต้องการหรือความสนใจของเรา ณ ขณะนั้น มาได้อย่างถูกต้อง นอกจากจะมีประสิทธิภาพแล้วยังเป็นการลดต้นทุนด้านการโฆษณาอีกด้วย เพราะสามารถตัดกลุ่มคนอื่นที่ไม่ใช่ฐานลูกค้าของตนออกไปได้ ไม่ใช่เพียงแต่เจ้าของแบรนด์ยักษ์ใหญ่เท่านั้นที่จะได้ประโยชน์จากสิ่งเหล่านี้ ผู้ค้ารายย่อยหรือธุรกิจขนาดเล็กเองก็สามารถเข้ามาใช้ประโยชน์จากข้อมูลเหล่านี้ได้เช่นกัน เท่ากับว่าข้อมูลที่มีกระตุ้นเศรษฐกิจให้มีเงินหมุนวนอยู่ได้ตลอดเวลา แต่ในขณะเดียวกันนั้นเองก็มีเรื่องของสินค้าจากต่างประเทศที่เข้ามาใช้ตลาดออนไลน์ของไทย ทำให้ก็มีผลต่อเงินบางส่วนที่ต้องไหลออกไปนอกกประเทศซึ่งกระทบต่อรายได้ของประเทศในอีกมิติหนึ่งเช่นเดียวกัน
ข้อมูลอันมหาศาลที่วนเวียนอยู่ในทุกจังหวะของการใช้ชีวิตของมนุษย์เริ่มกลายเป็นทรัพยากรที่มีคุณค่ามหาศาล และแน่นอนว่าจะตามมาซึ่งราคาอันมหาศาลเช่นเดียวกัน เพียงแต่ต้องมีการกลั่นกรองและหยิบในส่วนที่เป็นชิ้นสำคัญต่อธุรกิจหรือตรงกับความต้องการจริง ๆ ออกมาใช้ ซึ่งโรงกลั่นสำคัญนั้นจะเป็นใครไปไม่ได้นอกจาก Data Scientist หรือนักวิทยาศาสตร์ข้อมูลนั่นเอง หากท่านกำลังสนใจในสายอาชีพนี้ ถึงเวลาแล้วที่ควรเริ่มศึกษาอย่างจริงจัง เพราะอีกไม่นานข้อมูลบนโลกออนไลน์ของเราก็จะยิ่งมากขึ้น ความสนุกก็จะยิ่งมากขึ้น ในขณะเดียวกันคู่แข่งเราก็จะมีมากขึ้นไม่ต่างกัน
โดย ปกรณ์ นาวาจะ
Source:
https://medium.com/@thanyavuth/data-scientist-%E0%B8%97%E0%B8%B3%E0%B8%AD%E0%B8%B0%E0%B9%84%E0%B8%A3-%E0%B8%AD%E0%B8%A2%E0%B8%B2%E0%B8%81%E0%B9%80%E0%B8%9B%E0%B9%87%E0%B8%99%E0%B8%95%E0%B9%89%E0%B8%AD%E0%B8%87%E0%B8%97%E0%B8%B3%E0%B8%AD%E0%B8%A2%E0%B9%88%E0%B8%B2%E0%B8%87%E0%B9%84%E0%B8%A3-16f1e8028d72
https://www.youtube.com/watch?time_continue=182&v=X3paOmcrTjQ&feature=emb_logo