การจัดการความรู้ |
ความรู้เบื้องต้นเกี่ยวกับวิทยาศาสตร์ข้อมูลและการคิดเชิงวิเคราะห์ เพื่อสกัดองค์ความรู้จากข้อมูลขนาดใหญ่ในปัจจุบัน
post: 2022-09-22 10:31:55 by: วันนเรศวร์ สิงหัษฐิต views: 164 กลุ่ม: IT UBU |
วิทยาศาสตร์ข้อมูล (Data science) เป็นวิวัฒนาการขององค์ความรู้รูปแบบหนึ่งที่เกิดจากการรวมกันระหว่างความรู้ในแต่ละด้านเช่น ด้านเทคโนโลยี สถิติ ธุรกิจ เป็นต้น เพื่อใช้ในการวิเคราะห์ข้อมูลที่มีอยู่ให้เกิดองค์ความรู้หรือประโยชน์ โดยการวิเคราะห์ข้อมูล (Data Analysis) คือ ทักษะความเข้าใจที่เกี่ยวข้องกับสายงานทั้งทางธุรกิจและทางวิชาการ ส่วนใหญ่ในทางธุรกิจจะเอาข้อมูลมาวิเคราะห์แนวโน้มพฤติกรรมลูกค้าขององค์กร ผู้รับการบริการ โดยใช้สถิติและตัวเลขในการคาดคะเนพฤติกรรมผู้บริโภค เพื่อให้องค์กรสามารถวางแผนการตลาดได้สมบูรณ์แบบ การจะดำเนินการด้วยรูปแบบการคิดเชิงวิเคราะห์ (Analytical Thinking) ซึ่งใช้การวิเคราะห์ปัญหาหรือสถานการณ์เพื่อกำหนดหรือสร้างแนวทางสำหรับแก้ปัญหา โดยใช้วิธีการตามหลักวิทยาศาสตร์ตรวจสอบข้อมูลที่มีอยู่เพื่อทำความเข้าใจสาเหตุและผลกระทบ รวมทั้งใช้เป็นพื้นฐานสำหรับการแก้ปัญหาหรือการตัดสินใจ ช่วยให้องค์กรได้รู้จักลูกค้ามากขึ้น และสามารถทำนายพฤติกรรมของผู้บริโภคได้
การนำเอาข้อมูลของแต่ละแหล่งที่มาต่าง ๆ มาใช้ในการวิเคราะห์ ที่มา: https://www.edureka.co/blog/big-data-analytics/ ณ ปัจจุบันที่มีวิวัฒนาการของข้อมูลดิจิตอลและอินเทอร์เน็ตทำให้เกิดข้อมูลจำนวนมหาศาล การเปลี่ยนแปลงของเทคโนโลยีการสื่อสารเป็นสาเหตุสำคัญต่อการเกิดข้อมูลมหัต (Big Data) ซึ่งเกี่ยวข้องกับกระแสของธุรกิจในของโลกในปัจจุบัน ทำให้องค์การต่าง ๆ ต้องการนำเอาข้อมูล Big Data ที่ต้องการมาจัดเก็บและวิเคราะห์ โดยยุคของการใช้งาน สามารถแบ่งออกเป็น 5 ยุคได้ดังนี้ 1. ยุคก่อนที่จะมีอินเทอร์เน็ตคือ ยุคที่สื่อสารด้วยโทรศัพท์บ้านและการส่งผ่านข้อความด้วยระบบโทรศัพท์ 2. ยุคอินเทอร์เน็ตเพื่อการส่งสาร คือยุคที่เริ่มใช้งานอินเทอร์เน็ตในการแชร์ความรู้ เนื้อหาของหนังสือและการส่งข้อความผ่านทางอีเมล์ 3. ยุคอินเทอร์เน็ตเพื่อการบริการ คือยุคที่มีการขายสินค้าและการบริการบนโลกอินเทอร์เน็ต การขายผลิตภัณฑ์ดิจิตอลบนโลกอินเทอร์เน็ต 4. ยุคอินเทอร์เน็ตเพื่อสังคมของผู้คน คือยุคที่มีผู้คนใช้อินเทอร์เน็ตอย่างแพร่หลายในการใช้เป็นสื่อสังคมออนไลน์ เช่น Facebook Twitter เป็นต้น 5. ยุคอินเทอร์เน็ตของทุกสรรพสิ่ง คือยุคที่ใช้ระบบอินเทอร์เน็ตมาเชื่อมต่ออุปกรณ์คอมพิวเตอร์ ระบบดิจิทัล สิ่งของ มนุษย์ เข้ามาไว้ด้วยกันเพื่อถ่ายโอนหรือแลกเปลี่ยนข้อมูล ซึ่งจะเป็นที่มาของระบบอัจฉริยะต่าง ๆ ไม่ว่าจะเป็นบ้านอัจฉริยะ ยานพาหนะอัจฉริยะ เทคโนโลยีการผูกสัญญาด้วยระบบอัจฉริยะด้วยบล็อกเชน (Blockchain)
วิวัฒนาการของข้อมูลดิจิตอลและอินเตอร์เน็ต ที่มา: twitter.com/nokiacem/status/581161700184887296/1 ซึ่งในการนิยามว่าข้อมูลเหล่านั้นเป็น Big Dataหรือไม่จะต้องมีลักษณะสำคัญ 5 ลักษณะ หรือ 5V ดังต่อไปนี้ 1. ปริมาณ (Volume) คือ ปริมาณข้อมูลที่สามารถผลิตและจัดเก็บไว้จะมีขนาดที่ใหญ่มากกว่าชุดข้อมูลทั่วไป 2. ความหลากหลาย (Variety) คือ ความหลากหลายของประเภทข้อมูล ข้อมูลที่เป็น Big Dataไม่ว่าจะเป็นข้อมูลที่เป็นตัวหนังสือ, รูปภาพ, หรือไฟล์ประเภทอื่นจากหลากหลายแหล่งที่มา ก็สามารถเป็นส่วนหนึ่งในการนำมาประยุกต์ใช้ในการสกัดองค์ความรู้ได้ 3. ความเร็ว (Velocity) ข้อมูลของ Big Data จะมีอัตราการเพิ่มขึ้นของข้อมูลอย่างรวดเร็วและมีการเปลี่ยนแปลงอยู่ตลอดเวลา 4. คุณภาพของข้อมูล (Veracity) คือ Big Data จะต้องมีคุณภาพของข้อมูลหรือความถูกต้องของข้อมูลซึ่งแสดงถึงความน่าเชื่อถือของข้อมูล เพื่อนำไปประมวลผลต่อได้ 5. มูลค่าของข้อมูล (Value) จุดเด่นอีกหนึ่งข้อของ Big Data คือประโยชน์ของข้อมูลที่ผู้ศึกษาสามารถนำไปต่อยอดสร้างประโยชน์ต่อองค์กรหรือสร้างมูลค่ากับธุรกิจได้ด้วยกระบวนการวิเคราะห์ข้อมูล เพราะว่าการเข้าถึงข้อมูลที่เป็นประโยชน์ย่อมดีกว่าการเข้าถึงข้อมูลที่ไม่สามารถสกัดองค์ความรู้ได้ เช่น ข้อมูลที่ดีกว่าถูกต้องครบถ้วนมากกว่าจะสามารถนำข้อมูลดังกล่าวมาปรับปรุงเพื่อเพิ่มมูลค่าสินค้าได้ เป็นต้น
ลักษณะสำคัญ 5 ลักษณะ ของ ข้อมูลมหัต หรือ Big Data ที่มา: https://www.techentice.com/the-data-veracity-big-data/ ด้วยความสำคัญของ Big Dataนี้เองทำให้การคิดเชิงวิเคราะห์ (Analytical Thinking)ถูกนำมาใช้วิเคราะห์ปัญหาหรือสถานการณ์เพื่อกำหนดหรือสร้างแนวทางสำหรับแก้ปัญหา โดยจะใช้วิธีการตามหลักวิทยาศาสตร์ตรวจสอบข้อมูลหรือกระบวนการที่ทำอยู่เพื่อทำความเข้าใจสาเหตุและผลกระทบ รวมทั้งใช้เป็นพื้นฐานสำหรับการแก้ปัญหาหรือการตัดสินใจ ซึ่งความสามารถที่สำคัญสำหรับการคิดเชิงวิเคราะห์จะประกอบด้วย ความสามารถในการสื่อสาร ความสามารถในเชิงความคิดสร้างสรรค์ ความสามารถในการคิดอย่างมีวิจารณญาณ ความสามารถในการวิเคราะห์ข้อมูล และความสามารถในการวิจัย กล่าวคือวิทยาศาสตร์ข้อมูลเป็นกระบวนที่มุ่งเน้นในการวิเคราะห์ข้อมูลขนาดใหญ่ ที่ต้องใช้ความรู้จากหลากหลายเพื่อหาผลลัพธ์ที่จะนำเอาองค์ความรู้จากแหล่งข้อมูลต่าง ๆ ไปใช้งานอย่างมีประสิทธิภาพ โดยมีหลักการในการคิดเชิงวิเคราะห์เป็นแนวทางในการศึกษาข้อมูลเหล่านั้นนั่นเอง ซึ่งนี่ก็เป็นเพียงส่วนแรกเท่านั้นที่ผมจะพาท่านผู้อ่านเข้าสู่โลกของวิทยาศาสตร์ข้อมูล และในครั้งหน้าผมจะพาท่านผู้อ่านมารู้จักการเขียนโปรแกรมที่เกี่ยวข้องกับงานด้านวิทยาศาสตร์ข้อมูลด้วยภาษา Python ต่อไปครับ |
|