9 กฎหมายในการทำเหมืองข้อมูล

9 กฎหมายการทำเหมืองข้อมูล - มัมมี่

ทุกอาชีพมีหลักการชี้นำความคิดที่ให้โครงสร้างและคำแนะนำในการทำงานประจำวัน การทำเหมืองข้อมูลจะไม่มีข้อยกเว้น ต่อไปนี้คือเก้าแนวคิดพื้นฐานที่จะแนะนำคุณเมื่อคุณทำงานและกลายเป็นคนขุดแร่ข้อมูล เหล่านี้เป็น 9 ข้อกฎหมายในการทำเหมืองข้อมูลตามที่ผู้สำรวจข้อมูล Thomas Khabaza ได้กล่าวไว้

กฎหมายที่ 1: เป้าหมายทางธุรกิจ

นี่คือกฎหมายข้อมูลเหมืองแร่ที่ 1 หรือ "Business Goals Law": วัตถุประสงค์ทางธุรกิจเป็นจุดเริ่มต้นของโซลูชันการทำเหมืองข้อมูลทุกประเภท

คุณสำรวจข้อมูลเพื่อหาข้อมูลที่ช่วยให้คุณดำเนินธุรกิจได้ดียิ่งขึ้น ไม่ควรเป็นมนต์ของการวิเคราะห์ข้อมูลทางธุรกิจทั้งหมดหรือไม่? แน่นอนมันควร! แต่คนขุดแร่ที่เป็นสามเณรมักมุ่งเน้นเกี่ยวกับเทคโนโลยีและรายละเอียดอื่น ๆ ซึ่งน่าสนใจ แต่ไม่สอดคล้องกับความต้องการและเป้าหมายของผู้มีอำนาจตัดสินใจของผู้บริหาร

คุณต้องพัฒนานิสัยในการระบุเป้าหมายทางธุรกิจก่อนที่จะทำสิ่งอื่นใดและมุ่งเน้นไปที่เป้าหมายเหล่านั้นในทุกขั้นตอนในกระบวนการทำเหมืองข้อมูล เป็นสิ่งสำคัญที่กฎหมายฉบับนี้มาก่อน ทุกคนควรเข้าใจว่าการทำเหมืองข้อมูลเป็นกระบวนการที่มีวัตถุประสงค์

กฎหมายฉบับที่ 2: ความรู้ทางธุรกิจ

นี่คือกฏหมายการทำเหมืองข้อมูลที่ 2 หรือ "Business Knowledge Law": ความรู้ทางธุรกิจเป็นหัวใจสำคัญของกระบวนการทุกขั้นตอนของการทำเหมืองข้อมูล

การทำเหมืองข้อมูลช่วยให้ผู้คน - นักธุรกิจ - ใช้ความรู้ทางธุรกิจประสบการณ์และข้อมูลเชิงลึกพร้อมทั้งวิธีการทำเหมืองข้อมูลเพื่อค้นหาความหมายในข้อมูล

คุณไม่จำเป็นต้องเป็นนักสถิติแบบแฟนซีที่จะทำเหมืองข้อมูล แต่คุณต้องรู้บางอย่างเกี่ยวกับข้อมูลที่มีความหมายและวิธีการทำงานของธุรกิจ เฉพาะเมื่อคุณเข้าใจข้อมูลและปัญหาที่คุณต้องแก้ไขเท่านั้นกระบวนการทำเหมืองข้อมูลจะช่วยให้คุณสามารถค้นพบข้อมูลที่เป็นประโยชน์และนำมาใช้ได้

กฎหมายที่ 3: การจัดเตรียมข้อมูล

นี่คือกฎหมายการทำเหมืองข้อมูลที่สามหรือ "กฎหมายการเตรียมข้อมูล": การจัดเตรียมข้อมูลเป็นมากกว่าครึ่งหนึ่งของกระบวนการทำเหมืองข้อมูลทุกอย่าง

สถิติทั่วไปมักจะมีโอกาสได้รวบรวมข้อมูลใหม่เพื่อตอบคำถามด้านการวิจัยที่เฉพาะเจาะจง พวกเขาอาจใช้กระบวนการที่เข้มงวดในการวางแผนการทดลองสร้างแบบสอบถามการวิจัยการสำรวจหรือรวบรวมข้อมูลที่มีคุณภาพสูงซึ่งมีเป้าหมายอย่างชัดเจนสำหรับเป้าหมายการวิจัยเฉพาะ แต่หลังจากนั้นสิ่งที่พวกเขายังคงใช้จ่ายเป็นจำนวนมากเวลาทำความสะอาดและเตรียมข้อมูลสำหรับการวิเคราะห์

คนงานเหมืองข้อมูลในทางกลับกันเกือบตลอดเวลาต้องทำงานกับข้อมูลที่มีอยู่ พวกเขาใช้บันทึกทางธุรกิจที่มีอยู่ข้อมูลสาธารณะหรือข้อมูลที่สามารถซื้อได้โอกาสคือข้อมูลทั้งหมดที่รวบรวมมาเพื่อวัตถุประสงค์อื่นนอกเหนือจากการทำเหมืองข้อมูลและไม่มีแผนอย่างเข้มงวดใด ๆ หรือกระบวนการเก็บข้อมูลอย่างรอบคอบ ดังนั้นเหมืองข้อมูลจึงใช้เวลามากในการจัดเตรียมข้อมูล

กฎหมายฉบับที่ 4: รุ่นที่ถูกต้อง

นี่คือกฎหมายการทำเหมืองข้อมูลที่ 4 หรือ "NFL-DM": รูปแบบที่เหมาะสมสำหรับแอ็พพลิเคชันที่ระบุสามารถค้นพบได้จากการทดลองเท่านั้น

กฎหมายฉบับนี้เป็นที่รู้จักกันโดยชวเลข NFL-DM ซึ่งหมายความว่าไม่มีอาหารกลางวันฟรีสำหรับคนขุดแร่ข้อมูล

อันดับแรกรูปแบบคืออะไร? เป็นสมการที่แสดงถึงรูปแบบที่สังเกตได้ในข้อมูล อย่างน้อยก็แสดงให้เห็นรูปแบบในทางที่หยาบ แบบจำลองทางคณิตศาสตร์ของสิ่งที่เป็นจริงไม่เคยสมบูรณ์แบบ! นี่คือความเป็นจริงของชีวิตและเป็นความจริงสำหรับนักฟิสิกส์นิวเคลียร์เช่นเดียวกับคนงานเหมืองข้อมูล

ในการทำเหมืองข้อมูลโมเดลจะถูกเลือกผ่านการทดลองและข้อผิดพลาด คุณจะทดลองใช้รูปแบบต่างๆ

กฎหมายที่ 5: รูปแบบ

นี่คือกฎหมายข้อมูลการทำเหมืองข้อมูลที่ 5: มีรูปแบบอยู่เสมอ

ในฐานะที่เป็นผู้สำรวจข้อมูลคุณจะสำรวจข้อมูลในการค้นหารูปแบบที่เป็นประโยชน์ กล่าวอีกนัยหนึ่งคุณจะมองหาความสัมพันธ์ที่มีความหมายระหว่างตัวแปรในข้อมูล การทำความเข้าใจเกี่ยวกับความสัมพันธ์เหล่านี้ช่วยให้เข้าใจธุรกิจได้ดียิ่งขึ้นและคาดการณ์ได้ดียิ่งขึ้นว่าจะเกิดอะไรขึ้นในอนาคต สิ่งสำคัญที่สุดคือการทำความเข้าใจรูปแบบในข้อมูลช่วยให้คุณสามารถมีอิทธิพลต่อสิ่งที่จะเกิดขึ้นในอนาคต

คุณมักจะหารูปแบบ ข้อมูลมีบางอย่างที่จะบอกคุณเสมอ บางครั้งก็ยืนยันว่าสิ่งที่คุณได้ทำถูกต้อง นั่นอาจดูเหมือนไม่น่าตื่นเต้น แต่อย่างน้อยก็บอกคุณว่าคุณได้รับการติดตามที่ถูกต้อง วันอื่นข้อมูลอาจบอกคุณได้ว่าการดำเนินธุรกิจในปัจจุบันของคุณไม่ได้ผล น่าตื่นเต้นและแม้ว่าจะไม่น่าพอใจในระยะสั้น แต่การรู้ความจริงเป็นขั้นตอนสำคัญในการปรับปรุง

กฎหมายฉบับที่ 6: การขยาย

นี่คือกฎหมายการทำเหมืองข้อมูลฉบับที่ 6 หรือ "กฎหมายด้านความเข้าใจผิด": การทำเหมืองข้อมูลจะขยายการรับรู้ในโดเมนธุรกิจ

วิธีการทำเหมืองข้อมูลช่วยให้คุณสามารถเข้าใจธุรกิจของคุณได้ดียิ่งขึ้นกว่าที่คุณทำได้โดยไม่มีพวกเขา วิธีการทำเหมืองข้อมูลช่วยให้คุณชอบแว่นขยายหรือกล้องจุลทรรศน์ทำให้สามารถค้นพบผลกระทบที่อาจเป็นเรื่องยากหรือไม่สามารถตรวจพบได้จากการรายงานทั่วไป

การทำเหมืองข้อมูลไม่ใช่แบบทันที

การค้นพบและการเรียนรู้ผ่านการทำเหมืองข้อมูลเป็นกระบวนการเชิงโต้ตอบ คุณจะค้นพบค้นพบข้อมูลจากแต่ละส่วนและใช้สิ่งที่คุณค้นพบเพื่อดำเนินการ ผลการดำเนินการแต่ละครั้งที่คุณลองจะทำให้เกิดข้อมูลมากขึ้นและข้อมูลดังกล่าวช่วยให้คุณสามารถเข้าใจได้มากขึ้น เป็นวัฏจักรของการค้นพบและวัฏจักรนี้ยังคงดำเนินต่อไปตราบเท่าที่คุณยังคงสำรวจและทดลองต่อ

กฎหมายที่ 7: การคาดการณ์

นี่คือกฎหมายการทำเหมืองข้อมูลที่ 7 หรือ "กฎหมายทำนาย": การคาดการณ์จะเพิ่มข้อมูลภายในประเทศโดยการทำให้เป็นภาพรวม

การทำเหมืองข้อมูลจะช่วยให้คุณใช้สิ่งที่คุณรู้เพื่อคาดคะเนได้ดีขึ้น (หรือประมาณ) ของสิ่งที่คุณไม่รู้จัก การทำเหมืองข้อมูลจะใช้ข้อมูลและวิธีการแบบจำลองเพื่อแทนที่ความคาดหวังที่ไม่เป็นทางการของคุณด้วยข้อมูลประมาณการที่สอดคล้องกันและมีความแม่นยำมากขึ้น

กฎหมายที่ 8: มูลค่า

นี่คือกฎหมายการทำเหมืองข้อมูลที่ 8 หรือ "กฎหมายค่านิยม": มูลค่าของผลลัพธ์การทำเหมืองข้อมูลไม่ได้ถูกกำหนดโดยความถูกต้องหรือความเสถียรของโมเดลคาดการณ์

คนขุดแร่ข้อมูลไม่เอะอะกับทฤษฎี ในฐานะที่เป็นคนขุดแร่ข้อมูลคุณอาจไม่เคยรู้จักทฤษฎีที่อยู่เบื้องหลังแบบจำลองทางสถิติที่คุณใช้ อาจเป็นไปได้เช่นกันเนื่องจากในการทำเหมืองข้อมูลคุณจะใช้โมเดลเหล่านี้ด้วยวิธีที่ไม่จำเป็นต้องสอดคล้องกับทฤษฎีที่อยู่เบื้องหลัง

คุณจะมองหาโมเดลที่สร้างการคาดคะเนที่ถูกต้อง (และคุณจะใช้การทดสอบแทนทฤษฎีทางสถิติ) แต่คุณอาจกังวลเกี่ยวกับปัญหาอื่น ๆ มากขึ้นเช่นว่ารูปแบบนี้มีความหมายทางธุรกิจหรือไม่ก็ชี้ให้เห็นถึงปัจจัยการคาดการณ์ที่คาดไม่ถึงหรือเป็นประโยชน์ในการใช้งานในที่ทำงานของคุณ

กฎหมายข้อที่ 9: เปลี่ยน

นี่คือกฎหมายการทำเหมืองข้อมูลที่ 9 หรือ "กฎหมายแห่งการเปลี่ยนแปลง": รูปแบบทั้งหมดอาจมีการเปลี่ยนแปลง

โลกกำลังเปลี่ยนแปลงอยู่เสมอ แบบจำลองที่ให้การคาดการณ์ที่ดีในวันนี้อาจไม่มีประโยชน์ในวันพรุ่งนี้ นี่คือความเป็นจริงของชีวิตสำหรับนักวิเคราะห์ข้อมูลทั้งหมดไม่ใช่แค่คนขุดแร่ข้อมูลเท่านั้น