ก่อนจะเริ่มคุยกันต่อเรื่อง MDM มาทำความรู้จักกับข้อมูลอ้างอิงกันก่อน ในภาษาอังกฤษใช้คำว่า master data หรือ reference data ข้อมูลอ้างอิงเป็นตัวแทนของ entity ที่ถูกอ้างถึงในการทำธุรกรรม entity ที่ว่านี้อาจจะเป็นรูปธรรมหรือนามธรรมก็ได้ อาจจะเป็น คน เวลา สถานที่ หรืออะไรก็ได้

ยกตัวอย่างการขาย (Sales) การขายเป็น transaction หรือธุรกรรม ที่เกิดปฎิสัมพันธ์ระหว่าง entity มากกว่าหนึ่งอย่าง คือ สินค้า ผู้ขาย สถานที่ขาย เวลาที่ขาย ในกรณีนี้ สินค้า ผู้ขาย สถานที่ขาย เวลาที่ขาย ต่างก็เป็น master data ทั้งสิ้น  เพราะถูกอ้างอิงโดยข้อมูล sales transaction

โดยปกติแล้ว transaction data จะมีจำนวนมาก เพราะเกิดธุรกรรมต่างๆ ขึ้นตลอดเวลา ดังนั้นระบบคอมพิวเตอร์จึงแยกข้อมูลอ้างอิงออกมาเก็บไว้ต่างหาก เพื่อให้ประหยัดเนื้อที่เก็บข้อมูล และให้การทำงานเร็วขึ้น ลองนึกภาพพนักงานขายรองเท้าในห้าง ที่ต้องบันทึกรายการขายทุกรายการ ว่าขายอะไร จำนวนเท่าไหร่ เป็นเงินเท่าไหร่ ถ้ามองให้ดีๆ ในสมุดบันทึกการขาย พนักงานขายไม่ได้เขียน ข้อมูลทั้งหมดของรองเท้า ลงไปในบันทึกการขายใช่มั้ยครับ มีการอ้างถึงรองเท้าแต่ละรุ่นโดยการใช้ ชื่อรุ่นหรือรหัสเท่านั้น เพื่อให้สะดวกในการบันทึกการขาย โดยไม่ต้องบันทึกข้อมูลของรองเท้าซ้ำซ้อนมากนัก มีเพียง key หรือ identification เท่านั้นที่ใช้อ้างถึง ในกรณีนี้ ข้อมูลรองเท้าเป็นข้อมูลอ้างอิง

นั่นแสดงว่า จะต้องมีรายการต่างหากเฉพาะที่เก็บข้อมูลเกี่ยวกับรองเท้าไว้มากกว่าเพียง แค่ key หรือ identification คือมีชื่อยี่ห้อ รุ่น ขนาด สี วันที่ผลิต และอื่นๆ อีกมาก แต่รายการข้อมูลรองเท้าจะมีจำนวนเพียงแค่เท่ากับจำนวนรุ่นของรองเท้าเท่า นั้น ซึ่งนับว่าน้อยมากๆ เมื่อเทียบกับจำนวนข้อมูลธุรกรรม