April 3rd, 2008ระบบจัดหาข้อมูล
งานที่เกี่ยวข้องกับการจัดหาข้อมูล (data acquisition) ใน business intelligence มีลักษณะที่แตกต่างจากการเก็บข้อมูลในระบบงานไอทีทั่วไปคือ
1. เป็นการเก็บข้อมูลทุติยภูมิ หรือ secondary data ในขณะที่ระบบไอทีโดยทั่วไปจะมีการบันทึกและจัดเก็บข้อมูลธุรกรรมที่เกิดขึ้น โดยตรง เช่น การขายสินค้า การตรวจนับสินค้าคงคลัง แต่ในระบบ business intelligence มักจะใช้การเก็บข้อมูลจากระบบงานอื่น ไม่ได้เก็บโดยตรงจากการเกิดธุรกรรม
2. เป็นการรวบรวมข้อมูลจากหลายแหล่ง เช่น จากระบบขาย ระบบบัญชี ระบบสินค้าคงคลัง เป็นต้น เพื่อให้สามารถเห็นภาพของธุรกิจโดยรวม
ด้วยลักษณะทั้งสองประการนี้ ทำให้งานการจัดหาข้อมูลสำหรับ BI ต้องพบกับความท้าทายในหลายรูปแบบ ได้แก่
- ความแตกต่างของนิยามข้อมูลในแต่ละระบบงานต้นทาง
- คุณภาพของข้อมูลจากระบบงานต้นทางที่แตกต่างกัน
- ความแตกต่างของระบบเทคโนโลยีที่ใช้ในระบบงานต้นทางแต่ละแบบ
เทคโนโลยีสำคัญที่ใช้ในการจัดหาข้อมูลของงาน BI เรียกว่า ETL (Extract, Transform, Load) และ EAI (Enterprise Application Integration) โดยมีความสามารถที่สำคัญคือ การดึงข้อมูลจากแหล่งข้อมูลต้นทาง ทำการแปลงข้อมูลที่อยู่ในรูปแบบที่หลากหลาย และนำข้อมูลเข้าสู่ระบบจัดเก็บต่อไป โดยมีข้อควรพิจารณาเพิ่มเติมอีกในเรื่องของ
- การทำงานโดยอัตโนมัติ (automation)
- การประสานข้อมูลจากหลายแหล่งร่วมกัน (data integration)
- การจัดทำ meta data หรือข้อมูลเกี่ยวกับข้อมูล
- กระบวนการทำความสะอาดข้อมูล (data cleansing)
- การตรวจสอบคุณภาพของข้อมูล (data validation)