งานที่เกี่ยวข้องกับการจัดหาข้อมูล (data acquisition) ใน business intelligence มีลักษณะที่แตกต่างจากการเก็บข้อมูลในระบบงานไอทีทั่วไปคือ

1. เป็นการเก็บข้อมูลทุติยภูมิ หรือ secondary data ในขณะที่ระบบไอทีโดยทั่วไปจะมีการบันทึกและจัดเก็บข้อมูลธุรกรรมที่เกิดขึ้น โดยตรง เช่น การขายสินค้า การตรวจนับสินค้าคงคลัง แต่ในระบบ business intelligence มักจะใช้การเก็บข้อมูลจากระบบงานอื่น ไม่ได้เก็บโดยตรงจากการเกิดธุรกรรม

2. เป็นการรวบรวมข้อมูลจากหลายแหล่ง เช่น จากระบบขาย ระบบบัญชี ระบบสินค้าคงคลัง เป็นต้น เพื่อให้สามารถเห็นภาพของธุรกิจโดยรวม

ด้วยลักษณะทั้งสองประการนี้ ทำให้งานการจัดหาข้อมูลสำหรับ BI ต้องพบกับความท้าทายในหลายรูปแบบ ได้แก่

  • ความแตกต่างของนิยามข้อมูลในแต่ละระบบงานต้นทาง
  • คุณภาพของข้อมูลจากระบบงานต้นทางที่แตกต่างกัน
  • ความแตกต่างของระบบเทคโนโลยีที่ใช้ในระบบงานต้นทางแต่ละแบบ

เทคโนโลยีสำคัญที่ใช้ในการจัดหาข้อมูลของงาน BI เรียกว่า ETL (Extract, Transform, Load) และ EAI (Enterprise Application Integration) โดยมีความสามารถที่สำคัญคือ การดึงข้อมูลจากแหล่งข้อมูลต้นทาง ทำการแปลงข้อมูลที่อยู่ในรูปแบบที่หลากหลาย และนำข้อมูลเข้าสู่ระบบจัดเก็บต่อไป โดยมีข้อควรพิจารณาเพิ่มเติมอีกในเรื่องของ

  • การทำงานโดยอัตโนมัติ (automation)
  • การประสานข้อมูลจากหลายแหล่งร่วมกัน (data integration)
  • การจัดทำ meta data หรือข้อมูลเกี่ยวกับข้อมูล
  • กระบวนการทำความสะอาดข้อมูล (data cleansing)
  • การตรวจสอบคุณภาพของข้อมูล (data validation)