ในปีนี้ ทั้ง Cloud Computing กับ SaaS (software as a service) ต่างก็เป็นศัพท์ใหม่มาแรงที่ใครๆ ก็ใช้กันทั้งนั้น ไม่เว้นแม้แต่ในแวดวงอุตสาหกรรม Business Intelligence ถึงกับคาดว่า แนวโน้มสำคัญในปี 2008 ประการหนึ่งคือ การที่ BI จะเข้าร่วมขบวน cloud computing ด้วย

แล้วก็มีคนคุยกันถึงเรื่องนิยามของ cloud กับ SaaS ผ่านทาง twitter โดยเสนอว่า

  • Cloud Computing = infrastructure (processing power + storage) available over the Web
  • SaaS = apps and services built on/in the Cloud

ได้รับเสียงตอบรับพอประมาณ ไปอ่านความคิดเห็นต่อข้อเสนอนี้ได้ที่นี่

ผมค่อนข้างเห็นด้วยกับนิยามข้างต้นโดยภาพกว้าง แต่ก็มีความเห็นส่วนตัวเพิ่มเติมคือ

  • Could เป็นความพยายามที่จะเพิ่ม scalability ของระบบ โดยซ่อนความยุ่งยากของการจัดการระบบไว้หลังกลุ่มเมฆ
  • Could ไม่จำเป็นต้องเป็น 3rd party เสมอไป คุณสามารถสร้าง could computing ใช้ในองค์กรได้เอง ถ้าบริษัทใหญ่และมีเงินมากพอจะทำ
  • ข้อดีของ cloud สำหรับผู้พัฒนาคือ คุณไม่ต้องวุ่นวายกับการ scale เลย ไม่ต้องมาคิดเรื่อง load balancing หรือ distributed computing/database มีคนจัดการให้คุณแล้ว
  • SaaS น่าจะเป็นโมเดลทางธุรกิจ ที่พยายามเปลี่ยนรูปแบบการสร้างรายได้จากซอฟต์แวร์ จากที่เดิมเป็นการขาย license กับ support/maintenance มาเป็นการขาย “บริการ” น่าจะไม่ต่างจากแนวคิด ASP (Application Service Provider) เมื่อหลายปีก่อน
  • รูปแบบรายได้ของ SaaS ที่คาดว่าน่าจะดึงดูดกลุ่มผู้ใช้ ควรจะเป็น pay per use คือใช้เท่าไหร่ก็จ่ายเท่านั้น ไม่ต้องลงทุนแพงๆ ในช่วงต้น เห็นว่าดีก็ใช้บริการต่อ ไม่พอใจก็หยุดใช้
  • ในอดีต ก่อนที่ cloud computing จะมาดัง ASP หรือผู้ให้บริการ SaaS ต้องเตรียมโครงสร้างพื้นฐานเอาเอง ซึ่งต้องลงทุนสูง
  • Cloud computing ทำให้ผู้ประกอบการเริ่มให้บริการ SaaS ได้ง่ายยิ่งขึ้น

ใครเห็นด้วย หรือเห็นแตกต่างกันอย่างไรบ้างครับ?

Data Warehouse หรือระบบคลังข้อมูล ถือเป็นองค์ประกอบที่สำคัญมากๆ ในงาน Business Intelligence ถึงแม้โดยพื้นฐานแล้ว data warehouse ก็ถือเป็น database หรือฐานข้อมูลประเภทหนึ่งเหมือนกัน แต่เนื่องจากวัตถุประสงค์ของการใช้งานแตกต่างออกไป ทำให้มีลักษณะสำคัญหลายอย่าง ที่แตกต่างจากระบบฐานข้อมูลที่ใช้ในการดำเนินธุรกรรมทางธุรกิจโดยทั่วไป

วัตถุประสงค์หลักของระบบคลังข้อมูล คือ “ช่วยสนับสนุนการตัดสิืนใจ ซึ่งแตกต่างจากวัตถุประสงค์ของระบบฐานข้อมูลในระบบงานคอมพิวเตอร์พื้นฐาน ที่มีเป้าหมายเพื่อเพิ่มประสิทธิภาพในการปฎิบัติงานอย่างใดอย่างหนึ่ง

ลักษณะสำคัญของ Data Warehouse ประกอบด้วย

  • Integrated ระบบคลังข้อมูลจะเป็นการรวบรวมข้อมูลการดำเนินธุรกรรมจากหลายๆ แหล่งเข้ามาไว้ภายใต้โครงสร้างเดียวกัน ในขณะที่ฐานข้อมูลในระบบคอมพิวเตอร์โดยทั่วไป มักจะถูกออกแบบมาให้มีประสิทธิภาพสูงสุดในการดำเนินกิจกรรมอย่างใดอย่างหนึ่ง เช่น ระบบบัญชี ก็เน้นประสิทธิภาพสูงสุดในการบันทึกบัญชี ระบบงานขาย หรือระบบวางแผนการผลิตก็เช่นเดียวกัน และบ่อยครั้งที่ในบริษัทเดียวกัน มีการเลือกใช้ระบบงานแตกต่างกัน เช่นใช้ระบบบัญชีของ SAP แต่ใช้ระบบ CRM ของ Siebel เป็นต้น Data Warehouse จะทำหน้าที่ผสานรวมข้อมูลของสองระบบนี้เข้าไว้ด้วยกัน
  • Subject-Oriented ลักษณะโครงสร้างของ DW จะจัดหมวดหมู่ตาม “เนื้อหา” ในขณะที่ฐานข้อมูลในระบบงาน OLTP (Online Transaction Processing) จะจัดหมวดหมู่ตาม “กระบวนการทำงาน” (Process-oriented) ตัวอย่างเช่น คลังข้อมูลที่มีข้อมูลการขาย แต่เกิดจากการรวบรวมข้อมูลจากระบบงานที่มีหลายขั้นตอน ตั้งแต่การรับออร์เดอร์ การตรวจสอบเครดิตลูกค้า การตรวจสอบสต็อกสินค้า การจัดเตรียมสินค้า พิมพ์อินวอยซ์ จัดส่ง วางบิล เก็บเงิน รับสินค้าคืนในกรณีที่เสียหายหรือผิดพลาด รวมไปจนถึงการบันทึกบัญชีลูกหนี้ เป็นต้น จะเห็นได้ว่าในหนึ่งเรื่องแค่การขายอย่างเดียว มีกระบวนการที่เกี่ยวข้องด้วยมากมาย แต่เนื้อหายังคงอยู่ในหมวดการขายทั้งสิ้น
  • Non-Volatile ข้อมูลที่จะถูกจัดเก็บในคล้งข้อมูล จะมีลักษณะที่ “ไม่เปลี่ยนแปลง” หรือถ้าจะมีการเปลี่ยนแปลงบ้างก็น้อยมาก จนเรียกได้ว่าเป็นกรณียกเว้นเลยทีเดียว เมื่อข้อมูลถูกนำเข้าไปใส่ไว้ในระบบ data warehouse แล้ว การใช้งานโดยส่วนใหญ่ มากกว่า 99% จะเป็นการ “อ่าน” ข้อมูลเพื่อใช้ในการวิเคราะห์และสนับสนุนการตัดสินใจในรูปแบบต่างๆ น้อยมากที่ข้อมูลในคลังข้อมูลจะต้องทำการ “แก้ไข หรือเปลี่ยนแปลง”  แต่ถ้าเปรียบเทียบกับระบบปฎิบัติงานทั่วไปแบบ OLTP อาทิเช่นระบบรับคำสั่งซื้อ หรือระบบบริการลูกค้าทาง call center ข้อมูลใบสั่งซื้อหรือข้อมูลการติดต่อกับลูกค้าแต่ละรายการ จะถูกเปลี่ยนแปลงไปอยู่ตลอดเวลา เพื่อให้สามารถสะท้อนถึงสถานะปัจจุบันของกิจกรรมนั้นๆ ได้ในลักษณะ realtime เช่น คำสั่งซื้อนี้อยู่ในขั้นตอนการตรวจสอบเครดิต ณ เวลานี้ แต่ในอีก 2 นาทีข้างหน้าจะถูกเปลี่ยนสถานะเป็น จัดเตรียมสินค้า เป็นต้น
  • Time-Variant โดยมากการตัดสินใจทางธุรกิจ จะต้องใช้ข้อมูลของสิ่งที่เกิดขึ้นในอดีตมาเป็นฐานประกอบการตัดสินใจ ดังนั้นระบบคลังข้อมูลจึงเน้นความสำคัญที่ “การจัดเก็บข้อมูลตามห้วงเวลา” หรือการเก็บรายละเิอียดข้อมูลในอดีตไว้เป็นจำนวนมาก ตัวอย่างเช่น ข้อมูลยอดขายของสินค้ารายการหนึ่ง อาจจะถูกเก็บใน data warehouse ย้อนหลังไป 3 ปี 5 ปี หรืออาจจะตั้งแต่เริ่มจำหน่ายสินค้านั้นเลยก็เป็นได้ เพื่อใ้ห้สามารถวิเคราะห์ถึงแนวโน้มในอดีต และพยากรณ์แนวโน้มในอนาคตต่อไปได้ แต่ถ้าเปรียบเทียบกับระบบสั่งซื้อสินค้า ซึ่งมีวัตถุประสงค์หลักคือเพื่อรับคำสั่งซื้อ ดังนั้นข้อมูลประวัติยอดขายในอดีต จึงมีความสำคัญไม่มากนัก โดยส่วนใหญ่แล้ว มักจะเก็บข้อมูลไว้เพียงแค่ 1-2 รอบทำการ (อาจจะวันหรือเป็นเดือนก็ได้) เมื่อมีการประมวลผลสิ้นวันหรือสิ้นเดือนแล้ว ก็จะทำการ purge ข้อมูลเก่าทิ้งไป เพื่อให้ระบบมีึความคล่องตัว และสามารถประมวลผลคำสั่งซื้อใหม่ๆ ได้อย่างรวดเร็ว

ด้วยลักษณะดังกล่าว ทำให้โดยทั่วไปแล้ว data warehouse มักจะมีขนาดใหญ่ ยิ่งหน่วยงานธุรกิจมีขนาดใหญ่ กระบวนการทำงานซับซ้อน ข้อมูลหลากหลาย ขนาดของ DW ในองค์กรก็จะใหญ่และซับซ้อนตามไปด้วย อย่างไรก็ตาม “ขนาด” ไม่ได้เป็นลักษณะสำคัญโดยเฉพาะ ฐานข้อมูล OLTP ก็สามารถมีขนาดใหญ่ได้ โดยไม่จำเป็นต้องเป็น data warehouse

คนที่เคยสงสัยคำว่า OLAP (OnLine Analytical Processing) มันมีความหมายว่าอย่างไร มีหลักการพื้นฐานที่สำคัญอย่างไรบ้าง ลองไปอ่านที่ OLAP Workshop : Basic Overview of OLAP Concepts ดูนะครับ เพราะอธิบายหลักการ และความหมายของคำสำคัญๆ ที่ใช้ในงาน OLAP ไว้ได้ดี มีรูปประกอบด้วย บทความชุดนี้มีหลายตอน แต่ผมคิดว่าจะค่อยๆ ทยอยแปลมาเป็นภาษาไทยทีละส่วน น่าจะได้ประโยชน์เพิ่มมากขึ้นกับคนที่ไม่สะดวกอ่านภาษาอังกฤษ

September 23rd, 2008From BI –> Think –> Decide

โดยทั่วไปเราก็เคยได้ยินกันว่า Business Intellience หรือระบบ DSS (Decision Support System) ช่วยในการตัดสินใจ ความจริงแล้วผมได้ยินมาตั้งแต่สมัยที่เรียกกันว่า MIS (Management Information System) แล้ว ผมเองก็ท่องมาตั้งเป็นสิบปีว่าระบบ BI ถ้ามีแล้ว ผู้บริหารในองค์กรจะ “ตัดสินใจ” ได้ดีขึ้น แต่จนแล้วจนรอด ก็หาข้อพิสูจน์มายืนยันความเชื่อนี้ไม่ได้ซักที กลายเป็นว่ามีปัจจัยอื่นเข้ามาเกี่ยวด้วย เพราะผู้บริหารบางคน ต่อให้มีข้อมูล มีเครื่องมือดีขนาดไหน พี่ท่านก็ยังเล่นโยนหัวโยนก้อยในการตัดสินใจอยู่ดี กลายเป็นเรื่องของแต่ละคนไป

พอได้มีโอกาสอ่านหนังสือชื่อ Teach your to think ของ Edward de Bono ถึงเริ่มเข้าใจจุดเชื่อมโยง ส่วนที่หายไปคือ “Thinking” หรือกระบวนการคิดนั่นเองครับ ผมสรุปเองได้ว่า BI ไม่ได้ช่วยตัดสินใจโดยตรง แต่ช่วยเพิ่มความสามารถในการคิด

ในขั้นตอนของการคิดพื้นฐาน มีเรื่องหนึ่งที่อธิบายไว้ในหนังสือคือ Broad/Specific vs. General/Detail ตัวอย่างที่มีในหนังสือคือ ให้ลองจินตนาการถึงเหยี่ยวสองตัว ตัวหนึ่งสายตาสั้น อีกตัวสายตาดีมากๆ มองไกลแค่ไหนก็ยังเห็นได้ชัดแจ๋ว ทีนี้เหยี่ยวนี่สามารถกินสัตว์เล็กเป็นอาหารได้หลายอย่าง กบ หนู กับกิ้งก่า เหยี่ยวสายตาดีบินอยู่ีสูงลิบๆ มองลงมาเห็นกบ ก็โฉบลงมากินกบได้สบาย ทำให้ไม่สนใจที่จะกินหนูกับกิ้งก่าเลย ส่วนเจ้าเหยี่ยวสายตาสั้น มองลงมาจะเห็นแค่อะไรเบลอๆ เป็นแค่ “สัตว์อะไรบางอย่างตัวเล็กๆ เคลื่อนไหวได้” ไม่รู้ชัดว่าเป็นอะไร ต้องโฉบลงมาก่อน ถึงจะรู้ บางทีก็เป็นกบ บางทีก็หนูหรือกิ้งก่า

คำถาม คุณคิดว่าเป็นเหยี่ยวสายตาสั้นหรือเป็นเหยี่ยวตาดี ดีกว่ากัน?

คนส่วนใหญ่อาจคิดว่าเหยี่ยวสายตาดี ย่อมดีกว่าอยู่แล้ว ไม่แน่เสมอไปนะครับ ถ้าช่วงไหน หรือพื้นที่ไหนขาดแคลนกบ เหยี่ยวตาดีก็อดเท่านั้นเอง แต่เจ้าเหยี่ยวสายตาสั้นยังสามารถกินหนูกับกิ้งก่าทดแทนได้

ในกระบวนการคิด ความสามารถในการมองภาพกว้าง จะส่งผลอย่างมากต่อความสามารถในการคิด ลองพิจารณาสองประโยคนี้ดู

  • ฉันต้องการกาวบางชนิดมาติดไม้สองชิ้นนี้เข้าด้วยกัน
  • ฉันต้องการวิธีการบางอย่างมาติดไม้สองชิ้นนี้เข้าด้วยกัน

ประโยคแรก นั่นคือเหยี่ยวตาดีครับ เฉพาะเจาะจง ลงรายละิเอียด เหมาะสำหรับ action หรือการลงมือทำ แต่ถ้าพูดถึงความสามารถในการคิด ประโยคที่สองหรือเจ้าเหยี่ยวตาฟาง จะดีกว่ามาก เพราะวิธีการบางอย่างที่ว่า ไม่จำเป็นต้องเป็นกาวเท่านั้น สกูร ยาง ตะปู อะไรก็ได้่ ความเป็นไปได้เพิ่มขึ้นอีกเยอะมาก

ทีนี้ ปัญหามันอยู่ที่ แค่ละคนมีรูปแบบวิธีการมองปัญหาเฉพาะตัว เป็น preference ของใครของมัน บางคนมองภาพกว้าง บางคนเป็นคนมองปัญหาเฉพาะเจาะจง เป็นโหมดปกติของใครของมันตามธรรมชาติ และบางคนอาจไม่รู้ตัวด้วยซ้ำ

หนึ่งในลักษณะของผู้นำทางธุรกิจคือ ความสามารถในการเปลี่ยนมุมมองให้เหมาะสมกับสถานการณ์ คือสามารถมองภาพกว้างได้ เราอาจจะเคยได้ยินวลีจำพวก “see the big picture”, “assess the landscape”, หรือ “30,000 feet view” เหมาะสำหรับการคิดแบบสร้างสรรค์ การวางแผนกลยุทธ์ และในขณะเดียวกัน ถ้าจำเป็นก็จะต้องสามารถโฉบลงมาในระดับล่างที่เจาะจงมากขึ้น วลีจำพวก “practical”, “down to earth”, “realistic” พวกนี้สะท้อนความสามารถในการคิดแบบเฉพาะเจาะจง เหมาะสำหรับงานที่มีขั้นตอนชัดเจน งานด้านปฏิบัติการ หรือการแก้ไขปัญหาเฉพาะหน้า

Business Intelligence เข้ามาช่วยตรงนี้แหละครับ ความสามารถที่เรียกว่า “Roll-up” และ “Drill-down” ช่วยให้ผู้บริหารสามารถเลือกมุมมองของข้อมูลสารสนเทศที่มีอยู่ได้ ต้องการเห็นภาพกว้าง ก็ roll-up มองภาพรวมการเติบโตของทั้งบริษัท ทุกกลุ่มสินค้า ทุกแผนก เทียบแนวโน้ม 3 ปี 5 ปีที่ผ่านมา เอา visualization มาใช้แปลงข้อมูลจำนวนมากให้ง่ายต่อการเข้าใจ นำเสนอในรูปกราฟหรือแผนภูมิ และถ้าจำเป็นก็สามารถเจาะลึกลงรายละเอียด drill-down ลงไปได้ เอาสินค้าตัวนี้ ลูกค้ารายนี้ ไตรมาสนี้เมื่อวานนี้

มุมมองทั้งสองแบบ ส่งผลต่อการตัดสินใจทั้งสิ้น เพียงแต่อยู่ในระดับที่แตกต่างกัน ถ้าเป็นการวางแผน วิเคราะห์ มักจะใช้มุมมองที่กว้าง แต่ถ้าเป็นการตัดสินใจปฎิบัติงาน มุมมองเฉพาะเจาะจง จะช่วยในการตัดสินใจได้มากกว่า

สัปดาห์ที่แล้วได้รับลิ้งค์น่าสนใจจาก @fordantitrust เป็นวีดีโอคลิปของทาง ZDNet ชื่อชุดว่า At the whiteboard เป็นการอธิบายเรื่องทางเทคโนโลยีหรือทางธุรกิจที่อาจจะซับซ้อน ให้ฟังดูง่ายขึ้น ในเวลาสั้นๆ แค่ไม่เกิน 5 นาที แล้วก็ใช้กระดานไวท์บอร์ดเป็นเครื่องมือช่วย เสียดายที่เอามา embed ไม่ได้ แต่ก็เข้าใจครับ เพราะทาง ZDNet เขาขายโฆษณาสั้นๆ ก่อนฉายคลิปจริง ก็ยุติธรรมดีครับ

มีหลายหัวข้อทีเดียวที่น่าสนใจ ที่ผมเพิ่งดูจบไปก็คือเรื่อง Next generation of business intelligence คุณ Angela (ดูเผินๆ นึกว่า Christina Yang จาก Grey’s Anatomy) อธิบายถึงปัญหาที่เกิดจากการมีข้อมูลจำนวนมาก แต่ไม่สามารถเปลี่ยนให้เป็น information และ wisdom ได้ โดยเน้นประเด็นไปที่เครื่องมือ หรือ Tools ที่ใช้ในการนำเสนอข้อมูล ว่าควรจะต้องมีลักษณะที่สำคัญสองประการ คือ Visualization ที่เธอบอกว่า “turns data into a story” อันนี้เห็นด้วยเต็มที่เลยครับ ข้อมูลมันน่าเบื่อ แต่ถ้าเป็นเรื่องเล่าแล้วละก็ สมองมนุษย์จะตีความได้ดีกว่า อีกประการหนึ่งคือ Interactivity หรือการที่ผู้ใช้สามารถทำอะไรบางอย่างกับข้อมูลได้ ไม่ว่าจะเป็นการไฮไลท์หรือ drill down ก็นับว่าทำให้เห็นภาพความสำคัญของ Business Intelligence ได้ดีครับ เหมาะสำหรับคนที่ยังนึกภาพไม่ออก

September 4th, 2008Data Warehouse 101

หลายปีก่อน ตอนที่เริ่มสร้างทีมงานใหม่ๆ เพื่อทำงานด้านคลังข้อมูล (data warehouse) ผมจัดสอนภายในเลยเตรียม powerpoint ชุดนี้เอาไว้ เพิ่งไปรื้อ backup เก่าๆ มาเลยเอามาฝากกัน

สไลด์ชุดนี้ผมสรุปมาจากบทแรกของหนังสือ The Data Warehouse Lifecyle Toolkit : Expert Methods for Designing, Developing, and Deploying Data Warehouses ของ Ralph Kimball ซึ่งคาดว่าน่าจะเป็นประโยชน์สำหรับคนที่สนใจในด้าน data warehouse

ในบทแรกนี่จะกล่าวถึงองค์ประกอบสำคัญๆ ของระบบคลังข้อมูล รวมถึงโปรเซสหลักๆ ที่มีในระบบด้วย โดยจะเน้นไปที่นิยามหรือคำอธิบายพื้นฐานถึงองค์ประกอบและโปรเซสเหล่านั้น เป็นการปูพื้นล่วงหน้า

Data Warehouse 101

View SlideShare presentation or Upload your own. (tags: data warehouse)

ก่อนจะเริ่มคุยกันต่อเรื่อง MDM มาทำความรู้จักกับข้อมูลอ้างอิงกันก่อน ในภาษาอังกฤษใช้คำว่า master data หรือ reference data ข้อมูลอ้างอิงเป็นตัวแทนของ entity ที่ถูกอ้างถึงในการทำธุรกรรม entity ที่ว่านี้อาจจะเป็นรูปธรรมหรือนามธรรมก็ได้ อาจจะเป็น คน เวลา สถานที่ หรืออะไรก็ได้

ยกตัวอย่างการขาย (Sales) การขายเป็น transaction หรือธุรกรรม ที่เกิดปฎิสัมพันธ์ระหว่าง entity มากกว่าหนึ่งอย่าง คือ สินค้า ผู้ขาย สถานที่ขาย เวลาที่ขาย ในกรณีนี้ สินค้า ผู้ขาย สถานที่ขาย เวลาที่ขาย ต่างก็เป็น master data ทั้งสิ้น  เพราะถูกอ้างอิงโดยข้อมูล sales transaction

โดยปกติแล้ว transaction data จะมีจำนวนมาก เพราะเกิดธุรกรรมต่างๆ ขึ้นตลอดเวลา ดังนั้นระบบคอมพิวเตอร์จึงแยกข้อมูลอ้างอิงออกมาเก็บไว้ต่างหาก เพื่อให้ประหยัดเนื้อที่เก็บข้อมูล และให้การทำงานเร็วขึ้น ลองนึกภาพพนักงานขายรองเท้าในห้าง ที่ต้องบันทึกรายการขายทุกรายการ ว่าขายอะไร จำนวนเท่าไหร่ เป็นเงินเท่าไหร่ ถ้ามองให้ดีๆ ในสมุดบันทึกการขาย พนักงานขายไม่ได้เขียน ข้อมูลทั้งหมดของรองเท้า ลงไปในบันทึกการขายใช่มั้ยครับ มีการอ้างถึงรองเท้าแต่ละรุ่นโดยการใช้ ชื่อรุ่นหรือรหัสเท่านั้น เพื่อให้สะดวกในการบันทึกการขาย โดยไม่ต้องบันทึกข้อมูลของรองเท้าซ้ำซ้อนมากนัก มีเพียง key หรือ identification เท่านั้นที่ใช้อ้างถึง ในกรณีนี้ ข้อมูลรองเท้าเป็นข้อมูลอ้างอิง

นั่นแสดงว่า จะต้องมีรายการต่างหากเฉพาะที่เก็บข้อมูลเกี่ยวกับรองเท้าไว้มากกว่าเพียง แค่ key หรือ identification คือมีชื่อยี่ห้อ รุ่น ขนาด สี วันที่ผลิต และอื่นๆ อีกมาก แต่รายการข้อมูลรองเท้าจะมีจำนวนเพียงแค่เท่ากับจำนวนรุ่นของรองเท้าเท่า นั้น ซึ่งนับว่าน้อยมากๆ เมื่อเทียบกับจำนวนข้อมูลธุรกรรม

ในการนำ business intelligence ไปใช้ในองค์กรธุรกิจ สิ่งที่มักจะถูกมองข้าม และให้ความสำคัญต่ำเกินไปในช่วงแรกของการวางแผน คือคุณภาพของข้อมูลและกระบวนการที่เกี่ยวข้องกับการสร้างข้อมูล BI project จำนวนมากที่ต้องล่าช้า ไม่พร้อมที่จะเปิดให้ใช้งาน เพราะมารู้เอาทีหลังว่าข้อมูลที่ส่งมาจากระบบงานอื่น อิงอยู่บนข้อมูลอ้างอิงที่แตกต่างกับที่ใช้ในการสร้างรายงาน หรือที่แย่ไปกว่านั้นก็คือ โครงการปิดไปแล้ว ระบบถูกสร้าง ผู้ใช้เริ่มใช้ แล้วก็พบว่า ข้อมูลไม่ถูกต้อง แค่ไม่นานผู้ใช้ก็จะเลิกใช้งานไป

การบริหารข้อมูลอ้างอิง (Master Data Management - MDM) เป็นองค์ประกอบหนึ่งที่สำคัญมากสำหรับการจัดการคุณภาพของข้อมูลโดยรวม โดยถือเป็นส่วนประสานงาน ที่เชื่อมโยงองค์ประกอบอื่นของงาน BI เข้าด้วยกัน

โดยนิยาม การบริหารข้อมูลอ้างอิง หมายถึง “กลุ่มของแนวทางปฏิบัติ และวิธีการ ในการทำให้ข้อมูลอ้างอิงของบริษัท มีความถูกต้องเที่ยงตรง สอดคล้องกันทั้งภายในระบบ และระหว่างระบบต่างๆ ในองค์กร

บทความในชุดนี้จะยกตัวอย่างให้เห็นความสำคัญของ MDM แล้วค่อยอธิบายถึงลำดับขั้นพัฒนาการของการบริหารข้อมูลอ้างอิงในขั้นต่างๆ

ส่วนนำเสนอข้อมูลหรือ presentation layer บางทีก็เรียกว่า user interface เป็นองค์ประกอบที่ทำหน้าที่ติดต่อกับผู้ใช้ โดยการแปลงข้อมูลให้อยู่ในรูปแบบที่ผู้ใช้สามารถเข้าใจได้ง่าย สร้างมุมมองและความเข้าใจใหม่ๆ ให้เกิดขึ้น และจัดการโต้ตอบกับผู้ใช้ โดยการรับคำสั่งเพิ่มเติม ในระหว่างที่ผู้ใช้กำลังดูข้อมูล

ถ้าเราแบ่งประเภทของส่วนนำเสนอข้อมูล ตามวิธีการติดตั้งและเรียกใช้งาน จะแบ่งเป็นประเภทดังนี้

  • Client base : เป็นโปรแกรมที่ติดตั้งอยู่บนเครื่องคอมพิวเตอร์ที่ผู้ใช้กำลังใช้งานอยู่ โปรแกรมลักษณะนี้มักจะมีความสามารถสูง ทำงานได้รวดเร็ว แต่ก็มีความยุ่งยากในการจัดการ เพราะต้องมีการติดตั้ง อัพเกรด และแก้ปัญหา จะมีการเกี่ยวข้องกับคอมพิวเตอร์แต่ละเครื่อง
  • Thin-Client หรือ Web-base แล้วแต่จะเรียก เครื่องมือเหล่านี้ไม่ต้องการการติดตั้งลงบนคอมพิวเตอร์ของผู้ใช้ หรือหากจะมีบ้างก็อาจจะเพียงเล็กน้อยเท่านั้น เช่น ผู้ใช้เพียงแต่ตัองมี web browser เท่านั้นก็สามารถใช้งานได้แล้ว หรืออย่างมากก็อาจจะเป็นแค่ Java Runtime libray ข้อดีคือ สะดวกต่อการจัดการกับโปรแกรม เพราะตัวโปรแกรมส่วนใหญ่ทำงานอยู่บนเครื่องเซิร์ฟเวอร์ การอัพเกรด หรือแก้บั๊ก ก็ทำได้ง่าย และยังสามารถเข้าถึงกลุ่มผู้ใช้ได้ง่ายกว่า แต่ก็มีข้อจำกัดที่ ผู้ใช้จำเป็นจะต้องเชื่อมต่ออยู่บนเครือข่ายเกือบตลอดเวลาที่ใช้งาน และโดยมากมักจะมีความสามารถที่จำกัดกว่าโปรแกรมแบบ client base และมักจะทำงานได้ช้ากว่าด้วย
  • Embeded : โปรแกรมหรือเครื่องมือประเภทนี้ อาจจะไม่ได้มีลักษณะเฉพาะที่ผู้ใช้สามารถรับรู้ได้ว่า กำลังใช้เครื่องมือในการนำเสนอข้อมูลอยู่ เพราะมัน “ฝังตัว” อยู่ในโปรแกรมอื่น ตัวอย่างที่เห็นได้ง่าย คือการสร้างเอกสาร จำพวก Word หรือ Powerpoint โดยที่มีการดึงข้อมูลมาจาก Excel หรือฐานข้อมูล แล้วสร้างลิงค์เชื่อมโยงไว้ เมื่อใดที่ข้อมูลมีการเปลี่ยนแปลงไป ตารางหรือกราฟที่ปรากฎอยู่บนเอกสาร ก็จะเปลี่ยนแปลงตามไปด้วย

ส่วนนำเสนอเหล่านี้ บางทีก็ถูกเรียกว่า OLAP tool, ad-hoc tool หรือ BI tool บ่อยครั้งที่คำเหล่านี้ถูกใช้ในความหมายที่สื่อถึงเฉพาะส่วนนำเสนอข้อมูล เท่่านั้น

นอกเหนือจากองค์ประกอบหลักๆ ที่ประกอบกันเป็นเส้นทางเดินข้อมูล จากการจัดหา จัดเก็บ วิเคราะห์ และนำเสนอแล้ว ยังมีเทคโนโลยี หลักการและแนวคิดอื่นๆ ที่มีส่วนสำคัญต่อความสำเร็จของการนำ business intelligence มาใช้ ผมขอเรียกองค์ประกอบเหล่านี้ว่า “ส่วนประสานงาน” ก็แล้วกัน

ที่เรียกอย่างนี้เพราะองค์ประกอบพวกนี้ ทำหน้าที่ประสานและเชื่อมโยงการทำงานของแต่ละส่วนเข้าด้วยกัน หากขาดองค์ประกอบเหล่านี้แล้ว เครื่องมือและระบบแต่ละส่วน ก็จะทำงานไม่สัมพันธ์กัน หรือมีประสิทธิภาพที่ด้อยลงมาก

ตัวอย่างบางแบบของส่วนประสานงาน เช่น

  • Process Management: เป็นเหมือนวาทยากร ผู้ควบคุมวงออเครสตราให้เล่นประสานเสียงกันได้ เช่น อาจจะสั่งให้โปรแกรมส่วนวิเคราะห์็สร้างรายงานฉบับใหม่ ก็ต่อเมื่อ ถึงวันเวลาที่กำหนด และ มีเงื่อนไขว่า ผลการโหลดข้อมูลล่าสุดเข้าไปในคลังข้อมูล ทำได้ถูกต้องเรียบร้อยแล้วเท่านั้น ถ้าเกิดข้อผิดพลาดขึ้น อาจจะต้องส่งอีเมล์หรือ SMS ไปแจ้งผู้ควบคุมระบบ และขณะเดียวกันก็อาจจะสื่อสารให้ผู้ใช้ทราบว่ารายงานยังไม่เรียบร้อยโดยผ่าน ทางส่วนนำเสนอไปพร้อมกันด้วย
  • Data Quality Control: เป็นอีกองค์ประกอบหนึ่งที่สำคัญมาก เพราะถ้าข้อมูลมีคุณภาพต่ำ ก็ส่งผลให้ผู้ใช้ขาดความเชื่อถือในระบบ พาลเลิกใช้ไปเลยในกรณีที่เห็นอยู่ชัดๆ ว่าข้อมูลผิด แต่กรณีที่แย่กว่านั้นก็คือ ผู้ใช้ใช้ข้อมูลที่ผิดพลาดนำไปประกอบการตัดสินใจ ส่งผลให้ตัดสินใจผิดพลาดตามไปด้วย การควบคุมคุณภาพของข้อมูล ส่งผลกระทบต่อทุกๆ ส่วนของระบบ และอาจจะไม่ได้อยู่ในลักษณะของตัวซอฟต์แวร์หรือโปรแกรมเสมอไป อาจจะเป็นแค่ ขั้นตอนการทำงาน หรือนโยบายการทำงาน ที่จะมีส่วนช่วยให้ข้อมูลที่ไหลผ่านเข้ามาในระบบ มีคุณภาพที่สูงเพียงพออยู่เสมอ  ในส่วนนี้ยังอาจจะแบ่งย่อยไปอีกได้เป็น
    • Master Data Management หนึ่งในปัญหาที่น่าปวดหัวที่สุด ของงาน business intelligence คือการทำให้ข้อมูลอ้างอิง (master data, reference data) มีความถูกต้องสอดคล้องกันทั้งระบบ ถ้าสินค้าชนิดเดียวกัน มีข้อมูลราคาขายที่แตกต่างกันในระบบขายกับในระบบบัญชี ผู้ใช้ก็จะได้เห็นตัวเลขยอดขายที่แตกต่างกันจากสองแผนก
    • Data Validation & Publishing กระบวนการตรวจสอบ ข้อมูลและการเผยแพร่ข้อมูล จะช่วยให้มั่นใจในคุณภาพของข้อมูลหลังจากการติดตั้งระบบ ถ้าไม่มีการตรวจสอบอย่างสม่ำเสมอ ข้อมูลจะเสื่อมคุณภาพลงเรื่อยๆ จากปัจจัยหลายอย่าง และขั้นตอนหรือนโยบายการเผยแพร่ข้อมูล จะช่วยให้เราเผยแพร่ข้อมูลที่เหมาะสมต่อการใช้งานได้ เช่น คุณไม่ต้องรอให้ข้อมูลถูกต้องครบถ้วนจนถึงทศนิยมหลักที่ 5 ก็ได้ หากคุณได้ข้อมูลมาประมาณ 95% ของทั้งหมดแล้ว ถ้าจะใช้ในการวางแผนการตลาด แต่ถ้าต้องการนำข้อมูลไปลงในรายงานผู้ถือหุ้น คุณต้องแน่ใจว่า งบการเงินมีความถูกต้องแม่นยำ 100%
  • Change Management: การจัดการการเปลี่ยนแปลง เป็นกระบวนการที่จะช่วยให้ทุกๆ องค์ประกอบตอบสนองต่อความเปลี่ยนแปลงได้เป็นอย่างดี ไม่ว่าจะเป็นการเปลี่ยนแปลงทางเทคนิค เช่นต้องมีการอัพเกรดเซิร์ฟเวอร์หรืออัพเกรดซอฟต์แวร์ที่เกี่ยวข้อง หรือการเปลี่ยนแปลงที่มีผลมาจากธุรกิจ เช่น การเพิ่มสินค้าชนิดใหม่ การเปิดตลาดใหม่ การซื้อขายกิจการ หรือการปรับโครงสร้างองค์กร การเปลี่ยนแปลงเหล่านี้จะส่งผลต่อความต้องการใช้งานสารสนเทศ ระบบ business intelligence จึงต้องมีความยืดหยุ่นมากพอที่จะรองรับการเปลี่ยนแปลงเหล่านั้นได้ ตัวอย่างหนึ่งได้แก่
    • Historical Restatement Process: เป็นกระบวนการที่ส่งผล ให้ข้อมูลในอดีตมีการเปลี่ยนแปลงไป เนื่องจากความเปลี่ยนแปลงของข้อมูลอ้างอิง เช่น เมื่อมีการเปลี่ยนแปลงสถานะของอำเภอสระแก้ว ให้กลายมาเป็นจังหวัด ข้อมูลยอดขายเดิมในอดีต ที่เคยเป็นของจังหวัดปราจีนบุรี ส่วนหนึ่งต้องลดลง แล้วกลายมาเป็นยอดขายของจังหวัดสระแก้วแทน

© 2007 BzInsight | iKon Wordpress Theme by Windows Vista Administration | Powered by Wordpress