Lecture 9
Data Warehouse Process – ขั้นตอนในการทำ Data Warehouse
1. Meta Data เป็นข้อมูลของข้อมูล ดูว่าข้อมูลจริงๆมีอะไรบ้าง
a. Operational Data – data ในแผนกต่างๆ เช่น HO MK
b. External Data – ข้อมูลคู่แข่ง เช่น ราคาขายแต่ละ product
2. Data Staging E(C)TL
a. Extract – คัดแยก ทำให้ข้อมูลไปปรากฎในที่ใหม่
b. Clean – ปัญหาที่ทำให้ต้อง Clean เกิดจาก 2 สาเหตุ ได้แก่ ข้อมูลฟันหลอ และ 1ID มี 2 ชื่อ
c. Transform – แปลงสภาพเช่น ตัดมาเฉพาะ วัน และ เดือน หรือเปล่า
d. Load
ขั้นตอนนี้จะได้มาเป็น Data cube
3. Data Warehouse Business Subject มุมมองแต่ละ Subject
4. Business View มุมมองการเรียกใช้สิ่งที่เก็บข้างใน เพื่อให้ผู้บริหารใช้ upload ใน web ในรูปของ dashboard
5. Information Catalog
*Enterprise ทุกอย่างจะอยู่ในนี้หมด หากใครต้องการหาข้อมูลก็สามารถหาได้จากในนี้
Metadata – แนวทางในการ move ว่าเอาจาก Database ไหน
Data Mart ทุกอย่างกองใน Enterprise ต้องมีการแบ่งข้อมูลที่ต้องการออกมา โดย Copy เฉพาะ ส่วนของตนเอง Data Mart มีทั้งสิ้น 2 ประเภท
1. Replicated Data Mart ต้องมี Enterprise มาก่อน และ Replicate เป็นของแผนกตนเอง
2. Stand – alone data marts องค์กรไม่พร้อมทำ enterprise เลยทำเฉพาะ mart ตัวเองไป ประเภทนี้เกิดยากมากไม่ค่อยเกิดกรณที่ ทำ mart ก่อนแล้วนำมารวมเป็น prise
Data Cube ข้อมูลถูกจัดลง cube ฐานข้อมูลหลายมิติ
Business Intelligence
Balance Scorecard (BSC)
ไม่ว่ามุมมองไหนก็ต้องสร้าง KPI Dashboard ต้องมี KPI เป็นหน้าปัดเสมอ ตัวอย่าง KPI เช่น Cost per Sale ,Sales per Download ,Revenue per Sale, Profit per Sale
Dashboard
แบ่งเป็น 3 ประเภท เป็นผลการดำเนินงานในมิติต่างๆ แสดงเป็น chart ได้แก่
1. Operational dashboards
2. Tactical dashboards
3. Strategic dashboards
BPM – Business Performance Management
Business Value of BI ใช้ BI ทำงานให้เกิด Value กับองค์กรอย่างไร
Online Analytical Processing (OLTP)
· เป็นจุดเริ่มต้นของผู้บริหารในการเข้าใช้สารสนเทศ
· เป็น software technology ที่ทำให้นักวิเคราะห์ ผู้บริหาร ผู้จัดการ สามารถมองลึกลงไปในข้อมูลและสามาถระบุปัญหาได้
Data Mining Characteristics
ข้อมูลต้องมีมากพอ อาจเก็บอยู่ใน data warehouse หรือที่ใดก็ได้ มี 5 แบบ
· Clustering การจัด cluster บนสมมติฐานคนละแบบ เกิดจากการจัดหมู่กันเอาเอง
· Classification
· Association ผลสืบเนื่อง เช่น บทวิเคราะห์ลูกค้าเปิดบัญชีออมทรัพย์ อีกไม่นานก็จะทำบัตรเอทีเอ็มด้วย
· Sequence discovery
· Prediction
Text Mining
· Structured Data มี Attribute ที่เก็บใน field เดียวกัน
· Unstructured Data จำพวกคำบ่นของลูกค้า
· ข้อมูลจำพวก ID จัดเป็น Numeric เนื่องจากมีสภาพในการคำนวณ (Check Digit) แต่ถ้าไม่ได้ไว้เพื่อการคำนวณนั้นจะเรียกว่า Alphabatic
ณัฐณิชา อร่ามเธียรธำรง
5202112792
ไม่มีความคิดเห็น:
แสดงความคิดเห็น