วันพุธที่ 12 มกราคม พ.ศ. 2554

Lecture 8 : Data Management

Lectuce : 8 Data Management
ปูพื้นฐาน
·         ระบบ (system) คือ อะไรก็ตามที่มี Inputs ผ่าน process เกิด output ซึ่ง output นั้นเป็นสิ่งที่ต้องการ หน้าตาจะเป็นอย่างไรขึ้นอยู่กับ objective นอกจากนี้ยังมี environment boundary control และ feedback
·         Output ของระบบสารสนเทศ คือ สารสนเทศ
·         Information
Data
Knowledge การรับทราบข้อมูลต้องมีความรู้เกิด
ต่างกันตรงที่ผลประโยชน์และการประมวลผล
·         ตัวอย่าง เช่น Messege วิชา AI613 เรียนวันที่ 12 19 2 เป็นได้ทั้ง Information และ Data input & output ในระบบสารสนเทศ หน้าตาอาจไม่ต่างกัน เพราะ Process มีหลายรูปแบบ อาจมีการ Transform แต่จะตัดสินว่าเป็น Data หรือ Informaton นั้นอยู่ที่ผู้มส่วนได้เสีย เช่น หาก Messege นี้ส่งไปยัง นศ. ปี 2 พอเขารับก็ไม่มีอัตถประโยชน์ Messege นี้ก็จะมีสภาพเป็น Data แต่ถ้ามี จะเป็น Information
·         ระบบสารสนเทศ คือ ระบบที่สร้างสารสนเทศ หน้าตาต่างกันตามงานที่ทำ finance ก็แบบนึง MK ก็แบบนึง ต่างกันตรงผู้ใช้
·         องค์ประกอบของ IS
1.       Hardware
2.       Software
3.       Data
4.       Network
5.       Procedure
6.       People
Outline
·         Data Management
·         Data Life Cycle Process
·         Data Mangement Evolution
·         Data Warehouse
·         Data Mart
·         Data Cube
Data Management
·         การจัดการข้อมูลนั้นมีความยากด้วยหลายสาเหตุ ได้แก่
1.       จำนวนข้อมูลเพิ่มมากขึ้น เราไม่สามารถเก็บทุกอย่างได้
2.       ข้อมูลจะเกิด ณ จุดที่งานเกิดและมีการกระจายตัวในองค์กร
3.       ข้อมูลมีความซ้ำซ้อนจากการกระจายตามแผนกและไม่มีกลไกในการสร้างหรือเก็บข้อมูลที่ดีเพียงพอ
4.       อาจจะต้องมีการใช้ข้อมูลจากแหล่งภายนอกมาช่ายในการตัดสินใจ
5.       การจัดการข้อมูลอยู่บนพื้นฐาน 3 ประการ ได้แก่ Security Quality และ Critical
·         ข้อมูลเป็นทรัพยากรขององค์กร ระบบฐานข้อมูลเป็น infrastructure ไม่ใช่ IS
·         Foundation has 4 building blocks
1.       Data profiling
2.       Data quality management
3.       Data integration
4.       Data augmentation
Data Life Cycle Process
1.       ข้อมูลเกิดจากหลายแหล่งต้องทำการจัดเก็บ
2.       จัดเก็บข้อมูลใน Database แล้วนำมา Format จากนั้นให้นำเข้าสู่ Data Warehouse
3.       ผู้ใช้สามารถนำข้อมูลใน Warehouse ไปใช้ในการวิเคราะห์
4.       การวิเคราะห์มี 2 วิธี
a.        analysis tool
b.       data mining
Data Life Cycle Process
                วิเคราะห์ข้อมูลที่เกิดจาก data base ปัญหาอยู่ตรงที่เราอนุญาตให้ใช้ database โดยตรงมั้ย เนื่องจากสมมติฝ่ายขายต้องใช้ TPS ตลอดเวลาแต่แผนกวิเคราะห์ก็ต้องใช้ Finding ซึ่งทำให้ Database ต้องหยุดรอ ซึ่งระบบขายมีความสำคัญมากกว่า บางครั้งอาจไม่ make sense
Data Sources and Databases
·         Internal Data เช่น ประวัติพนักงานเป็น TPS ของ HR
·         External Data เช่น คู่แข่ง สภาพเศรษฐกิจ หรือ ซื้อข้อมูลจาก website
·         Personal Data ข้อมูลที่บุคลากรใช้ เช่น excel ที่ทำขึ้นมาใหม่เพื่อใช้ในการวิเคราะห์ สำหรับงานของตน
ถ้า TPS ดี Personal Data ไม่เกิด
Note
·         Database ไม่เท่ากับ Data Warehouse เนื่องจากคนละวัตถุประสงค์
·         ความรู้มี 2 ประเภท
1.       Implicit เป็นแบบที่ติดกับคน ปัญหา คือ ถ้าคนออกไป จะทำอย่างไรที่จะ Preserve Knowledge ของคนได้ คำตอบก็คือ Technology
2.       Explicit เป็นองค์ความรู้ที่ถูกถ่ายทอดจากคนเป็นบทความหรือหนังสือ แต่ก็ไม่มีทางที่จะมากกว่า 10%
Data Analysis
                เครื่องมือวิเคราะห์ข้อมูล ข้อมูลที่นำมาวิเคราะห์นี้มาจากต่างแผนก ต่าง database
·         Format ไม่เหมือนกัน
·         บันทึกข้อมูลข้างในก็ไม่เหมือนกัน
Data Processing
·         Transactional       =>     Data Base + TPS
·         Analytical             =>     Data Warehouse
Data Warehouse
·         Input     เป็นข้อมูลที่ดึงมาจาก TPS อาจเป็น Internal หรือ External หรือ Personal Data ก็ได้ หลังจากนั้นก็นำมาเก็บใน Data Warehouse เป็นข้อมูลที่จัดใหม่ในมุมมองเพื่อวิเคราะห์
·         Processing     เป็นกระบวนการ Process ข้อมูลให้ได้ Output อาจเป็น DSS EIS หรือ  Data Mining ก็ได้
·         Output    -     Web Browser
Characteristics of Data Warehouse
1.       Organization เอาข้อมูลมาจัดเป็น Format ตาม Subject
2.       Consistency เนื่องจากข้อมูลมีความไม่สม่ำเสมอกัน เช่น เพศ หญิง ชาย ญ ช 1  0 ต้องทำให้ consist กันก่อนใน warehouse
3.       Time Variant
4.       Non-volatile ข้อมูลไม่มีการ update แต่มีการ refresh
5.       Relational
6.       Client/server
ณัฐณิชา อร่ามเธียรธำรง
5202112792

ไม่มีความคิดเห็น:

แสดงความคิดเห็น