Wednesday, January 19, 2011

AI 613: Data Management II & Business Intelligence


Data Warehouse
1. Reach data more quickly as they’re located in one place.
2. Reach data easier, more frequent by end users themselves ,using Web browser.
Reasons for Data Inconsistency
1. เกิดจากข้อมูลมี Format ต่างกัน
2. ข้อมูล Update ไม่เท่ากัน
Data Warehouse Process
1. Collecting data from external and operational data
2. ทำ Meta Data
3. ทำ Data Staging 
4. สร้าง Data Warehouse 
5. สร้าง Business View 
The Data Mart
เป็นเสมือน Data Warehouse หน่วยย่อยของแต่ละแผนก เนื่องจาก Data Warehouse ของบริษัทนั้นมีขนาดใหญ่และมีผู้เข้าใช้จำนวนมาก ทำให้เกิดความวุ่นวายและสร้างปัญหาให้แก่ผู้ที่เข้าใช้ จึงคัดลอกข้อมูลในส่วนที่เกี่ยวข้องของแต่ละฝ่ายออกมาสร้างเป็น Data Mart ของแต่ละฝ่ายเอง เพื่อลดความวุ่นวายและปัญหาต่างๆ ลง ซึ่ง Data Mart แบ่งออกเป็น 2 ประเภท คือ
1. Replicated Data Mart ในกรณีที่องค์กรมี Data Warehouse ขององค์กรอยู่แล้วและมีผู้ใช้ Data Warehouse ที่หลากหลาย จึงจำเป็นต้องมี Data Mart เพิ่มขึ้นมาโดยนำข้อมูลมาจาก Data Warehouse เพื่อจัดระเบียบให้ตรงกับความต้องการใช้
2. Stand-Alone Data Mart ใช้ในองค์กรที่ยังไม่พร้อมที่จะสร้าง Data Warehouse จึงสร้างเฉพาะ Data Mart ในส่วนที่พร้อม
The Data Cube
เป็น Multidimensional Databases ที่เอาไว้เก็บข้อมูลที่ Transform แล้วจึงมา Load ลงที่นี่ เพื่อให้สามารถมองภาพของข้อมูลนั้นได้หลายมิติมากขึ้น จุดเด่นของ Data Cube คือ สามารถตัดแบ่งส่วนเพื่อเลือกข้อมูลที่ต้องการวิเคราะห์ได้ ทำให้สามารถวิเคราะห์ข้อมูลที่มีได้ในหลายมิติ หลายมุมมอง ทำให้เห็นปัญหาที่ชัดเจนขึ้น โดยจะสามารถวิเคราะห์ข้อมูลในลักษณะต่างๆ เช่น
1. Slices and Dices การดูข้อมูลที่แบ่งออกเป็นมิติต่างๆ เช่น ข้อมูลเกี่ยวกับ Wine ทั้งในแง่ของราคา ฐานลูกค้าในแต่ละระยะเวลา
2. Rollups การดูข้อมูลที่เป็นรายละเอียด ไปยังข้อมูลที่เป็นภาพรวม เพื่อความสะดวกในการเปรียบเทียบ และวิเคราะห์แนวโน้ม
3. Drill Downs การดูข้อมูลจากภาพรวมไปยังรายละเอียด
Business Intelligence
Business intelligence process transforms จาก data --> information --> decision --> action  โดย BI functions and features ประกอบไปด้วย
1. Reporting and analysis
          1.1 Dashboards มักใช้ในการแสดงผลของ Operation or Tactical โดยแบ่งได้เป็น 3 ระดับ คือ
                        - operational dashboards ซึ่งถูกใช้โดย front lines worker, supervisor
                   - tactical dashboards ซึ่งถูกใช้โดย manager and analysts
                   - strategic dashboard ซึ่งถูกใช้โดย ผู้บริหาร
          1.2 Scorecards ใช้เพื่อประเมินผลและตืดตามผลการดำเนินงาน 
2. Analytics
3. Data integration
            โดย Business intelligence ส่วนใหญ่ บริษัทมักจะไม่ได้ทำการพัฒนาจากภายใน แต่จะซื้อมาจากภายนอก
            - Business Performance Management ต้องการวิธีการที่ง่ายและรวดเร็วในการ สร้างระบบวัดผลให้สอดคล้องกับ goal objective and alignment strategies  โดย Business performance management  จะทำได้ดีแค่ไหนขึ้นอยู่กับ  business intelligence analysis reporting 
            - Online Analytical Processing ช่วยให้ผู้บริหารสามารถระบุปัญหาได้
Data Mining  
การค้นหาข้อมูลที่จำเป็นหรือมีประโยชน์ออกมาจากข้อมูลทั้งหมด เพื่อใช้ในการตัดสินใจทางธุรกิจ ทั้งนี้ Data Mining จะเกิดประโยชน์ก็ต่อเมื่อสามารถตีความ (Interpretation) หรือเข้าใจในผลลัพธ์ที่ออกมา สามารถแบ่งการนำเสนอออกเป็น 5 รูปแบบ ดังนี้  
1. Clustering เป็นการจัดกลุ่มของข้อมูล โดยแบ่งจากความสัมพันธ์ของกลุ่มข้อมูล
2. Classification เป็นการจัดกลุ่มข้อมูลโดยมีสมมติฐานล่วงหน้า
3. Association เป็นผลสืบเนื่องที่เกิดขึ้น เช่น หากลูกค้าเปิดบัญชีออมทรัพย์ อีก 2 เดือนจะทำบัตร ATM
4. Sequence Discovery เกิดผลตามหลัง
5. Prediction เป็นการ Forecast ไปข้างหน้า
Text Mining
ข้อมูลส่วนใหญ่ที่อยู่ใน Data Warehouse จะเป็นข้อมูลแบบ Structured คือ มีรูปแบบที่แน่นอน มีชื่อ Attribute, ขนาดของ Field ว่ามีกี่ Character ซึ่งจะสามารถใช้ Data mining ได้ แต่ในกรณีที่เป็นข้อมูลแบบ Unstructured data จะไม่สามารถใช้ Data Mining ได้ เนื่องจากเป็นข้อมูลที่ไม่ได้มีรูปแบบชัดเจน เช่น การ Complain จากลูกค้า ซึ่งข้อมูลประเภท Unstructured นี้มีการเติบโตสูงมาก

MISS MANASSAWEE LIMPASATHEANKUL 5202115415

Wednesday, January 12, 2011

AI 613: Data Management

Data คือ ข้อเท็จจริง ซึ่งหาได้จากแหล่งข้อมูลต่างๆ เป็นข้อมูลพื้นฐานที่ยังไม่มีความหมาย หรือยังไม่สามารถสื่อความหมายได้ด้วยตนเอง
Information คือ การนำ Data มาผ่านกระบวนการต่างๆ (Process) ให้สามารถสื่อความหมายเพื่อให้นำไปใช้ประโยชน์ได้
Information System คือ การนำ Data มาผ่านกระบวนการ (Process) เป็น Information เพื่อให้เกิดเป็น Knowledge เป็นระบบที่ทำหน้าที่ในการรวบรวมข้อมูลเพื่อนำมาประมวลผล วิเคราะห์ เพื่อสร้างสารสนเทศสำหรับวัตถุประสงค์เฉพาะด้าน และนำเสนอสารสนเทศให้กับผู้ที่ต้องการ ซึ่งต้องเป็นผู้มีสิทธิ์ได้รับสารสนเทศ รวมทั้งการจัดเก็บบันทึกข้อมูลที่นำเข้ามาสู่ระบบไว้เพื่อการใช้งานในอนาคต Information System มี 6 องค์ประกอบ ได้แก่
            1. Hardware
            2. Software
            3. Data
            4. Network
            5. Procedure
            6. People
Data Management มี 4 องค์ประกอบ ได้แก่
            1. Data profiling
            2. Data quality management
            3. Data integration
            4. Data augmentation
Data Life Cycle Process
            1. New data collection
            2. Stored in a database
            3. Users access the database and take a copy of the needed data for analysis
            4. Use Data analysis tools or Data mining tools for analyzing
Data Source
            1. Organization data
            2. End user data
            3. External data
Data Processing
            1. Transactional เป็นระบบปฏิบัติการ (Operational Systems) ใช้ TPS ในจัดเก็บข้อมูลและแปลผลจากส่วนกลาง
            2. Analytical ระบบการวิเคราะห์ข้อมูลที่รวบรวมมาจากหลายแหล่ง ส่วนใหญ่มาจาก End-Users เช่น DSS, EIS, Web เป็นต้น
Characteristic of data warehouse
            1. Organization
            2. Consistency
            3. Time variant
            4. Non-volatile
            5. Relational
            6. Client/Server

MISS MANASSAWEE LIMPASATHEANKUL 5202115415