Repo này lưu trữ toàn bộ data, source code cho đồ án môn Data warehouse and OLAP (IS217), vui lòng gửi message cho một trong 2 contact-information bên dưới nếu có bất kỳ thắc mắc nào.
-
Nguyễn Hoàng Long - 19521788 (Leader)
-
Trần Nguyễn Hạnh Nguyên - 19521923
- Link dataset: https://www.kaggle.com/jackdaoud/marketing-data
- SQL Server Integration Services (SSIS)
- SQL Server Analysis Services (SSAS)
- SQL Server Reporting Services (SSRS)
- Power BI
- Python, Pandas
- Clean, Extract, Transform, Load (ETL) data to Data Warehouse
- SQL Server Integration Services (SSIS)
- Python
- Pandas
- Build Cube, Analyze data
- SQL Server Analysis Services (SSAS)
- Build Report, Visualize data
- SQL Server Reporting Services (SSRS)
- Power BI
- Data mining
- Thiết lập Decision Trees model cho bài toán phân loại
- Thiết lập K-means Clustering cho bài toán gom cụm
-
Hiểu được sự khác biệt của các hệ thống OLTP và OLAP
-
OLTP sử dụng để làm gì, OLAP sử dụng để làm gì
-
Lí do phải xây dựng OLAP cho các hoạt động phân tích dữ liệu thay vì phân tích trực tiếp trên các hệ thống OLTP
-
-
Hiểu quá trình ETL dữ liệu
-
Sự khác biệt giữa relational model của relational database và dimensional model của data warehouse
-
Kiến trúc của Data warehouse
-
Biết sử dụng công cụ hỗ trợ làm sạch, xử lý và đưa dữ liệu vào data warehouse
-
Biết sử dụng công cụ phục vụ cho việc phân tích và visualize data
-
Truy vấn dữ liệu đã chiều sử dụng ngôn ngữ MDX
-
Sử dụng được các công cụ tạo report như SSRS, Power BI
-
Xây dựng model học máy cho bài toán phân loại (Decision Trees) và gom cụm (K-means)