Data Mart là gì? Tìm hiểu tổng quan về Data mart

Data Mart là một tập hợp con của kho thông tin tổng, thường hướng đến một mục đích cụ thể hoặc chủ đề dữ liệu chính có thể được phân phối để cung cấp nhu cầu kinh doanh. Data Marts là kho lưu trữ hồ sơ phân tích được thiết kế để tập trung vào

Data Mart là một tập hợp con của kho thông tin tổng, thường hướng đến một mục đích cụ thể hoặc chủ đề dữ liệu chính có thể được phân phối để cung cấp nhu cầu kinh doanh. Data Marts là kho lưu trữ hồ sơ phân tích được thiết kế để tập trung vào các chức năng kinh doanh cụ thể cho một cộng đồng cụ thể trong một tổ chức. Các Data Warehouse có nguồn gốc từ các tập hợp con dữ liệu trong Data Warehouse, mặc dù trong phương pháp thiết kế Data Warehouse từ dưới lên, Data Warehouse được tạo từ sự kết hợp của các Data Warehouse tổ chức.

Việc sử dụng cơ bản của trung tâm dữ liệu là các ứng dụng Business Intelligence (BI). BI được sử dụng để thu thập, lưu trữ, truy cập và phân tích bản ghi. Nó có thể được sử dụng bởi các doanh nghiệp nhỏ hơn để tận dụng dữ liệu mà họ đã tích lũy được vì nó ít tốn kém hơn so với việc triển khai một Data Warehouse.
image.png

Lý do tạo trung tâm dữ liệu

  • Tạo dữ liệu tập thể bởi một nhóm người dùng
  • Dễ dàng truy cập vào data thường xuyên cần thiết
  • Dễ dàng sáng tạo
  • Cải thiện thời gian phản hồi của khách hàng
  • Chi phí thấp hơn so với việc triển khai một Data Warehouse hoàn chỉnh
  • Khách hàng tiềm năng được xác định rõ ràng hơn so với trong một Data Warehouse toàn diện
  • Nó chỉ chứa dữ liệu kinh doanh thiết yếu và ít lộn xộn hơn.

Các loại Data Marts

Chủ yếu có hai cách tiếp cận để thiết kế data mart. Những cách tiếp cận này là

  • Dependent Data Marts
  • Independent Data Marts

Dependent Data Marts

Dependent Data Marts là một tập hợp con hợp lý của một tập con vật lý của một Data Warehouse cao hơn. Theo kỹ thuật này, các data mart được coi như các tập con của Data Warehouse. Trong kỹ thuật này, trước hết một Data Warehouse được tạo ra để từ đó có thể tạo thêm các Data Warehouse khác nhau. Các Data Warehouse này phụ thuộc vào Data Warehouse và trích xuất bản ghi cần thiết từ đó. Trong kỹ thuật này, khi Data Warehouse tạo ra data mart; do đó, không cần tích hợp data mart. Nó còn được gọi là cách tiếp cận từ trên xuống.

Independent Data Marts

Cách tiếp cận thứ hai là Các Data Warehouse độc lập (IDM) Ở đây, trước tiên các Data Warehouse độc lập được tạo, sau đó một Data Warehouse được thiết kế bằng cách sử dụng các Data Warehouse độc lập này. Theo cách tiếp cận này, vì tất cả các data mart được thiết kế độc lập; do đó, việc tích hợp các data mart là bắt buộc. Nó cũng được gọi là phương pháp tiếp cận từ dưới lên vì các data mart được tích hợp để phát triển một Data Warehouse.

Ngoài hai loại này, còn một loại nữa tồn tại được gọi là “Hybrid Data Marts”.

Hybrid Data Marts

Nó cho phép kết hợp dữ liệu từ ngoài Data Warehouse. Điều này phù hợp cho nhiều trường hợp; đặc biệt là trong trường hợp tích hợp Adhoc, chẳng hạn như thêm mới nhóm một tổ chức.

Các bước triển khai Data Mart

Các bước quan trọng trong việc triển khai data mart là thiết kế lược đồ, xây dựng bộ lưu trữ vật lý, điền vào data mart với dữ liệu từ các hệ thống nguồn, truy cập nó để đưa ra quyết định sáng suốt và quản lý nó theo thời gian. Vì vậy, các bước là:

Designing

Bước thiết kế là bước đầu tiên trong quy trình data mart. Giai đoạn này bao gồm tất cả các chức năng từ việc khởi tạo yêu cầu đối với trung tâm dữ liệu thông qua việc thu thập dữ liệu về các yêu cầu và phát triển thiết kế logic và vật lý của trung tâm dữ liệu.

Nó bao gồm các nhiệm vụ sau:

  • Thu thập các yêu cầu kinh doanh và kỹ thuật
  • Xác định nguồn dữ liệu
  • Chọn tập hợp con dữ liệu thích hợp
  • Thiết kế kiến trúc logic và vật lý của data mart.

Constructing

Bước này bao gồm việc tạo cơ sở dữ liệu vật lý và các cấu trúc logic được liên kết với data mart để cung cấp khả năng truy cập nhanh và hiệu quả vào dữ liệu.

Nó bao gồm các nhiệm vụ sau:

  • Tạo cơ sở dữ liệu vật lý và các cấu trúc logic, chẳng hạn như không gian bảng được liên kết với Data Warehouse.
  • Tạo các đối tượng lược đồ như bảng và chỉ mục được mô tả trong bước thiết kế.
  • Xác định cách tốt nhất để thiết lập các bảng và cấu trúc truy cập.

Populating

Bước này bao gồm tất cả các tác vụ liên quan đến việc lấy dữ liệu từ nguồn, làm sạch nó, sửa đổi nó theo đúng định dạng và mức độ chi tiết, và chuyển nó vào data mart.

Nó bao gồm các nhiệm vụ sau:

  • Ánh xạ các nguồn dữ liệu đến các nguồn dữ liệu mục tiêu
  • Trích xuất dữ liệu
  • Làm sạch và chuyển đổi thông tin.
  • Đang tải dữ liệu vào data mart
  • Tạo và lưu trữ siêu dữ liệu

Accessing

Bước này liên quan đến việc đưa dữ liệu vào sử dụng: truy vấn dữ liệu, phân tích dữ liệu, tạo báo cáo, biểu đồ và đồ thị và xuất bản chúng.

Nó bao gồm các nhiệm vụ sau:

  • Thiết lập và lớp trung gian (Meta Layer) để công cụ front-end sử dụng. Lớp này chuyển các hoạt động cơ sở dữ liệu và tên đối tượng thành các điều kiện kinh doanh để khách hàng cuối có thể tương tác với trung tâm dữ liệu bằng cách sử dụng các từ liên quan đến các chức năng nghiệp vụ.
  • Thiết lập và quản lý kiến trúc cơ sở dữ liệu như bảng tóm tắt giúp các truy vấn đồng ý thông qua các công cụ front-end thực thi nhanh chóng và hiệu quả.

Managing

Bước này bao gồm việc quản lý Data Warehouse trong suốt thời gian tồn tại của nó. Trong

bước này, các chức năng quản lý được thực hiện như:

  • Cung cấp quyền truy cập an toàn vào dữ liệu.
  • Quản lý sự tăng trưởng của dữ liệu.
  • Tối ưu hóa hệ thống để có hiệu suất tốt hơn.
  • Đảm bảo tính khả dụng của sự kiện dữ liệu với các lỗi hệ thống

Nguồn: Internet

Để hiểu hơn cũng như tham khảo thêm các kiến thức về dữ liệu, mọi người có thể truy cập vào https://indaacademy.vn/blog/ nhé. Cảm ơn mọi người nhiều nhé. Hẹn mọi người vào kiến thức tiếp theo.

Nguồn: viblo.asia

Bài viết liên quan

WebP là gì? Hướng dẫn cách để chuyển hình ảnh jpg, png qua webp

WebP là gì? WebP là một định dạng ảnh hiện đại, được phát triển bởi Google

Điểm khác biệt giữa IPv4 và IPv6 là gì?

IPv4 và IPv6 là hai phiên bản của hệ thống địa chỉ Giao thức Internet (IP). IP l

Check nameservers của tên miền xem website trỏ đúng chưa

Tìm hiểu cách check nameservers của tên miền để xác định tên miền đó đang dùn

Mình đang dùng Google Domains để check tên miền hàng ngày

Từ khi thông báo dịch vụ Google Domains bỏ mác Beta, mình mới để ý và bắt đầ