Khóa học Xử lý Dữ liệu cho Data Warehouse (Phần Cơ Bản)

Hiểu cách làm data modeling cho hệ thống Data Warehouse (hoặc đơn giản là xử lý bảng để dùng làm báo cáo)

Ratings 4.81 / 5.00
Khóa học Xử lý Dữ liệu cho Data Warehouse (Phần Cơ Bản)

What You Will Learn!

  • Hiểu cách làm data modeling cho hệ thống Data Warehouse (hoặc đơn giản là xử lý bảng để dùng làm báo cáo).
  • Vận dụng để xây dựng một data warehouse hoàn chỉnh từ data thô.
  • Kỹ năng SQL để xử lý dữ liệu trong data warehouse.
  • Kỹ năng giải quyết vấn đề trong data.

Description

Bạn sẽ học được những gì?

  • Cách tư duy (mindset) đúng đắn khi làm việc với dữ liệu.

  • Xử lý dữ liệu cho hệ thống Data Warehouse, xử lý bảng để dùng làm báo cáo.

  • Xây dựng một data warehouse hoàn chỉnh từ data thô.

  • Kỹ năng SQL để xử lý dữ liệu trong data warehouse.

  • Nếu dựa trên BI Process, khóa này sẽ tập trung vào bước Data Transformation và một phần Data Quality, Data Metadata.


Đối tượng của khóa học này

  • Data Analyst cần cải thiện kỹ năng xử lý dữ liệu để hiệu quả hơn khi làm data visualization và data analysis.

  • Data Engineer đang cần làm Data Warehouse.

  • Analytics Engineer.


Yêu cầu

  • Biết dùng Excel hoặc Google Sheets.

  • Biết viết query bằng SQL / đã học qua khóa Tự học SQL cùng Vịt - Cơ bản trên Youtube.

  • Thành thạo ít nhất một công cụ BI: Power BI, Tableau, Google Data Studio, Metabase...


CÂU HỎI THƯỜNG GẶP

Khóa này có phù hợp cho người mới hoàn toàn không?

Câu trả lời ngắn gọn: nếu bạn mới hoàn toàn thì khoá học này chưa phù hợp với bạn ạ.

Khoá này sẽ tập trung vào bước Data Transformation của quy trình làm BI (Business Intelligence), nên sẽ phù hợp cho những bạn đã đi làm một thời gian, và cần trui rèn khả năng tổ chức dữ liệu cho data warehouse nha.

Nếu bạn mới hoàn toàn với data, chưa từng tiếp xúc với các bảng data, chưa biết dùng Pivot Table trong MS Excel/GG Sheets, chưa từng làm một cái dashboard, có lẽ khóa học này chưa phù hợp với bạn. Cái bạn cần hiện tại là một khóa học đưa bạn qua toàn bộ quy trình làm BI, từ khi nhận data thô cho đến khi phân tích, có insight hoàn chỉnh để đề xuất hành động.

Mình hy vọng sẽ gặp lại bạn, khi bạn đã tiếp xúc với data và nhận ra sự rối rắm lộn xộn của mấy cái bảng. Lúc đó hãy nhớ tới Vịt nha.


Học xong khóa này mình có thể trở thành Data Engineer không?

Khóa này sẽ cung cấp kiến thức về data modeling, làm data warehouse. Đây là một phần công việc của Data Engineer. Bạn sẽ cần học thêm các kiến thức khác để có thể đảm nhận vị trí Data Engineer nha.

Nếu bạn chỉ hứng thú với việc xử lý dữ liệu để làm data warehouse, có thể ý bạn là Analytics Engineer? Nếu bạn đang muốn trở thành một Analytics Engineer, khoá này sẽ trang bị đầy đủ kĩ năng để đảm nhận vị trí này.


Công ty mình cần làm data warehouse. Học xong khóa này mình có thể làm data warehouse liền được không?

Chắc chắn được. Ngay khi học xong khóa này, bạn sẽ có đủ kiến thức để làm một data warehouse hoàn chỉnh.

Nếu công ty bạn đã có sẵn data warehouse, sẽ có hai khả năng xảy ra:

  • Nếu data warehouse có chất lượng tốt, bạn sẽ hiểu rõ các thành phần của data warehouse và tiếp tục phát triển data warehouse hiện có

  • Nếu data warehouse có chất lượng thấp, bạn sẽ biết các điểm chưa tốt, các điểm cần cải thiện. Từ đó bạn sẽ đề xuất cải thiện hoặc đề xuất đập đi xây lại.

Lưu ý: Khóa học này KHÔNG BAO GỒM kiến thức về: cài đặt database, setup database, vận hành database, quản lý database. Để quản lý database cho data warehouse, bạn sẽ cần một Database Admin hoặc tìm hiểu thêm.


Công ty mình không dùng DBT mà dùng tool ABC thì mình có thể học khoá này không?

Được ạ. Trong khoá này, mình sẽ hướng dẫn về tư duy và cách làm. Sau khi bạn học xong, bạn vẫn có thể áp dụng những gì học được vào các tool khác (nhưng sẽ cần tư duy một xíu nha).

Mình chọn DBT và SQL cho khoá học này là vì:

  • Cơ hội tương lai: Theo mình nghĩ, DBT sẽ được dùng phổ biến, nên bạn học xong có thể ứng tuyển nhiều công ty, tại Việt Nam và cả thế giới luôn nha.

  • Minh bạch: SQL là ngôn ngữ lập trình, nên chúng ta có thể ghi ra cách mình suy nghĩ bằng việc viết ra code, từ đó dễ hơn trong việc kiểm tra, so sánh, học hỏi.

  • Version control: Việc quản lý cả data warehouse cần được kiểm soát chặt chẽ bằng version control, nếu không bạn sẽ làm sập cả data warehouse chỉ bằng việc thêm/sửa/xóa một dòng code. Bạn thử nghĩ bao nhiêu lần bạn chỉ sửa một chỗ trong file excel và cả file bị hư luôn? Hoặc là không dám sửa luôn vì sợ làm hư file?

Và tất cả lý do trên đảm bảo là bạn có đủ kiến thức để vận hành data warehouse ở tầm doanh nghiệp (chứ không chỉ ở tầm project sinh viên).

Who Should Attend!

  • Data Analyst muốn cải thiện data modeling để làm dashboard/phân tích dễ, nhanh và hiệu quả hơn
  • Data Engineer đang cần làm Data Warehouse
  • Analytics Engineer (role mới đang hot nè)

TAKE THIS COURSE

Tags

Subscribers

36

Lectures

213

TAKE THIS COURSE