Bỏ qua nội dung

Data và Experiment Workflow

Nội dung đang được chuẩn bị.

Data preparation và exploration

Đọc, làm sạch, khám phá phân phối dữ liệu trước khi đưa vào model.

Data preprocessing và validation

Chuẩn hoá, encode, xử lý missing values — và validate tự động để phát hiện vấn đề sớm.

Experiment tracking

Ghi lại tham số, chỉ số và artifact của mỗi lần chạy (MLflow, Weights & Biases) để so sánh và chọn model.

hình: bảng so sánh các lần chạy thí nghiệm

Model evaluation

Đánh giá đúng cách: cross-validation, hold-out, offline vs online metrics.

Model registry và versioning dữ liệu

Quản lý phiên bản model (model registry) và dữ liệu (DVC) để biết model nào train trên dữ liệu nào.

Mục tiêu sau module

Sau module này bạn biết quản lý dữ liệu có hệ thống, theo dõi thí nghiệm, so sánh nhiều model và tránh các lỗi phổ biến khi train/evaluate.