Data và Experiment Workflow
Nội dung đang được chuẩn bị.
Data preparation và exploration
Đọc, làm sạch, khám phá phân phối dữ liệu trước khi đưa vào model.
Data preprocessing và validation
Chuẩn hoá, encode, xử lý missing values — và validate tự động để phát hiện vấn đề sớm.
Experiment tracking
Ghi lại tham số, chỉ số và artifact của mỗi lần chạy (MLflow, Weights & Biases) để so sánh và chọn model.
hình: bảng so sánh các lần chạy thí nghiệm
Model evaluation
Đánh giá đúng cách: cross-validation, hold-out, offline vs online metrics.
Model registry và versioning dữ liệu
Quản lý phiên bản model (model registry) và dữ liệu (DVC) để biết model nào train trên dữ liệu nào.
Mục tiêu sau module
Sau module này bạn biết quản lý dữ liệu có hệ thống, theo dõi thí nghiệm, so sánh nhiều model và tránh các lỗi phổ biến khi train/evaluate.