Bỏ qua nội dung

Code Quality và Reproducibility

Nội dung đang được chuẩn bị.

Cấu trúc project AI/ML

Tổ chức thư mục rõ ràng, tách biệt data / notebooks / src / tests để project dễ đọc và dễ chia sẻ.

Scripting và CLI

Chuyển notebook thành script có thể chạy từ command line với arguments linh hoạt.

Terminal window
python train.py --model lr --epochs 50 --output models/v1/

Config management

Tách cấu hình ra file riêng (YAML, .env) thay vì hardcode — dễ thay đổi và không commit secret.

Logging

Ghi log đúng cách: level (DEBUG/INFO/WARNING/ERROR), format, và lưu ra file để debug sau.

Testing: code, data, model

  • Code tests: unit test các function xử lý dữ liệu
  • Data tests: kiểm tra schema, range, distribution
  • Model tests: kiểm tra output shape, xử lý edge case

Pre-commit và code style

Tự động kiểm tra format (black, ruff) trước mỗi commit — giữ codebase nhất quán.

Reproducibility

Cố định random seed, pin phiên bản thư viện, document môi trường để kết quả chạy lại được.

Mục tiêu sau module

Sau module này bạn có thể tổ chức project AI/ML gọn gàng, dễ chạy lại, phù hợp để đưa vào portfolio và làm nhóm.