Code Quality và Reproducibility
Nội dung đang được chuẩn bị.
Cấu trúc project AI/ML
Tổ chức thư mục rõ ràng, tách biệt data / notebooks / src / tests để project dễ đọc và dễ chia sẻ.
Scripting và CLI
Chuyển notebook thành script có thể chạy từ command line với arguments linh hoạt.
python train.py --model lr --epochs 50 --output models/v1/Config management
Tách cấu hình ra file riêng (YAML, .env) thay vì hardcode — dễ thay đổi và không commit secret.
Logging
Ghi log đúng cách: level (DEBUG/INFO/WARNING/ERROR), format, và lưu ra file để debug sau.
Testing: code, data, model
- Code tests: unit test các function xử lý dữ liệu
- Data tests: kiểm tra schema, range, distribution
- Model tests: kiểm tra output shape, xử lý edge case
Pre-commit và code style
Tự động kiểm tra format (black, ruff) trước mỗi commit — giữ codebase nhất quán.
Reproducibility
Cố định random seed, pin phiên bản thư viện, document môi trường để kết quả chạy lại được.
Mục tiêu sau module
Sau module này bạn có thể tổ chức project AI/ML gọn gàng, dễ chạy lại, phù hợp để đưa vào portfolio và làm nhóm.