Production và Monitoring

~8 phút đọcModule 8 · Đưa AI vào sản phẩm

Nội dung đang được chuẩn bị.

Jobs và services

Phân biệt batch job (chạy theo lịch) và service (phục vụ real-time) — chọn đúng pattern cho từng bài toán.

Phục vụ dự đoán với độ trễ thấp: synchronous API, async queue, batching và autoscaling.

Tự động test → build → deploy khi push code — giảm lỗi thủ công và rút ngắn cycle phát hành.

sơ đồ: pipeline CI/CD cho ML service

Theo dõi latency, throughput, tỉ lệ lỗi và chất lượng dự đoán theo thời gian.

Tối ưu chi phí và tốc độ: model quantization, caching, batching, chọn instance phù hợp.

Phát hiện khi phân phối dữ liệu đầu vào lệch (data drift) hoặc chất lượng dự đoán tụt (model drift).

Thu thập feedback từ người dùng và hệ thống để cải thiện model theo thời gian.

Phân tích một hệ thống AI/ML thực tế: từ khi deploy đến khi phát hiện lỗi và cải thiện.

Sau module này bạn hiểu các vấn đề chính khi vận hành AI/ML thật, biết theo dõi hiệu năng, phát hiện drift và cải thiện model liên tục.