Kursus ini dirancang untuk membantu Anda memahami dan mengimplementasikan berbagai teknik kompresi dan optimasi model machine learning. Dengan fokus pada bagaimana mengurangi ukuran model tanpa mengorbankan akurasi atau performa, Anda akan mempelajari cara melakukan quantization untuk mengurangi kebutuhan penyimpanan dan komputasi model. Selain itu, Anda akan mempelajari pruning neural networks untuk menghilangkan bobot yang tidak penting dan mengurangi risiko overfitting. Teknik lain seperti knowledge distillation akan diajarkan untuk membantu Anda membuat model yang lebih kecil namun tetap mempertahankan performa dari model besar. Anda juga akan diperkenalkan pada alat-alat seperti TensorRT untuk optimasi model serta ONNX untuk interoperabilitas model lintas platform. Kursus ini sangat penting bagi mereka yang ingin mengimplementasikan model machine learning dalam lingkungan yang terbatas sumber dayanya seperti perangkat edge dan mobile.