Course description

Kursus Data Cleaning & Handling Missing Data dirancang untuk membantu Anda memahami teknik pembersihan data dan menangani missing data, yang merupakan langkah penting sebelum analisis atau pemodelan data. Anda akan belajar mendeteksi, menghapus, serta mengimputasi nilai yang hilang, menangani outliers menggunakan Z-Score, menerapkan transformasi log untuk data yang tidak terdistribusi secara normal, dan mengatasi masalah ketidakseimbangan kelas dengan metode SMOTE. Kursus ini sangat cocok bagi siapa saja yang bekerja dengan data mentah dan perlu membersihkannya sebelum melakukan analisis lebih lanjut.

What will i learn?

  • Mendeteksi dan menangani missing data dengan metode yang tepat.
  • Menggunakan teknik imputasi untuk mengganti missing values.
  • Mengidentifikasi dan menangani outliers menggunakan Z-Score.
  • Menerapkan transformasi log untuk mengatasi data yang skewed.
  • Mengatasi masalah ketidakseimbangan data menggunakan SMOTE.
  • Membersihkan dan mempersiapkan dataset untuk analisis atau pemodelan lebih lanjut.

Requirements

  • Peserta harus memahami dasar-dasar bahasa pemrograman Python, terutama penggunaan pustaka seperti pandas dan NumPy.
  • Anda harus familiar dengan cara menggunakan Kaggle Notebook atau Jupyter Notebook untuk menjalankan kode Python yang disediakan selama kursus.
  • Pengetahuan dasar tentang statistik, seperti rata-rata, median, modus, serta konsep distribusi data dan standar deviasi, akan sangat membantu.
  • Kursus ini akan menggunakan pustaka Python seperti pandas, NumPy, dan scikit-learn. Familiaritas dengan cara menginstal dan menggunakan pustaka-pustaka ini diperlukan.
  • Karena kursus akan menggunakan platform online seperti Kaggle, peserta memerlukan koneksi internet yang stabil untuk mengakses materi dan menjalankan notebook.

Frequently asked question

Ya, kursus ini cocok untuk pemula yang sudah memiliki pengetahuan dasar tentang Python. Kami juga memberikan penjelasan dan contoh kode untuk memudahkan pemahaman.

Anda hanya perlu akses ke Kaggle Notebook atau Jupyter Notebook untuk menjalankan kode Python. Semua pustaka yang digunakan seperti pandas dan NumPy dapat diinstal melalui platform tersebut.

Ya, kursus ini dilengkapi dengan tugas-tugas praktik menggunakan dataset nyata seperti Titanic Dataset, di mana Anda akan melakukan pembersihan data, penanganan missing data, dan teknik lainnya.

Waktu penyelesaian tergantung pada kecepatan belajar Anda, namun umumnya peserta dapat menyelesaikan kursus ini dalam 3-5 hari dengan komitmen beberapa jam per hari.

Tergantung platform penyedia kursus. Jika kursus ini ditawarkan di platform tertentu seperti Kaggle atau Coursera, Anda mungkin berhak mendapatkan sertifikat setelah menyelesaikan kursus dan tugas yang diberikan.

ITS Academic

Free

Lectures

2

Quizzes

1

Skill level

Beginner

Expiry period

Lifetime

Related courses