Menggunakan Pandas untuk Memanipulasi Data
Daftar Isi
Pandas adalah sebuah library pada bahasa pemrograman Python yang digunakan untuk memanipulasi data secara efisien dan efektif. Pandas menyediakan berbagai macam fungsi dan metode untuk melakukan pengolahan data, termasuk membaca dan menulis file, pengelompokkan data, filtering data, dan melakukan perhitungan statistik.
Dalam artikel ini, kita akan membahas beberapa contoh penggunaan Pandas untuk memanipulasi data. Sebagai contoh, kita akan menggunakan dataset berikut:
Nama | Usia | Kota | Nilai |
---|---|---|---|
Andi | 25 | Jakarta | 90 |
Budi | 30 | Surabaya | 85 |
Cici | 27 | Bandung | 92 |
Dedi | 28 | Jakarta | 87 |
Edo | 26 | Surabaya | 91 |
1. Membaca file CSV
Untuk membaca file CSV, kita dapat menggunakan fungsi read_csv pada Pandas. Contoh penggunaannya adalah sebagai berikut:
1 2 3 | import pandas as pd data = pd.read_csv('nama_file.csv') |
2. Menampilkan data
Untuk menampilkan data, kita dapat menggunakan metode head pada objek DataFrame. Contoh penggunaannya adalah sebagai berikut:
1 | print(data.head()) |
Output:
Nama Usia Kota Nilai 0 Andi 25 Jakarta 90 1 Budi 30 Surabaya 85 2 Cici 27 Bandung 92 3 Dedi 28 Jakarta 87 4 Edo 26 Surabaya 91
3. Mengambil kolom tertentu
Untuk mengambil kolom tertentu, kita dapat menggunakan metode loc atau iloc pada objek DataFrame. Contoh penggunaannya adalah sebagai berikut:
1 2 | # Mengambil kolom Nama dan Usia data[['Nama', 'Usia']] |
Output:
Nama Usia 0 Andi 25 1 Budi 30 2 Cici 27 3 Dedi 28 4 Edo 26
4. Filtering data
Untuk melakukan filtering data, kita dapat menggunakan operator logika pada objek DataFrame. Contoh penggunaannya adalah sebagai berikut:
1 2 | # Filtering data dengan nilai di atas 90 data[data['Nilai'] > 90] |
Output :
Nama Usia Kota Nilai 2 Cici 27 Bandung 92 4 Edo 26 Surabaya 91
5. Menghitung statistik
Untuk menghitung statistik, kita dapat menggunakan metode describe pada objek DataFrame. Contoh penggunaannya adalah sebagai berikut:
1 2 | # Menghitung rata-rata nilai data['Nilai'].mean() |
Output:
89.0
6. Menyimpan data
Untuk menyimpan data ke dalam file CSV, kita dapat menggunakan metode to_csv pada objek DataFrame. Contoh penggunaannya adalah sebagai berikut:
1 | data.to_csv('nama_file.csv', index=False) |
Dalam artikel ini, kita telah melihat beberapa contoh penggunaan Pandas untuk memanipulasi data. Pandas menyediakan banyak fitur dan fungsi lainnya yang sangat berguna dalam memproses data, seperti melakukan pengelompokkan data, join antar tabel, melakukan operasi matematika pada kolom tertentu, dan sebagainya. Pandas sangat cocok digunakan untuk memproses data dalam skala besar maupun kecil.
Dalam menggunakan Pandas, pastikan kita sudah memahami konsep-konsep dasar seperti DataFrame, Series, dan cara membaca dan menulis file. Dengan begitu, kita dapat memanipulasi data dengan efisien dan efektif.
Demikianlah artikel singkat ini tentang penggunaan Pandas untuk memanipulasi data. Semoga bermanfaat bagi Anda yang ingin belajar memproses data menggunakan Python.
Posting Komentar