Menggunakan Pandas untuk Memanipulasi Data

 

Pandas adalah sebuah library pada bahasa pemrograman Python yang digunakan untuk memanipulasi data secara efisien dan efektif. Pandas menyediakan berbagai macam fungsi dan metode untuk melakukan pengolahan data, termasuk membaca dan menulis file, pengelompokkan data, filtering data, dan melakukan perhitungan statistik.

Dalam artikel ini, kita akan membahas beberapa contoh penggunaan Pandas untuk memanipulasi data. Sebagai contoh, kita akan menggunakan dataset berikut:

NamaUsiaKotaNilai
Andi25Jakarta90
Budi30Surabaya85
Cici27Bandung92
Dedi28Jakarta87
Edo26Surabaya91
1. Membaca file CSV

Untuk membaca file CSV, kita dapat menggunakan fungsi read_csv pada Pandas. Contoh penggunaannya adalah sebagai berikut:

1
2
3
import pandas as pd

data = pd.read_csv('nama_file.csv')

2. Menampilkan data

Untuk menampilkan data, kita dapat menggunakan metode head pada objek DataFrame. Contoh penggunaannya adalah sebagai berikut:

1
print(data.head())

Output:

   Nama  Usia      Kota  Nilai
0  Andi    25   Jakarta     90
1  Budi    30  Surabaya     85
2  Cici    27   Bandung     92
3  Dedi    28   Jakarta     87
4   Edo    26  Surabaya     91

3. Mengambil kolom tertentu

Untuk mengambil kolom tertentu, kita dapat menggunakan metode loc atau iloc pada objek DataFrame. Contoh penggunaannya adalah sebagai berikut:

1
2
# Mengambil kolom Nama dan Usia
data[['Nama', 'Usia']]

Output:

   Nama  Usia
0  Andi    25
1  Budi    30
2  Cici    27
3  Dedi    28
4   Edo    26

4. Filtering data

Untuk melakukan filtering data, kita dapat menggunakan operator logika pada objek DataFrame. Contoh penggunaannya adalah sebagai berikut:

1
2
# Filtering data dengan nilai di atas 90
data[data['Nilai'] > 90]

Output :

   Nama  Usia     Kota  Nilai
2  Cici    27  Bandung     92
4   Edo    26  Surabaya     91

5. Menghitung statistik

Untuk menghitung statistik, kita dapat menggunakan metode describe pada objek DataFrame. Contoh penggunaannya adalah sebagai berikut:

1
2
# Menghitung rata-rata nilai
data['Nilai'].mean()

Output:

89.0

6. Menyimpan data

Untuk menyimpan data ke dalam file CSV, kita dapat menggunakan metode to_csv pada objek DataFrame. Contoh penggunaannya adalah sebagai berikut:

1
data.to_csv('nama_file.csv', index=False)

Dalam artikel ini, kita telah melihat beberapa contoh penggunaan Pandas untuk memanipulasi data. Pandas menyediakan banyak fitur dan fungsi lainnya yang sangat berguna dalam memproses data, seperti melakukan pengelompokkan data, join antar tabel, melakukan operasi matematika pada kolom tertentu, dan sebagainya. Pandas sangat cocok digunakan untuk memproses data dalam skala besar maupun kecil.

Dalam menggunakan Pandas, pastikan kita sudah memahami konsep-konsep dasar seperti DataFrame, Series, dan cara membaca dan menulis file. Dengan begitu, kita dapat memanipulasi data dengan efisien dan efektif.

Demikianlah artikel singkat ini tentang penggunaan Pandas untuk memanipulasi data. Semoga bermanfaat bagi Anda yang ingin belajar memproses data menggunakan Python.

Tidak ada komentar

© 2020 Pak Aditya. Diberdayakan oleh Blogger.