from pandas import read_excel
= read_excel('data_anggota.xlsx')
df df
nama_depan | nama_belakang | |
---|---|---|
0 | Ani | Lestari |
1 | Budi | Hermawan |
2 | Cindy | Amara |
3 | Dodi | Mulyanto |
4 | Eka | Saputra |
Mengolah data menggunakan Pandas: membaca data, menambah kolom dan menyimpan ke dalam file baru.
Pandu Mulya Muhammad Syah
24 September 2022
Pandas menjadi salah satu library yang banyak digunakan dalam pemrosesan data karena memiliki banyak fitur yang mendukung. Penggunaan bahasa pemrograman dalam pemrosesan data menjadi pilihan yang baik terutama jika data yang diolah memiliki ukuran yang besar dan variasi yang beragam. Pada artikel ini akan dijelaskan secara ringkah penggunaan Pandas dalam pemrosesan data mulai dari pembacaan hingga pembuatan berkas hasil pengolahan.
Data dalam bentuk file seperti csv
, json
maupun xlsx
dapat dibaca menggunakan Pandas menggunakan metode yang tersedia. Data yang digunakan berada dalam format xlsx
dan memiliki nama data_anggota.xlsx
, untuk membaca file tersebut digunakan metode read_excel()
.
{bash, echo=FALSE} ls *xlsx
Pada DataFrame
di atas akan ditambahkan kolom baru yang berisi nama lengkap dari masing-masing anggota. Karena tipe data pada kolom nama depan dan belakang sama (str
atau object
) langkah pemrosesan tipe data str
dapat dilakukan seperti di bawah ini.
df['nama_lengkap'] = df.nama_depan + ' ' + df.nama_belakang
df['email'] = df.nama_depan.str.lower() + '.' + df.nama_belakang.str.lower() + '@mail.com'
df
nama_depan | nama_belakang | nama_lengkap | ||
---|---|---|---|---|
0 | Ani | Lestari | Ani Lestari | ani.lestari@mail.com |
1 | Budi | Hermawan | Budi Hermawan | budi.hermawan@mail.com |
2 | Cindy | Amara | Cindy Amara | cindy.amara@mail.com |
3 | Dodi | Mulyanto | Dodi Mulyanto | dodi.mulyanto@mail.com |
4 | Eka | Saputra | Eka Saputra | eka.saputra@mail.com |
Selain nama lengkap, kolom email juga dapat ditambahkan. Kolom email memiliki format penawaan nama_depan.nama_belakang@mail.com
, metode str.lower()
pada contoh di atas berfungsi untuk membuat setiap karakter menjadi huruf kecil.
Data yang telah diolah dapat disimpak ke dalam file baru menggunakan metode to_csv()
untuk format csv
atau to_excel
untuk format excel seperti xlsx
atau pun xls
.
{bash, echo=FALSE} ls hasil_pengolahan*