Pengenalan Pandas DataFrame

Python
Pandas

Membuat Pandas Dataframe

Penulis

Pandu Mulya Muhammad Syah

Diterbitkan

24 September 2022

Pendahuluan

Pandas DataFrame meruapakan salah satu tipe data yang umum digunakan pada Python, terutama dalam analisis data. Dataframe merupakan tipe data dua dimensi, size-mutable (ukurannya dapat berubah), memiliki nilai data yang heterogen (terdiri dari beberapa tipe data seperti int, str dan float). Data ini dapat dibentuk dari dictionary yang berisi key sebagai nama kolom dan value sebagai nilai data pada kolom.

Membuat DataFrame

Membuat DataFrame dari dict

from pandas import DataFrame
d = {
    'nama': ['Ani', 'Budi', 'Cindy', 'Doni', 'Eka'],
    'umur': [20, 22, 19, 23, 21],
    'gender': ['P', 'L', 'P', 'L', 'L']
}

df = DataFrame(d)
df
nama umur gender
0 Ani 20 P
1 Budi 22 L
2 Cindy 19 P
3 Doni 23 L
4 Eka 21 L

Indeks atau indikasi baris pada tabel di atas dapat dirubah dengan menambahkan parameter index yang berisi list.

baris = ['satu', 'dua', 'tiga', 'empat', 'lima']
df = DataFrame(d, index=baris)
df
nama umur gender
satu Ani 20 P
dua Budi 22 L
tiga Cindy 19 P
empat Doni 23 L
lima Eka 21 L

Membuat DataFrame dari numpy ndarray

from numpy import array
data = [
    ['Ani', 'Budi', 'Cindy', 'Doni', 'Eka'],
    [20, 22, 19, 23, 21],
    ['P', 'L', 'P', 'L', 'L']
]
df = DataFrame(array(data))
df
0 1 2 3 4
0 Ani Budi Cindy Doni Eka
1 20 22 19 23 21
2 P L P L L

Baris dan kolom pada tabel di atas disesuaikan dengan baris dan kolom pada numpy ndarray di mana setiap list yang berada di dalam data merupakan baris sedangkan nilai pada masing-masing list tersebut merupakan kolom. Untuk mengubah tampilan tabel tersebut sesuai dengan tabel pada tabel sebelumnya, atribut transpose dapat digunakan (menjadikan baris sebagai kolom, begitu juga sebaliknya).

df = df.T
df.columns = ['nama', 'umur', 'gender']
df.index = baris
df
nama umur gender
satu Ani 20 P
dua Budi 22 L
tiga Cindy 19 P
empat Doni 23 L
lima Eka 21 L

Baris dan kolom pada DataFrame dapat diubah setelah dibuat dengan menetapakan atribut .columns dan .index dengan nilai baru yang ingin digunakan. Nilai baru tersebut biasa dalam bentuk tipe data list.