Advan – Menggunakan Pandas di Python wajib dipelajari terutama bagi Anda yang pekerjaannya seputar mengelola, memanipulasi, dan menganalisis data.
Berikut ini merupakan langkah-langkah menggunakan Pandas di Python, mulai dari instalasi hingga beberapa operasi dasar yang sering digunakan dalam analisis data.
1. Instalasi Pandas
Sebelum menggunakan Pandas, pastikan Anda telah menginstalnya. Anda bisa menginstal Pandas menggunakan pip, yang merupakan package manager untuk Python. Buka terminal atau command prompt, lalu ketik perintah berikut:
- pip install pandas
Jika Anda menggunakan Anaconda, Pandas biasanya sudah terinstal. Namun, jika belum, Anda bisa menginstalnya dengan perintah:
- conda install pandas
2. Mengimpor Pandas
Setelah instalasi selesai, Anda perlu mengimpor Pandas ke dalam script Python Anda. Biasanya, Pandas diimpor dengan alias `pd` untuk memudahkan penggunaannya.
- import pandas as pd
3. Membuat DataFrame
DataFrame adalah struktur data utama dalam Pandas. DataFrame dapat diibaratkan sebagai tabel dua dimensi yang terdiri dari baris dan kolom. Berikut adalah contoh cara membuat DataFrame dari dictionary:
- data = {
- ‘Nama’: [‘Andi’, ‘Budi’, ‘Cici’],
- ‘Usia’: [23, 25, 22],
- ‘Kota’: [‘Jakarta’, ‘Bandung’, ‘Surabaya’]
- df = pd.DataFrame(data)
print(df)
4. Membaca Data dari File
Pandas mendukung berbagai format file seperti CSV, Excel, dan SQL. Untuk membaca data dari file CSV, Anda bisa menggunakan fungsi `read_csv()`.
- df = pd.read_csv(‘data.csv’)
- print(df.head()) Menampilkan 5 baris pertama
5. Operasi Dasar pada DataFrame
Berikut adalah beberapa operasi dasar yang sering digunakan dalam Pandas:
- Melihat Data: Anda bisa menggunakan `head()` dan `tail()` untuk melihat beberapa baris awal atau akhir dari DataFrame.
- print(df.head())
- print(df.tail())
- Mengambil Kolom Tertentu: Anda bisa mengambil satu atau beberapa kolom dengan cara berikut.
- nama = df[‘Nama’]
- usia_dan_kota = df[[‘Usia’, ‘Kota’]]
- Filtering: Anda bisa memfilter baris berdasarkan kondisi tertentu.
- df_filtered = df[df[‘Usia’] > 23]
- Mengubah Nilai: Anda bisa mengubah nilai dalam DataFrame dengan mudah.
- df.loc[0, ‘Usia’] = 24 # Mengubah usia Andi menjadi 24
Baca Juga: Wajib Tahu, Mengoptimalkan Coding dengan Metode Debugging di Python
6. Menggunakan Fungsi Agregasi
Pandas memiliki berbagai fungsi agregasi untuk menganalisis data, seperti `mean()`, `sum()`, dan `count()`.
- rata_rata_usia = df[‘Usia’].mean()
- total_usia = df[‘Usia’].sum()
- jumlah_data = df[‘Nama’].count()
- print(f”Rata-rata Usia: {rata_rata_usia}”)
- print(f”Total Usia: {total_usia}”)
- print(f”Jumlah Data: {jumlah_data}”)
7. Menyimpan DataFrame ke File
Setelah selesai mengolah data, Anda mungkin ingin menyimpan hasilnya ke file. Pandas mendukung penyimpanan ke berbagai format file, seperti CSV dan Excel.
Menyimpan ke CSV:
- df.to_csv(‘hasil.csv’, index=False)
Menyimpan ke Excel:
- df.to_excel(‘hasil.xlsx’, index=False)
Pandas membantu mengubah data mentah menjadi informasi yang berguna dengan cara yang efisien dan mudah dipahami.
Advan Vanbook didedikasikan untuk pekerjaan profesional dan analisis data yang membutuhkan perangkat handal.
Ditenagai dengan performa tinggi dan daya tahan baterai yang kuat, Advan Vanbook memastikan Anda dapat mengolah data dengan efisien dan tanpa hambatan.
Desainnya yang elegan dan portabel juga memudahkan Anda bekerja di mana saja, menjadikannya mitra ideal untuk segala kebutuhan analisis data Anda. *** (muu)