Belajar Kode Program

Blog belajar menulis kode program dan aplikasi komputer

Sabtu, 12 Februari 2022

Gabungkan Banyak File Excel Mudah dengan Python

Mungkin jika kita punya Microsoft Excel terbaru, dengan mudah saja kita gabungkan banyak file excel menjadi satu file saja. Sayangnya, pada versi 2016 ke bawah, fitur ini belum tersedia. Jika terpaksa harus upgrade Excel, tentu membutuhkan kocek yang tak sedikit. Alternatifnya, kita bisa gunakan pemrograman python untuk membantu menyelesaikan permasalahan ini. 

Namun, kita butuh library yang namanya panda. Tapi tenang saja, gratis kok. Yang kita butuhkan hanya python, panda, dan module openpyxl. Untuk panda dan openpyxl, kita butuh pip, sebuah tool yang berfungsi sebagai manajer paket pada python. Jadi, untuk memudahkan menginstal library, modul, atau paket pada python, kita dimudahkan dengan pip. Cukup ketik di konsol terminal: pip instal nama_library. Selesai.

Jadi, untuk teman-teman yang sudah ada pandas dan openpyxl, bisa langsung ke bagian sintaks gabung file excel.


Instal library pandas

Untuk menginstalnya, ketikkan perintah di konsol terminal kita:

  • pip install manager
  • pip install pandas

Instal modul openpyxl

Untuk menginstal modul ini, ketik perintah berikut:

pip install openpyxl


Sintaks gabung file excel

Langkah yang paling penting adalah bagaimana kita membuat perintah dengan bahasa python. Kita bisa membuat file python (*.py) pada folder yang isinya adalah file-file excel. Sintaksnya kurang lebih seperti ini:


import pandas as pd
import glob
all_df = pd.DataFrame()
for f in glob.glob("*-cobagabung.xlsx"):
 df = pd.read_excel(f)
 all_df = pd.concat([all_df, df])
all_df.to_excel("alls.xlsx")


Oke, itu saja. Dalam hitungan detik, tapi mungkin bisa menit, tergantung seberapa banyak file dan kapasitas komputer yang kita gunakan.

Oiya, untuk memilih sheet tertentu pada file excel, kita bisa gunakan perintah seperti berikut:


df = pd.read_excel(f, sheet_name = "nama_sheet")


Sebenarnya untuk nama sheet ini bisa diisi nilai angka yang dimulai dari 0. Secara default, sheet_name ini berisi angka nol (0), yaitu sheet pertama pada file excel. Kalau kita mau membaca sheet kedua, berarti sheet_name harus kita beri nilai angka 1.

Selengkapnya bisa kita pelajari pada referensi ini: https://pandas.pydata.org/docs/reference/api/pandas.read_excel.html

Selamat mencoba, semoga bermanfaat 


Tidak ada komentar:

Posting Komentar