Melanjutkan postingan scraping sebelumnya, kali ini cenderung ke case tertentu. Kita akan grab data dari tokopedia berdasarkan nama produk dari hasil pencarian. Namun data yang kita ambil hanya halaman pertama alias belum termasuk paginasi, kemudian kita export hasilnya ke file .csv.
Buat file .py baru kemudian ketikkan code berikut :
Simpan, lalu ketikkan command dengan urutan :
- python <nama_file>.py <kata_kunci> <file_output>.csv
Jika ingin memodifikasi file, misal ingin scrape data berdasarkan kategori, atau hanya produk dari toko tertentu ubah beberapa value antara lain : base_url, parsing objek json di looping data['data']. Oh ya, untuk contoh kasus tokopedia, base_url ini bisa diperoleh dengan melihat network traffic di browser masing-masing, misal menggunakan firefox silakan ketikkan CTRL + SHIFT + J. Adapun konfigurasi lainnya seperti pengaturan IP maupun headers akan dibahas di bagian lain. Selamat mencoba :).
Tidak ada komentar:
Posting Komentar