Web Scrapping, Sebuah Teknik Andalan Blogger Dunia

0
124

Pengertian web scraping

Web scraping (panen web) adalah pengambilan sebuah dokumen semi-terstruktur dari internet, umumnya berupa halaman-halaman web dalam bahasa markup seperti HTML atau XHTML, dan menganalisis dokumen tersebut untuk diambil data tertentu dari halaman tersebut. Istilah gampangnya yaitu pengambilan konten dari situs satu ke situs lain.

Web scraping banyak digunakan para blogger / pemilik situs web untuk mengalihkan kata kunci yang dicari visitor ke situs lain yang dirasa paling lengkap misal google, wikipedia jika artikel yang dicari tidak ada. Tidak menutup kemungkinan juga scraping web ini digunakan untuk artikel dimana isi kontenya langsung diambil dari situs lain misal konten dari wikipedia. Contohnya pada pesonainformatika.com misalkan kata kunci yang dicari tidak ditemukan, maka otomatis akan melakukan scraping dari situs wikipedia berdasarkan kata kunci atau keyword yang dicari.

Web scraping juga banyak sekali digunakan untuk mengambil sebagian data dari berbagai situs. Contohnya saya akan menampilkan jadwal imsak di web saya dimana data berasal dari KEMENAG , atau mengambil data prakiraan cuaca. Web scraping juga bisa digunakan untuk mengexport kumpulan list data dari website ke format file csv, json, excel, dan lainya.Tutorialnya untuk kasus ini menyusul 😀

Untuk pengguna wordpress pada contoh kali ini, mungkin tidak terlalu repot karena tersedia plugin WP web scraper di wordpress.org. Cara penggunaanyapun juga mudah, tinggal import alamat konten yang akan di scraping, misal ingin mengambil konten yang berada dalam alamat https://id.wikipedia.org/wiki/Daerah_Khusus_Ibukota_Jakarta , kita buat postingan baru seperti biasa, menuliskan judul seperti biasanya, kemudian bagian konten kita tulis seperti ini :

Untuk praktek digunakan pada fungsi search sebuah situs yang otomatis akan menscaping jika artikel tidak ditemukan berdasarkan kata kunci, kita perlu merubah sedikit pada file search.php yaitu dengan menambahkan beberapa kode. contoh sebagai berikut :

1
2
3
4
5
6
7
    else { ?>
    
<h2 class="entry-title">
        <?php _e( 'Pencarian tidak ditemukan pada pesonainformatika.com, keyword kami alihkan ke pencarian situs wikipedia.', 'search' ); ?>
    </h2>
    <?php $kueri_cari = get_search_query(); $keyw=str_replace(" "," ",$kueri_cari); $keyw=str_replace(" ","+",$kueri_cari); echo wpws_get_content('https://en.wikipedia.org/w/index.php?search='.$keyw , '' ); } ?>

kode diatas adalah blok kode didalam else pada file search.php jika artikel tidak ditemukan.

LEAVE A REPLY

Please enter your comment!
Please enter your name here