October 1st, 2007

Search Engine Bot (Crawler / Spider)

Halo, lagi lagi minggu ini kembali berurusan dengan mesin bodoh ini, Search Engine Bot alias Crawler alias Spider, merupakan mesin yang bertugas untuk mencari data di internet, dan memasukkannya kedalam search engine, selain itu juga mesin ini ternyata memiliki sifat yang buruk, yakni pemalas, malas untuk mengindex data yang sekiranya membuat dia menunggu lama. Dan juga memiliki kebodohan yang sering diakali oleh penjual ebook sampah di internet, dengan metoda yang terkenal seperti cloacking, yang masih juga bisa menipu mesin tersebut.

Soal menunggu, siapa sih yang betah menunggu, manusia saja tidak betah, konyolnya, mesin pun tidak betah, jika dirasa olehnya lambat untuk membuka sebuah situs, maka ditinggalkanlah situs tersebut. Tetapi terkadang, terlalu cepat diakses olehnya pun menjadi bermasalah, bandwidth terbuang terus.

Sebagai contoh, blog ini dikunjungi oleh bot 3-4 kali sehari, dan dikunjungi dalam waktu kurang dari 30 menit setelah saya menuliskan postingan ini, dalam satu bulan, bisa habis sekitar 1-3 GB bandwidth karena bot, padahal tulisan ini ngga ada penting pentingnya sama sekali, dan ga ada unsur pendidikannya sama sekali.

Tentunya anda bisa membayangkan bukan, jika situs saya ini merupakan situs institusi pendidikan, yang isinya mungkin penting untuk diakses oleh orang-orang dan juga bahkan memiliki pagerank 7, tetapi sayangnya situs tersebut sulit sekali untuk bisa diakses dengan mudah karena kekurangan bandwidth (atau manajemen bandwidth yang kurang baik?) bagaimana bisa diindex dengan mudah? dan bagaimana sebuah situs itu bisa dinilai memiliki content yang banyak karena dihambat firewall rule dimana mana?

Mau dikasih SEO jenis apa biar terindex? Topi Hitam ? Topi Putih ? atau Topi Miring ? :)

22 Responses to “Search Engine Bot (Crawler / Spider)”

  1. 1
    bearnuts Says:

    komen
    *udah*

  2. 2
    leksa Says:

    hahahahahah……..
    Maksud lo situs ini http://www.itb.ac.id …???

    Jangan stress gitu lah kawann..
    kemarin technical SEO udah gue kirim kan?

    sekarang tinggal fundamental SEo nya ajah,..
    boosting link sonoh,.. Paypal Indo dah aktif gitu, masak masih ga bisa beli2 link2..
    kalo mo konsul indexing link yg trustable, gue siap bantu,..

    yak, sayang,.. met naek haji ,.. banyak2 berdoa…

  3. 3
    sawung Says:

    huehuehue.
    bahas http://www.itb.ac.id neh.
    dari dulu terkenal susah diakses dari luar

  4. 4
    sikasep Says:

    oh ghitu..!!

  5. 5
    herry winandi Says:

    bot 3-4 kali sehari..

    1 bot = 1 pengunjung??, bagus dong biar jumlah pengunjungnya banyak..

    apa 1 bot = eksploitasi benwit??, maunya apa ya..

  6. 6
    rendy Says:

    @herry, 1 bot ngeindex situs ini keseluruhan

  7. 7
    rayza Says:

    topi miring aja… ga ngerti gw

  8. 8
    maseko Says:

    Bos hosting, kalo server indonesia yang SEF mana ya?

  9. 9
    ebook » Search Engine Bot (Crawler / Spider) Says:

    [...] Guild_of_Abundance wrote an interesting post today onHere’s a quick excerpt [...]

  10. 10
    Niwatori Says:

    wah pasti bukan bot baik-baik kekeke, sayah sih masih butuh mas bot buat menyalip “diki lingerie” dari search result google.. kalah sama daleman bo, btw jaman sekarang robots.txt masih efektif untuk mengatur traffic crawler ngga? dulu sih kan bisa diset Disallow all robots pake /

  11. 11
    kunderemp an-narkaulipsiy Says:

    Mengalami hal yang serupa.. trus pemilik hosting (dreamhost) dengan semena2 langsung mem-ban dengan membuat file .htaccess yang mem-ban b0t milik google dan yahoo.

  12. 12
    ayahshiva Says:

    topi miring aja paati banyak yang nyari hehehehe :D

  13. 13
    wildan Says:

    mending survey aja..siapa yang susah akses situs institusi pendidikan tersebut dan siapa yang lancar? Gw dari rumah gak pernah susah akses tuh..

    salam..

  14. 14
    Vavai Says:

    padahal tulisan ini ngga ada penting pentingnya sama sekali, dan ga ada unsur pendidikannya sama sekali.

    Makanya nulis yang berpendidikan dong boss, huikikik…

  15. 15
    Fajar Says:

    baru ngeh gw ternyata yang dibahas main site institut tekanan bathin
    :mrgreen:

  16. 16
    rendy Says:

    @Fajar, bukan main sitenya aja, tapi site yang ada diekornya juga

  17. 17
    Irvan Says:

    ya udah mulai survei.
    kalo gw pake centrin biasa aja, ga lemot2 banget.

    -IT-

  18. 18
    wildan Says:

    ayo survey..

    gw pake quasar, lancar jaya sekali

  19. 19
    Amal Says:

    Kelihatannya angka 1–3 GB terlalu besar deh untuk bot dalam sebulan, apalagi untuk blog secara umum saat ini di Indonesia. Total pemakaian saya, plus pengunjung, tidak sampai 2 GB/bulan.

    Okelah, pengunjung blog ini sangat mungkin lebih banyak, tapi jumlah bot relatif itu-itu saja. Atau ada bot khusus yang suka datang pilih-pilih, kekekeke…. ;-)

  20. 20
    rendy Says:

    @amal, emang bener kok 1-3 GB itu versi awstats

  21. 21
    fisto Says:

    baru tau saya kalau bot itu sampe makan bandwidth 3 GB per bulan…boros juga yah…

  22. 22
    rizoa Says:

    kalu aku malah pengen di kunjungi terus ama bot… :) biar kedetec banyak di se

Leave a Reply