Kako iskati po velikem spletnem mestu in izvleči podatke s pomočjo kričečega žabjega SEO Spider

Krikanje žaba SEO Spider

Trenutno pomagamo več strankam Marketo migracije. Ker velika podjetja uporabljajo takšne rešitve za podjetja, je to kot pajkova mreža, ki se z leti vplete v procese in platforme ... do te mere, da se podjetja sploh ne zavedajo vsake stične točke.

S platformo za avtomatizacijo trženja v podjetju, kot je Marketo, so obrazci vstopna točka podatkov na spletnih mestih in ciljnih straneh. Podjetja imajo na svojih spletnih mestih pogosto na tisoče strani in na stotine obrazcev, ki jih je treba določiti za posodobitev.

Odlično orodje za to je Screaming Frog's SEO Spider... morda najbolj priljubljena platforma na trgu za pajkanje, revidiranje in pridobivanje podatkov s spletnega mesta. Platforma je bogata s funkcijami in ponuja na stotine možnosti za skoraj vsako nalogo, ki jo potrebujete.

Krik žabe SEO Spider: pajkanje in izvleček

Ključna značilnost Screaming Frog SEO Spider je, da lahko na osnovi izvajate ekstrakcije po meri Regex, XPathali CSSPath posebnosti. To je zelo koristno, saj želimo preiskati strankina spletna mesta ter pregledati in zajeti vrednosti MunchkinID in FormId s strani.

Z orodjem odprite Konfiguracija> Po meri> Izvleček za prepoznavanje elementov, ki jih želite izvleči.

izvleček žabe po meri

Zaslon za ekstrakcijo omogoča tako rekoč neomejeno zbiranje podatkov:

Pravila pridobivanja pajkov, ki kričijo z žabo

Izvleček regularnih izrazov, XPath in CSSPath

Za MunchkinID se identifikator nahaja v skriptu obrazca na strani:

<script type='text/javascript' id='marketo-fat-js-extra'>
    /* <![CDATA[ */
    var marketoFat = {
        "id": "123-ABC-456",
        "prepopulate": "",
        "ajaxurl": "https:\/\/yoursite.com\/wp-admin\/admin-ajax.php",
        "popout": {
            "enabled": false
        }
    };
    /* ]]> */

Nato uporabimo a Regex pravilo za zajem ID-ja znotraj oznake skripta, ki je vstavljena na stran:

Regex: ["']id["']: *["'](.*?)["']

Za ID obrazca so podatki v vhodni oznaki znotraj obrazca Marketo:

<input type="hidden" name="formid" class="mktoField mktoFieldDescriptor" value="1234">

Uporabljamo Pravilo XPath za zajem ID-ja znotraj obrazca, ki je vstavljen na stran. Poizvedba XPath išče obrazec z vnosom z imenom mogočen, nato ekstrakcija shrani vrednost:

XPath: //form/input[@name="formid"]/@value

Kričanje žabe SEO Spider Javascript upodabljanje

Druga odlična možnost Screaming Frog je, da niste omejeni na HTML na strani, lahko upodabljate kateri koli JavaScript, ki bo vstavljal obrazce na vaše spletno mesto. Znotraj Konfiguracija> Pajek, lahko odprete zavihek Rendering in to omogočite.

Kričanje žabe SEO Spider Javascript upodabljanje

Za iskanje po vsebini spletnega mesta seveda traja nekaj več časa, vendar boste dobili obrazce, ki jih JavaScript odslika na strani odjemalca, in obrazce, ki so vstavljeni na strani strežnika.

Čeprav je to zelo specifična aplikacija, je izjemno koristna pri delu z velikimi spletnimi mesti. Vsekakor boste želeli preveriti, kje so vaši obrazci vdelani na celotnem spletnem mestu.

Prenesite Screaming Frog SEO Spider

Kaj menite?

Ta stran uporablja Akismet za zmanjšanje nezaželene pošte. Preberite, kako se vaš komentar obravnava.