E-poštno trženje in avtomatizacijaOrodja za trženje

Kako iskati po velikem spletnem mestu in izvleči podatke s pomočjo kričečega žabjega SEO Spider

Trenutno pomagamo številnim strankam pri migracijah na Marketo. Ker velika podjetja uporabljajo takšne poslovne rešitve, je to kot pajkova mreža, ki se skozi leta vpleta v procese in platforme, dokler se podjetja sploh ne zavedajo vsake stične točke.

S platformo za avtomatizacijo trženja v podjetju, kot je Marketo, so obrazci vstopna točka podatkov na spletnih mestih in ciljnih straneh. Podjetja imajo pogosto na svojih spletnih mestih na tisoče strani in na stotine obrazcev, ki jih je treba identificirati za posodobitev.

Odlično orodje za to je Screaming Frog's SEO Spider… morda najbolj priljubljena platforma na trgu SEO za iskanje po vsebini, revizijo in pridobivanje podatkov s spletnega mesta. Platforma, bogata s funkcijami, ponuja na stotine možnosti za skoraj vsako opravilo, ki ga potrebujete. Funkcije pa segajo daleč preko optimizacije za iskanje, z eno neverjetno koristno funkcijo za pridobivanje podatkov z vašega spletnega mesta med iskanjem po vsebini.

Krik žabe SEO Spider: pajkanje in izvleček

Ključna značilnost Screaming Frog SEO Spider je, da lahko na osnovi izvajate ekstrakcije po meri Redni izraz, XPathali CSSPath posebnosti. To je izjemno uporabno, saj želimo preiskati strankina spletna mesta ter revidirati in zajeti vrednosti MunchkinID in FormId s strani.

Z orodjem odprite Konfiguracija> Po meri> Izvleček za prepoznavanje elementov, ki jih želite izvleči.

izvleček žabe po meri

Zaslon za ekstrakcijo omogoča tako rekoč neomejeno zbiranje podatkov:

Pravila pridobivanja pajkov, ki kričijo z žabo

Izvleček regularnih izrazov, XPath in CSSPath

Za MunchkinID se identifikator nahaja znotraj skripta obrazca, ki je na strani:

<script type='text/javascript' id='marketo-fat-js-extra'>
    /* <![CDATA[ */
    var marketoFat = {
        "id": "123-ABC-456",
        "prepopulate": "",
        "ajaxurl": "https:\/\/yoursite.com\/wp-admin\/admin-ajax.php",
        "popout": {
            "enabled": false
        }
    };
    /* ]]> */

Nato uporabimo a Regex pravilo za zajem ID-ja znotraj oznake skripta, ki je vstavljena na stran:

Regex: ["']id["']: *["'](.*?)["']

Za ID obrazca so podatki v vhodni oznaki znotraj obrazca Marketo:

<input type="hidden" name="formid" class="mktoField mktoFieldDescriptor" value="1234">

Uporabljamo Pravilo XPath da zajamete ID iz obrazca, vstavljenega na stran. Poizvedba XPath išče obrazec z vnosom z imenom mogočen, nato ekstrakcija shrani vrednost:

XPath: //form/input[@name="formid"]/@value

Ekstrahiraj oznake sloga v vrstici

Stranki pomagamo očistiti spletno mesto, kjer je uporabila vgrajene sloge v vtičniku Elementor za prilagoditev tako rekoč vsakega elementa strani. Da bi ugotovili, kje so bili uporabljeni slogi v vrstici, smo spletno mesto postrgali z več pravili RegEx za ekstrakcijo po meri:

  • Slog razpona v vrstici:
<span\s+(?:[^>]*?\s+)?style\s*=\s*"([^"]*)"
  • Slog sidrne oznake v vrstici:
<a\s+(?:[^>]*?\s+)?style\s*=\s*"([^"]*)"
  • Slog oznake Div v vrstici:
<div\s+(?:[^>]*?\s+)?style\s*=\s*"([^"]*)"
  • Slog oznake naslova v vrstici:
<h+(?:[^>]*?\s+)?style\s*=\s*"([^"]*)"

Izključitve

At Martech Zone, spletno mesto ponujamo v več jezikih na različnih poddomenah. Iskanje po vsebini teh prevodov ni potrebno, saj vsa sredstva in informacije temeljijo na osrednjem spletnem mestu. Zaradi tega smo omogočili konfiguracijo seznama izključitev in dodali naslednje pravilo:

.*\.martech.zone

To lahko uporabite tudi za preskok iskanja po nepotrebnih poteh, kot so oznake, tako da dodate:

martech.zone/tag/.*

Prav tako ne želimo indeksirati naših strani AMP, ki se končajo v ?amp=1, torej v

Konfiguracija > Izključi razdelku smo dodali tudi:

https?://[^\s]+?\?amp=1

Platforma ima celo dobro metodo za testiranje nekaterih URL-ji proti pravilom, da zagotovite pravilno delovanje, preden preiščete spletno mesto.

ScreamingFrog > Konfiguracija > Izključi

Screaming Frog SEO Spider Upodabljanje JavaScripta

Druga odlična možnost Screaming Frog je, da niste omejeni na HTML na strani, lahko upodabljate kateri koli JavaScript, ki bo vstavil obrazce na vaše spletno mesto. Znotraj Konfiguracija> Pajek, lahko odprete zavihek Rendering in to omogočite.

Screaming Frog SEO Spider Upodabljanje JavaScripta

Za iskanje po vsebini spletnega mesta seveda traja nekaj več časa, vendar boste dobili obrazce, ki jih JavaScript odslika na strani odjemalca, in obrazce, ki so vstavljeni na strani strežnika.

Čeprav je to zelo specifična aplikacija, je izjemno koristna pri delu z velikimi spletnimi mesti. Vsekakor boste želeli preveriti, kje so vaši obrazci vdelani na celotnem spletnem mestu.

Prenesite Screaming Frog SEO Spider

Razkritje: Martech Zone v tem članku uporablja svoje pridružene povezave.

Douglas Karr

Douglas Karr je CMO of Odpri INSIGHTS in ustanovitelj Martech Zone. Douglas je pomagal na desetine uspešnih startupov MarTech, pomagal je pri skrbnem pregledu več kot 5 milijard USD pri prevzemih in naložbah Martecha ter še naprej pomaga podjetjem pri izvajanju in avtomatizaciji njihovih prodajnih in trženjskih strategij. Douglas je mednarodno priznan strokovnjak in govorec za digitalno transformacijo in MarTech. Douglas je tudi objavljen avtor Dummie's guide in knjige o poslovnem vodenju.

Povezani članki

Nazaj na vrh
Zapri

Zaznan Adblock

Martech Zone vam lahko zagotovi to vsebino brezplačno, ker naše spletno mesto monetiziramo s prihodki od oglasov, pridruženimi povezavami in sponzorstvi. Hvaležni bi bili, če bi med ogledom našega spletnega mesta odstranili zaviralec oglasov.