Kako iskati po velikem spletnem mestu in izvleči podatke s pomočjo kričečega žabjega SEO Spider
Trenutno pomagamo številnim strankam pri migracijah na Marketo. Ker velika podjetja uporabljajo takšne poslovne rešitve, je to kot pajkova mreža, ki se skozi leta vpleta v procese in platforme, dokler se podjetja sploh ne zavedajo vsake stične točke.
S platformo za avtomatizacijo trženja v podjetju, kot je Marketo, so obrazci vstopna točka podatkov na spletnih mestih in ciljnih straneh. Podjetja imajo pogosto na svojih spletnih mestih na tisoče strani in na stotine obrazcev, ki jih je treba identificirati za posodobitev.
Odlično orodje za to je Screaming Frog's SEO Spider… morda najbolj priljubljena platforma na trgu SEO za iskanje po vsebini, revizijo in pridobivanje podatkov s spletnega mesta. Platforma, bogata s funkcijami, ponuja na stotine možnosti za skoraj vsako opravilo, ki ga potrebujete. Funkcije pa segajo daleč preko optimizacije za iskanje, z eno neverjetno koristno funkcijo za pridobivanje podatkov z vašega spletnega mesta med iskanjem po vsebini.
Krik žabe SEO Spider: pajkanje in izvleček
Ključna značilnost Screaming Frog SEO Spider je, da lahko na osnovi izvajate ekstrakcije po meri Redni izraz, XPathali CSSPath posebnosti. To je izjemno uporabno, saj želimo preiskati strankina spletna mesta ter revidirati in zajeti vrednosti MunchkinID in FormId s strani.
Z orodjem odprite Konfiguracija> Po meri> Izvleček za prepoznavanje elementov, ki jih želite izvleči.
Zaslon za ekstrakcijo omogoča tako rekoč neomejeno zbiranje podatkov:
Izvleček regularnih izrazov, XPath in CSSPath
Za MunchkinID se identifikator nahaja znotraj skripta obrazca, ki je na strani:
<script type='text/javascript' id='marketo-fat-js-extra'>
/* <![CDATA[ */
var marketoFat = {
"id": "123-ABC-456",
"prepopulate": "",
"ajaxurl": "https:\/\/yoursite.com\/wp-admin\/admin-ajax.php",
"popout": {
"enabled": false
}
};
/* ]]> */
Nato uporabimo a Regex pravilo za zajem ID-ja znotraj oznake skripta, ki je vstavljena na stran:
Regex: ["']id["']: *["'](.*?)["']
Za ID obrazca so podatki v vhodni oznaki znotraj obrazca Marketo:
<input type="hidden" name="formid" class="mktoField mktoFieldDescriptor" value="1234">
Uporabljamo Pravilo XPath da zajamete ID iz obrazca, vstavljenega na stran. Poizvedba XPath išče obrazec z vnosom z imenom mogočen, nato ekstrakcija shrani vrednost:
XPath: //form/input[@name="formid"]/@value
Ekstrahiraj oznake sloga v vrstici
Stranki pomagamo očistiti spletno mesto, kjer je uporabila vgrajene sloge v vtičniku Elementor za prilagoditev tako rekoč vsakega elementa strani. Da bi ugotovili, kje so bili uporabljeni slogi v vrstici, smo spletno mesto postrgali z več pravili RegEx za ekstrakcijo po meri:
- Slog razpona v vrstici:
<span\s+(?:[^>]*?\s+)?style\s*=\s*"([^"]*)"
- Slog sidrne oznake v vrstici:
<a\s+(?:[^>]*?\s+)?style\s*=\s*"([^"]*)"
- Slog oznake Div v vrstici:
<div\s+(?:[^>]*?\s+)?style\s*=\s*"([^"]*)"
- Slog oznake naslova v vrstici:
<h+(?:[^>]*?\s+)?style\s*=\s*"([^"]*)"
Izključitve
At Martech Zone, spletno mesto ponujamo v več jezikih na različnih poddomenah. Iskanje po vsebini teh prevodov ni potrebno, saj vsa sredstva in informacije temeljijo na osrednjem spletnem mestu. Zaradi tega smo omogočili konfiguracijo seznama izključitev in dodali naslednje pravilo:
.*\.martech.zone
To lahko uporabite tudi za preskok iskanja po nepotrebnih poteh, kot so oznake, tako da dodate:
martech.zone/tag/.*
Prav tako ne želimo indeksirati naših strani AMP, ki se končajo v ?amp=1
, torej v
https?://[^\s]+?\?amp=1
Platforma ima celo dobro metodo za testiranje nekaterih URL-ji proti pravilom, da zagotovite pravilno delovanje, preden preiščete spletno mesto.
Screaming Frog SEO Spider Upodabljanje JavaScripta
Druga odlična možnost Screaming Frog je, da niste omejeni na HTML na strani, lahko upodabljate kateri koli JavaScript, ki bo vstavil obrazce na vaše spletno mesto. Znotraj Konfiguracija> Pajek, lahko odprete zavihek Rendering in to omogočite.
Za iskanje po vsebini spletnega mesta seveda traja nekaj več časa, vendar boste dobili obrazce, ki jih JavaScript odslika na strani odjemalca, in obrazce, ki so vstavljeni na strani strežnika.
Čeprav je to zelo specifična aplikacija, je izjemno koristna pri delu z velikimi spletnimi mesti. Vsekakor boste želeli preveriti, kje so vaši obrazci vdelani na celotnem spletnem mestu.
Prenesite Screaming Frog SEO Spider
Razkritje: Martech Zone v tem članku uporablja svoje pridružene povezave.