Cos’è
Un broken link è un collegamento ipertestuale che punta a una risorsa non esistente, non raggiungibile o che restituisce un errore HTTP. Si distinguono due categorie principali:
- Link interni rotti: collegamenti tra pagine dello stesso dominio. Sono sotto il controllo diretto di chi gestisce il sito e, di solito, vanno corretti con priorità più alta.
- Link esterni rotti: collegamenti verso un altro dominio che è stato rimosso, ha cambiato URL o non esiste più. Non sono sotto il controllo del proprietario del sito, ma è comunque buona norma ripulirli per l’utente.
Rientrano nella categoria anche le immagini o asset rotti (<img>, file CSS/JS), le catene di redirect (un link che passa per più passaggi prima di arrivare a destinazione) e i link bloccati da errori del server.
Nota Tecnica: Googlebot smette di seguire una catena di redirect dopo un massimo di 5 passaggi, trattandola come un errore.
Perché è Importante
- Esperienza utente: un link rotto interrompe la navigazione e può aumentare l’abbandono della pagina.
- Efficienza della scansione: i crawler spendono tempo su vicoli ciechi invece di scoprire contenuti nuovi o aggiornati.
- Segnale di manutenzione: molti link rotti, specialmente se concentrati in un punto del sito, indicano spesso un errore strutturale più che tanti problemi isolati.
Info: Google considera i 404 una parte naturale del web. Se una pagina vecchia non ha un equivalente, restituire 404 (o 410, se la rimozione è definitiva) è la risposta corretta e non penalizza l’intero sito.
Warning: durante una migrazione del sito (cambio di CMS, di struttura degli URL o di hosting) i link rotti e gli URL vecchi sono frequenti. Vanno gestiti con attenzione: usa redirect 301 solo quando esiste davvero una pagina equivalente, evita redirect globali verso la homepage e, se non esiste un equivalente, lascia che la pagina restituisca una 404 utile e chiara prima di andare online.
Come CyberLens lo Controlla
CyberLens analizza un campione di link interni della pagina e verifica:
- quanti link interni sono stati controllati nel campione;
- quanti broken internal links sono stati trovati;
- l’URL rotto e lo status HTTP rilevato;
- eventuali link saltati durante l’analisi.
Technical Note: CyberLens oggi controlla un campione di link interni della pagina, non l’intero sito. Su pagine con molti collegamenti è possibile che alcuni link rotti non vengano rilevati in una singola scansione.
Future Enhancements: la verifica sistematica dei link esterni, delle immagini o asset rotti, delle catene di redirect e di una scansione più estesa del sito sono possibili evoluzioni future, non ancora disponibili.
Possibili Risultati
Ogni finding è indipendente: puoi andare direttamente a quello segnalato nel tuo report.
Link interno rotto
Severità: Alta Uno o più link interni non portano a una destinazione valida sullo stesso dominio. Può bloccare la navigazione dell’utente e interrompere il percorso del crawler.
Link interno non raggiungibile / errore HTTP
Severità: Alta
Il link interno restituisce un errore HTTP, come 404, 410, 403, 5xx o un timeout. CyberLens mostra l’URL coinvolto e lo status rilevato.
Nessun broken link rilevato nel campione
Severità: Bassa / Info Nel campione analizzato non sono emersi link interni rotti. Questo non esclude che altri link della pagina, non inclusi nel campione, possano richiedere una verifica successiva.
Future Enhancements: finding più granulari su link esterni, asset rotti, redirect chain e copertura più ampia del sito possono essere aggiunti in evoluzioni future.
Tip: se vedi questo finding, controlla prima gli elementi comuni a più pagine (menu, footer, sidebar): è lì che si trovano più spesso gli errori che generano molti link rotti in un colpo solo.
Azione Consigliata
La priorità dipende dal finding:
- Link interno rotto o errore HTTP: correggere con priorità, soprattutto se riguarda menu, CTA o pagine chiave.
- Nessun broken link nel campione: non serve un intervento immediato, ma vale la pena ricontrollare dopo aggiornamenti importanti.
- Finding futuri più avanzati: eventuali controlli su link esterni, asset o redirect chain andranno valutati come evoluzioni successive.
Come Risolvere
WordPress
Evita di lasciare attivi in produzione strumenti di scansione continua dei link se non sono davvero necessari: possono saturare CPU e database su hosting condivisi. Per i redirect, preferisci una gestione semplice e controllata nel CMS o a livello di server, senza appesantire il sito con automazioni inutili.
Sito Statico
Integra un controllo automatico dei link nella pipeline CI/CD: se un link interno è rotto, la build può fallire prima di andare online, evitando che l’errore arrivi in produzione.
Nota: strumenti tecnici specifici possono essere valutati in base allo stack del progetto, ma il principio resta lo stesso: bloccare prima della pubblicazione i link interni che non rispondono correttamente.
CMS / E-commerce
Configura regole di redirect automatiche quando un prodotto viene disattivato o spostato di categoria, così il link non resta orfano. Mantieni sincronizzati i dati di catalogo con le pagine effettivamente pubblicate.
Migrazione del Sito
Prima di andare online con un nuovo CMS, hosting o struttura di URL, mappa ogni URL vecchio verso il suo equivalente nuovo con redirect 301 solo quando esiste davvero una pagina equivalente e pertinente. Verifica i link interni e i redirect prima del lancio, non dopo.
Warning: reindirizzare in blocco tutte le vecchie pagine alla homepage è una pratica da evitare: Google la interpreta come Soft 404, annullando il valore del passaggio e confondendo l’utente. Se non esiste un equivalente, lascia che la pagina restituisca una 404 personalizzata e utile, con una ricerca interna e link di navigazione alternativi.
Link Esterni
I link esterni non sono parte del controllo attuale di CyberLens: se una fonte esterna cambia URL o sparisce, verificane la nuova destinazione prima di rimuovere il link oppure sostituiscilo con una fonte attiva e aggiornata.
Come Appare in CyberLens
Nel report di scansione, il finding sui broken link viene mostrato con:
- il numero di link interni controllati nel campione;
- il numero di broken internal links trovati;
- l’URL rotto e lo status HTTP rilevato;
- la pagina di origine del link, per individuare rapidamente dove intervenire;
- i link saltati durante l’analisi;
- il blocco Technical details con
page_url,checked_links,broken_links,discovered_urlseskipped_links.
Nel report può comparire la dicitura “broken internal links”, cioè link interni rotti rilevati nel campione analizzato.
Guide Correlate
- Gestione del file robots.txt
- Gestione della Sitemap XML
- Controllo del crawl budget