Lino Uruñuela
errioxa.bsky.social
Lino Uruñuela
@errioxa.bsky.social
Technical SEO Specialist & Data Lover ❤️

Blog: http://Mecagoenlos.com
Linkedin http://linkedin.com/in/errioxa
SEO Tool: http://MyDomain.dev
| ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄|
| March 2025 |
| ᑕOᖇE |
| 🆄🅿🅳🅰🆃🅴 |
| 🅲🅾🅼🅿🅻🅴🆃🅴 |
|___________________|
()
\ ,,,
\(•◡•)
\ / \
--- ()
| \
| |
• ̄ ̄ ̄ ̄ ̄ ̄•

status.search.google.com/incidents/zp...
Google Search Status Dashboard
status.search.google.com
March 27, 2025 at 3:00 PM
What is a RAG system? Advanced RAG systems, when similarity doesn’t mean relevance
www.mecagoenlos.com/what-is-a-RA...
What is a RAG system?
A RAG system allows LLMs to access up-to-date and/or specific data, for example, basing its answer on specific documents, thus minimizing the risk of hallucinations or inaccurate answers.
www.mecagoenlos.com
March 25, 2025 at 10:05 AM
Sistemas RAG avanzados, cuando la similitud no significa relevancia www.mecagoenlos.com/Posicionamie...
Sistemas RAG avanzados, cuando la similitud no significa relevancia
La similitud no es lo mismo que la relevancia, como ejemplo, la pregunta "¿Por qué el cielo es azul?" tendrá un significado diferente a la respuesta
www.mecagoenlos.com
March 25, 2025 at 10:00 AM
Cloudflare implementa un nuevo sistema para impedir que bots no autorizados (crawlers) obtengan el contenido de sus usuarios

Cuando detecta un bot, en vez de devolver una página de error informando que ha sido bloqueado, mostrará contenido irrelevante generado por IA.
March 21, 2025 at 6:24 AM
I’ve created a script to query my Search Console data from a database using natural language with the new Mistral model (mistral-small-2503).

www.mecagoenlos.com/Posicionamie...
Consultar datos de Search Console usando un LLM local
He credo un script para consultar los datos a una base de datos usando lenguaje natural usando el nuevo modelo de Mistral
www.mecagoenlos.com
March 20, 2025 at 9:00 AM
| ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄|
| March 2025 |
| ᑕOᖇE |
| 🆄🅿🅳🅰🆃🅴 |
|_________________|
()
\ ,,,
\(•◡•)
\ / \
--- ()
| \
| |
• ̄ ̄ ̄ ̄ ̄ ̄•
status.search.google.com/incidents/zp...
Google Search Status Dashboard
status.search.google.com
March 14, 2025 at 11:04 AM
Google Search Central Live 2025 𝗲𝗻 𝗠𝗮𝗱𝗿𝗶𝗱, el 9 de abril!

Organizada por el equipo de Búsqueda de Google, estarán, entre otros, Daniel Waisberg y @johnmu.com !

Hablarán sobre:
* Mejores prácticas SEO
* Search Console y Google Trends
* Google News

rsvp.withgoogle.com/events/searc...
Search Central Live Madrid 2025
Únete a nosotros para Search Central Live Madrid: una conferencia sobre la búsqueda para propietarios de sitios web, medios, especialistas en marketing digital, desarrolladores web y profesionales de ...
rsvp.withgoogle.com
March 5, 2025 at 4:12 PM
Which User Agents appear most often in robots.txt?

1 - '*': 68.16%
2 - "Others": 20.7% (all other User Agents)
3 - Googlebot: 7.7%
4 - mediapartners-google: 1.28%
5 - Bingbot: 0.73%

(Data based on an analysis of 400 million robots.txt )
March 4, 2025 at 10:40 AM
Analizando más de 400 millones de robots.txt.

¿Se está impidiendo a los bots de Inteligencia Artificial acceder al contenido? ¿Cuáles son los bots de IA que están siendo bloqueados?

www.mecagoenlos.com/Posicionamie...
¿Se está impidiendo a los bots de Inteligencia Artificial acceder al contenido?
cómo ha ido incrementando el número de robots.txt en los que aparecen rastreadores asociados a la Inteligencia Artificial.
www.mecagoenlos.com
February 26, 2025 at 12:39 PM
Actualizado! (Analizando más de 72 millones de robots.txt)

1- Los crawlers más bloqueados desde el robots.txt.

2- IA Crawlers más bloqueados

www.mecagoenlos.com/Posicionamie...
Analizando mas de 72 millones de robots.txt
¿Cuántos dominios, subdominios y robots.txt están bloqueando a los crawlers de Inteligencia Artificial? Te lo cuento tras analizar 70 millones de robots.txt
www.mecagoenlos.com
February 13, 2025 at 1:56 PM
¿Cómo decide Google que URL debe rastrear?

Hoy he descubierto un paper de Google dónde describe una mejora del método de cómo decide qué URL debe ser la siguiente en rastrear

www.mecagoenlos.com/Posicionamie...
¿Cómo decide Google que URL debe rastrear?
Hoy he descubierto este paper de Google (A Scalable Crawling Algorithm Utilizing Noisy Change-Indicating Signals) dónde describe una mejora del método descrito en el artículo inicial
www.mecagoenlos.com
February 6, 2025 at 11:15 AM
I processed data from Common Crawl’s latest robots.txt crawl – some numbers:

- 𝟳𝟮,𝟭𝟲𝟮,𝟰𝟴𝟮 𝗿𝗼𝗯𝗼𝘁𝘀.𝘁𝘅𝘁 files
- 𝟰𝟲,𝟲𝟴𝟮,𝟵𝟵𝟯 𝗱𝗼𝗺𝗮𝗶𝗻𝘀
- 90.000 WARC files
- 500 GB

…and more coming tomorrow
February 6, 2025 at 12:11 AM
Hi @johnmu.com , regarding your post johnmu.com/2025-trust-i...

Here's another way to solve the challenge using SQL... to be honest, I’m not sure which one will end up being more confusing haha.

Live Demo:
fiddle.clickhouse.com/a1e1884f-85f...
January 23, 2025 at 10:35 AM
Google:
Se 𝗵𝗮 𝗮𝗰𝘁𝘂𝗮𝗹𝗶𝘇𝗮𝗱𝗼 la política de 𝗮𝗯𝘂𝘀𝗼 𝗱𝗲 𝗿𝗲𝗽𝘂𝘁𝗮𝗰𝗶𝗼𝗻 𝗱𝗲𝗹 𝘀𝗶𝘁𝗶𝗼 para incluir orientación de las 𝗽𝗿𝗲𝗴𝘂𝗻𝘁𝗮𝘀 𝗳𝗿𝗲𝗰𝘂𝗲𝗻𝘁𝗲𝘀 de nuestra publicación de blog sobre abuso de reputación del sitio .

developers.google.com/search/updat...
Latest Google Search Documentation Updates | Google Search Central  |  What's new  |  Google for Developers
Learn about the latest and most recent Google Search Central documentation updates. Stay current with what's new at Google Search Central.
developers.google.com
January 21, 2025 at 3:36 PM