Globální pravidlo (* všichni boti)

AI Scrapers

Blokovat tyto AI boty (Disallow: /)

🗺️ Sitemap

robots.txt


      

Spravuješ živnost nebo zakázky?

Spravuješ živnost nebo zakázky? VšeVKapse — fakturace, zakázky, klientský portál a AI v jedné aplikaci. Česky.

Vyzkoušet zdarma →

K čemu je Robots.txt Generátor

Pokud provozuješ web – ať už jako OSVČ, freelancer nebo vývojář – pravděpodobně nechceš, aby vyhledávače indexovaly všechno bez výjimky. Administrační sekce, testovací stránky, duplicitní obsah nebo interní soubory prostě do výsledků vyhledávání nepatří. Soubor robots.txt je první linie obrany, jenže jeho ruční psaní je náchylné na chyby v syntaxi.

Tento generátor ti umožní sestavit funkční robots.txt bez toho, abys musel memorovat přesný formát direktiv. Jednoduše zadáš, co chceš povolit nebo zakázat, vyberete boty a výsledek zkopíruješ rovnou na server.

Čím dál víc webů navíc řeší otázku AI botů – konkrétně GPTBot od OpenAI nebo CCBot od Common Crawl, které procházejí weby a sbírají data pro trénování jazykových modelů. Pokud nechceš, aby tvůj obsah sloužil jako trénovací dataset, je zákaz těchto botů první praktický krok.

Co umí

  • Nastavení pravidel pro konkrétní boty (Googlebot, Bingbot, GPTBot a další)
  • Globální zákaz nebo povolení pro všechny crawlery najednou (`User-agent: *`)
  • Blokování konkrétních cest nebo celých adresářů
  • Přidání URL sitemapové mapy pro snazší indexaci Googlem
  • Rychlé vložení předpřipravených pravidel pro nejčastější AI boty
  • Okamžitý náhled výsledného souboru před stažením

Jak to funguje

  1. Zvol, pro kterého bota pravidla nastavuješ – buď konkrétního (například GPTBot), nebo všechny najednou.
  2. Zadej cesty, které chceš zakázat – třeba `/admin/`, `/tmp/` nebo celé adresáře.
  3. Pokud máš sitemapou, vlož její URL – generátor ji přidá jako direktivu `Sitemap:`.
  4. Přidej další boty nebo pravidla pomocí tlačítka pro nový blok.
  5. Zkopíruj nebo stáhni výsledný soubor `robots.txt`.
  6. Nahraj ho do kořenového adresáře webu (vedle `index.php` nebo `index.html`).

Časté otázky

Musí být robots.txt přesně v kořeni webu?

Ano, soubor musí být dostupný na adrese `tvojedomena.cz/robots.txt`. Pokud ho umístíš jinam, vyhledávače ho nenajdou a chovají se, jako by neexistoval.

Zabrání robots.txt skutečně GPTBotu v procházení?

Záleží na botovi. Seriózní boti jako Googlebot nebo Bingbot direktivy respektují. GPTBot od OpenAI také oficiálně deklaruje, že pravidla dodržuje. Méně seriózní scrapery to ale ignorují – robots.txt není technická bariéra, jen konvence.

Ovlivní robots.txt stránky, které už jsou zaindexované?

Ne přímo. Zakázáním cesty zabráníš dalšímu procházení, ale z indexu stránku neodstraníš. Na to potřebuješ direktivu `noindex` v HTML nebo Google Search Console.

Jak poznám, že soubor funguje správně?

Google Search Console má nástroj pro testování robots.txt, kde si pravidla ověříš. Případně ti pomůže Meta Tags Checker nebo nástroje přímo v Search Console. Pokud řešíš i přesměrování nebo blokování na úrovni serveru, podívej se na .htaccess Generátor.