Robots.txt Generátor

K čemu je Robots.txt Generátor

Pokud provozuješ web – ať už jako OSVČ, freelancer nebo vývojář – pravděpodobně nechceš, aby vyhledávače indexovaly všechno bez výjimky. Administrační sekce, testovací stránky, duplicitní obsah nebo interní soubory prostě do výsledků vyhledávání nepatří. Soubor robots.txt je první linie obrany, jenže jeho ruční psaní je náchylné na chyby v syntaxi.

Tento generátor ti umožní sestavit funkční robots.txt bez toho, abys musel memorovat přesný formát direktiv. Jednoduše zadáš, co chceš povolit nebo zakázat, vyberete boty a výsledek zkopíruješ rovnou na server.

Čím dál víc webů navíc řeší otázku AI botů – konkrétně GPTBot od OpenAI nebo CCBot od Common Crawl, které procházejí weby a sbírají data pro trénování jazykových modelů. Pokud nechceš, aby tvůj obsah sloužil jako trénovací dataset, je zákaz těchto botů první praktický krok.

Co umí

Nastavení pravidel pro konkrétní boty (Googlebot, Bingbot, GPTBot a další)
Globální zákaz nebo povolení pro všechny crawlery najednou (`User-agent: *`)
Blokování konkrétních cest nebo celých adresářů
Přidání URL sitemapové mapy pro snazší indexaci Googlem
Rychlé vložení předpřipravených pravidel pro nejčastější AI boty
Okamžitý náhled výsledného souboru před stažením

Jak to funguje

Zvol, pro kterého bota pravidla nastavuješ – buď konkrétního (například GPTBot), nebo všechny najednou.
Zadej cesty, které chceš zakázat – třeba `/admin/`, `/tmp/` nebo celé adresáře.
Pokud máš sitemapou, vlož její URL – generátor ji přidá jako direktivu `Sitemap:`.
Přidej další boty nebo pravidla pomocí tlačítka pro nový blok.
Zkopíruj nebo stáhni výsledný soubor `robots.txt`.
Nahraj ho do kořenového adresáře webu (vedle `index.php` nebo `index.html`).

Časté otázky

Musí být robots.txt přesně v kořeni webu?

Ano, soubor musí být dostupný na adrese `tvojedomena.cz/robots.txt`. Pokud ho umístíš jinam, vyhledávače ho nenajdou a chovají se, jako by neexistoval.

Zabrání robots.txt skutečně GPTBotu v procházení?

Záleží na botovi. Seriózní boti jako Googlebot nebo Bingbot direktivy respektují. GPTBot od OpenAI také oficiálně deklaruje, že pravidla dodržuje. Méně seriózní scrapery to ale ignorují – robots.txt není technická bariéra, jen konvence.

Ovlivní robots.txt stránky, které už jsou zaindexované?

Ne přímo. Zakázáním cesty zabráníš dalšímu procházení, ale z indexu stránku neodstraníš. Na to potřebuješ direktivu `noindex` v HTML nebo Google Search Console.

Jak poznám, že soubor funguje správně?

Google Search Console má nástroj pro testování robots.txt, kde si pravidla ověříš. Případně ti pomůže Meta Tags Checker nebo nástroje přímo v Search Console. Pokud řešíš i přesměrování nebo blokování na úrovni serveru, podívej se na .htaccess Generátor.

Globální pravidlo (* všichni boti)

AI Scrapers

🗺️ Sitemap

robots.txt

K čemu je Robots.txt Generátor

Co umí

Jak to funguje

Časté otázky

Musí být robots.txt přesně v kořeni webu?

Zabrání robots.txt skutečně GPTBotu v procházení?

Ovlivní robots.txt stránky, které už jsou zaindexované?

Jak poznám, že soubor funguje správně?

Robots.txt Generátor

Globální pravidlo (* všichni boti)

AI Scrapers

🗺️ Sitemap

robots.txt

Potřebuješ víc než nástroj?

K čemu je Robots.txt Generátor

Co umí

Jak to funguje

Časté otázky

Musí být robots.txt přesně v kořeni webu?

Zabrání robots.txt skutečně GPTBotu v procházení?

Ovlivní robots.txt stránky, které už jsou zaindexované?

Jak poznám, že soubor funguje správně?