Sergey Pasechnik ([info]sevson) wrote,
@ 2006-01-30 17:55:00
Previous Entry  Add to memories!  Tell a Friend  Next Entry
Недокументированная фича Рамблера в robots.txt
Влад Шабанов указал на сабж на форуме Рамблера.
Честно говоря, не знал.

User-agent: StackRambler
Disallow: *partner=
и все урлы, в которых есть подстрока 'partner=' будут игнорироваться.

Это такая недокументированная фича Рамблера. До сих пор поддерживается и бережно переносится из одной версии робота в другую.

Upd: Кстати говоря - Яндекс тоже мог бы ввести у себя эту диррективу. Я думаю, что она оказалась бы весьма полезна для многих вебмастеров.



(4 comments) - (Post a new comment)


[info]vitcom
2006-01-30 03:22 pm UTC (link)
а что скажут остальные поисковые роботы - скажут скорее всего что ошибка и проигнорируют вообще весь файл

(Reply to this) (Thread)


[info]sevson
2006-01-30 03:28 pm UTC (link)
Не факт.
Если в поле User-Agent стоит название не их бота, то какой смысл им туда соваться?

(Reply to this) (Parent)(Thread)


[info]vitcom
2006-01-30 03:32 pm UTC (link)
Обычно бот проверяет файл на ошибки - а потом выполняет то, что ему позволено из этого файла.
Хотя не факт, может быть такая схема как ты предложил и пройдет.

(Reply to this) (Parent)(Thread)


[info]cherny_v
2006-01-30 03:55 pm UTC (link)
Неправда Ваша!
Если робот найдет ошибки в robots.txt, он их просто проигнорирует. Иначе все roots.txt с яндексовской директивой Host: просто не выполнялись бы.

(Reply to this) (Parent)


(4 comments) - (Post a new comment)

Create an Account
Forgot your login or password?
Login w/ OpenID
English • Español • Deutsch • Русский…