Gmail Календар Документи Фотознімки Веб Ще »
Групи, які ви переглядали нещодавно | Довідка | Увійти
Головна сторінка Груп Google
Занадто багато тем, що мають бути показані першими. Для того, щоб показати тему першою, зніміть цю опцію з іншої теми.
Під час обробки вашого запиту сталася помилка. Будь ласка, повторіть вашу спробу пізніше.
флаг
  4 повідомлення - Згорнути всі  -  Перекласти все вказаною мовою: Перекладено (переглянути всі оригінали)
Група, до якої ви додаєте допис, - група Usenet. Відтак, будь-хто в Інтернеті бачитиме вашу електронну адресу.
Вашу відповідь не було надіслано.
Ваш допис надіслано
 
Від:
Кому:
Копія:
Продолжить:
Додати копію: | Додати продовження: | Редагувати тему
Тема:
Підтвердження:
З метою підтвердження введіть символи, наведені на зображенні нижче, або числа, які чуєте, натиснувши значок доступу. Прослухайте і введіть цифри, що чуєте
 
PeterLT  
Переглянути профіль   Перекласти вказаною мовою: Перекладено (переглянути оригінал)
(2 користувачів)  Більше налаштувань 4 Грд 2008, 02:16
Від: PeterLT
Дата: Wed, 3 Dec 2008 16:16:11 -0800 (PST)
Місцевий час: Чт 4 Грд 2008 02:16
Тема: GoogleBot not respecting robots.txt
Hello Folks,

I employ a bad-robots trap on my site. If they disregard the contents
of robots.txt, then they are likely to fall into that trap. All robots
are disallowed from the folder where the robot trap is. Today, another
GoogleBot hit the trap!

Quite apart from the fact that the robot is then re-directed to the
trap page - the same page for every file called - and all the SEO
penalties that potentially brings, there is a fundamental question
here. It's one of trust.

If there is one robot that most webmasters trust, it's GoogleBot. Now
that is severely being drawn into question. The fact that any of its
Bots disrespects the directives of robots.txt challenges the basic
fundamentals of having that file there in the first place.

All webmasters face the constant challenge of damage done by spammers,
data harvesters, hackers and security flaw checkers. Attempting to
protect ourselves from these outlaws takes up  an inordinate amount of
development time as it is. The very last thing that we need is Google
joining that band! Robots.txt is hugely important and its scope needs
to be strengthened, not undermined by your rogue robots!

Get your act together Google - you aren't too big to be faced by a
class action by people disaffected by your determination to mine
everything on every server out there, regardless of whether you are
permitted, or not.


    Переслати  
Ви мусите увійти перед публікацією повідомлень.
Аби надіслати допис, будь ласка, спочатку приєднайтеся до цієї групи.
Будь ласка, поновіть своє прізвисько на сторінці налаштування передплати перед тим, як надіслати свій допис.
У вас немає права надсилання дописів до цієї групи.
Hi Peter,

... a trap is for those who don't know it ...

Do we talk about this one:

   http://www.caronia2.info/robots.txt

?

-luzie-


    Переслати  
Ви мусите увійти перед публікацією повідомлень.
Аби надіслати допис, будь ласка, спочатку приєднайтеся до цієї групи.
Будь ласка, поновіть своє прізвисько на сторінці налаштування передплати перед тим, як надіслати свій допис.
У вас немає права надсилання дописів до цієї групи.
RainboRick  
Переглянути профіль   Перекласти вказаною мовою: Перекладено (переглянути оригінал)
 Більше налаштувань 4 Грд 2008, 03:47
Від: RainboRick
Дата: Wed, 3 Dec 2008 17:47:01 -0800 (PST)
Місцевий час: Чт 4 Грд 2008 03:47
Тема: Re: GoogleBot not respecting robots.txt
Googlebot rarely disobeys a well-formed robots.txt prohibition.  You
may be seeing a hacker script that has tried to disguise itself as
Googlebot.  Did you check the IP address of the "bad" Googlebot
against any other records of its visit?

On Dec 3, 6:16 pm, PeterLT wrote:


    Переслати  
Ви мусите увійти перед публікацією повідомлень.
Аби надіслати допис, будь ласка, спочатку приєднайтеся до цієї групи.
Будь ласка, поновіть своє прізвисько на сторінці налаштування передплати перед тим, як надіслати свій допис.
У вас немає права надсилання дописів до цієї групи.
webado  
Переглянути профіль   Перекласти вказаною мовою: Перекладено (переглянути оригінал)
(1 користувач)  Більше налаштувань 4 Грд 2008, 04:45
Від: webado
Дата: Wed, 3 Dec 2008 18:45:59 -0800 (PST)
Місцевий час: Чт 4 Грд 2008 04:45
Тема: Re: GoogleBot not respecting robots.txt
That's quite a rant and it's all pretty unfounded.

The robots.txt file is NOT to be used to protect areas of a website
that you don't want visited.

It's a recommendation for robots of what you don't want INDEXED, which
is quite a different thing from VISITED.

Any urls to which there are otherwise unobstructed links to on your
site or off-site, may be visited by any robot. Googlebot will pay
attention to a well formed robots.txt file, which the server serves
properly, and not indexed contents of that url if it can see clearly
that it is disallowed. We are talking about indexing - which refers to
content-  not about the url appearing in a site: query.

On Dec 3, 7:16 pm, PeterLT wrote:


    Переслати  
Ви мусите увійти перед публікацією повідомлень.
Аби надіслати допис, будь ласка, спочатку приєднайтеся до цієї групи.
Будь ласка, поновіть своє прізвисько на сторінці налаштування передплати перед тим, як надіслати свій допис.
У вас немає права надсилання дописів до цієї групи.
Кінець повідомлень
« Повернутися до обговорень « Новіша тема     Старіша тема »

Створити групу - Групи Google - Домашня сторінка Google - Правила користування послугою - Заява про конфіденційність і нерозголошення інформації
©2010 Google