●ロボットお断りタグの解説'2001/11/10
Googleの検索力に愕然としている会長様に、本タグ解説をお送りします。
Googleリンク先の英文を翻訳してみましたので、正しく理解して執筆してくださいね・・
私が潜研サイト内の使用として薦めるのは、<meta name="robots" content="noindex,follow">です。
nofollow迄書いてしまうと、意図しないページ(トップページ等)までを立入り禁止宣言しかねないので・・
さぽせん訳文 原文<http://www.robotstxt.org/wc/meta-user.html>

HTML著作者向け
robots metaタグガイド

robots metaタグは、ロボットにそのページを登録しても良いか、またはそのリンク先を訪れても良いかを指示する、単純なしくみです。

それはロボット排除プロトコルと違い、ウェブサーバ管理者の許可を必要としない点で異なります。

注意事項: 現在わずかのロボットしかこのタグを理解しません。

どこにrobots metaタグを置くのか?

他のmetaタグの様に、html上のheadセクションに置いて下さい。:
<html>
<head>
<meta name="robots" content="noindex,nofollow">
<meta http-equiv="Content-Type"
 content="text/html; charset=shift_jis">
<meta name="description" content="××のホムペ">
<title>...</title>
</head>
<body>
...

何をrobots metaタグに記載するのか

robots metaタグのcontent部は、カンマで区切られたコマンドを持ちます。現在定義されているコマンドは、[NO]INDEXと[NO]FOLLOWです。INDEXコマンドは、ロボットが対象ページを登録しても良いかを規定します。FOLLOWコマンドは、ロボットが対象ページのリンク先を訪れても良いかを規定します。デフォルトはINDEXとFOLLOWです。ALLまたはNONEという記述は、すべてのコマンドをonまたはoffに設定します。ALL=INDEX,FOLLOWを意味し、NONE=NOINDEX,NOFOLLOWを意味します。

例):

<meta name="robots" content="index,follow">
<meta name="robots" content="noindex,follow">
<meta name="robots" content="index,nofollow">
<meta name="robots" content="noindex,nofollow">

タグ中name部の"robots"という記述やcontent記述部は、大文字小文字を問いません。

明らかに矛盾したり、明らかに繰り返したりする定義をしてはいけません。以下の例の様に:

<meta name="robots"
 content="INDEX,NOINDEX,NOFOLLOW,FOLLOW,FOLLOW">

正式なrobots metaタグのcontent部の文法は:

content     = 全許可 | 全拒否 | コマンド
全許可      = "ALL"
全拒否      = "NONE"
複数コマンド   = コマンド1 ["," コマンド2]
コマンド     = 登録可否 | リンク先訪問可否
登録可否     = "INDEX" | "NOINDEX"
リンク先訪問可否 = "FOLLOW" | "NOFOLLOW"

HTML Author's Guide
to the Robots META tag.

The Robots META tag is a simple mechanism to indicate to visiting Web Robots if a page should be indexed, or links on the page should be followed.

It differs from the Protocol for Robots Exclusion in that you need no effort or permission from your Web Server Administrator.

Note: Currently only few robots support this tag!

Where to put the Robots META tag

Like any META tag it should be placed in the HEAD section of an HTML page:
<html>
<head>
<meta name="robots" content="noindex,nofollow">
<meta name="description" content="This page ....">
<title>...</title>
</head>
<body>
...

What to put into the Robots META tag

The content of the Robots META tag contains directives separated by commas. The currently defined directives are [NO]INDEX and [NO]FOLLOW. The INDEX directive specifies if an indexing robot should index the page. The FOLLOW directive specifies if a robot is to follow links on the page. The defaults are INDEX and FOLLOW. The values ALL and NONE set all directives on or off: ALL=INDEX,FOLLOW and NONE=NOINDEX,NOFOLLOW.

Some examples:

<meta name="robots" content="index,follow">
<meta name="robots" content="noindex,follow">
<meta name="robots" content="index,nofollow">
<meta name="robots" content="noindex,nofollow">

Note the "robots" name of the tag and the content are case insensitive.

You obviously should not specify conflicting or repeating directives such as:

<meta name="robots"
 content="INDEX,NOINDEX,NOFOLLOW,FOLLOW,FOLLOW">

A formal syntax for the Robots META tag content is:

content    = all | none | directives
all        = "ALL"
none       = "NONE"
directives = directive ["," directives]
directive  = index | follow
index      = "INDEX" | "NOINDEX"
follow     = "FOLLOW" | "NOFOLLOW"

目次へ戻る

Top Pageへ戻る