HTML著作者向け robots metaタグガイド
robots metaタグは、ロボットにそのページを登録しても良いか、またはそのリンク先を訪れても良いかを指示する、単純なしくみです。
それはロボット排除プロトコルと違い、ウェブサーバ管理者の許可を必要としない点で異なります。
注意事項: 現在わずかのロボットしかこのタグを理解しません。
どこにrobots metaタグを置くのか?
他のmetaタグの様に、html上のheadセクションに置いて下さい。:
<html>
<head>
<meta name="robots" content="noindex,nofollow">
<meta http-equiv="Content-Type"
content="text/html; charset=shift_jis">
<meta name="description" content="××のホムペ">
<title>...</title>
</head>
<body>
...
何をrobots metaタグに記載するのか
robots metaタグのcontent部は、カンマで区切られたコマンドを持ちます。現在定義されているコマンドは、[NO]INDEXと[NO]FOLLOWです。INDEXコマンドは、ロボットが対象ページを登録しても良いかを規定します。FOLLOWコマンドは、ロボットが対象ページのリンク先を訪れても良いかを規定します。デフォルトはINDEXとFOLLOWです。ALLまたはNONEという記述は、すべてのコマンドをonまたはoffに設定します。ALL=INDEX,FOLLOWを意味し、NONE=NOINDEX,NOFOLLOWを意味します。
例):
<meta name="robots" content="index,follow">
<meta name="robots" content="noindex,follow">
<meta name="robots" content="index,nofollow">
<meta name="robots" content="noindex,nofollow">
タグ中name部の"robots"という記述やcontent記述部は、大文字小文字を問いません。
明らかに矛盾したり、明らかに繰り返したりする定義をしてはいけません。以下の例の様に:
<meta name="robots"
content="INDEX,NOINDEX,NOFOLLOW,FOLLOW,FOLLOW">
正式なrobots metaタグのcontent部の文法は:
content = 全許可 | 全拒否 | コマンド
全許可 = "ALL"
全拒否 = "NONE"
複数コマンド = コマンド1 ["," コマンド2]
コマンド = 登録可否 | リンク先訪問可否
登録可否 = "INDEX" | "NOINDEX"
リンク先訪問可否 = "FOLLOW" | "NOFOLLOW"
|
HTML Author's Guide to the Robots META tag.
The Robots META tag is a simple mechanism to indicate to visiting
Web Robots if a page should be indexed, or links on the page should be
followed.
It differs from the Protocol
for Robots Exclusion in that you need no effort or permission from
your Web Server Administrator.
Note: Currently only few robots support this tag!
Where to put the Robots META tag
Like any META tag it should be placed in the HEAD section of
an HTML page:
<html>
<head>
<meta name="robots" content="noindex,nofollow">
<meta name="description" content="This page ....">
<title>...</title>
</head>
<body>
...
What to put into the Robots META tag
The content of the Robots META tag contains directives separated by
commas. The currently defined directives are [NO]INDEX and
[NO]FOLLOW. The INDEX directive specifies if an indexing robot should
index the page. The FOLLOW directive specifies if a robot is to follow
links on the page. The defaults are INDEX and FOLLOW. The values ALL
and NONE set all directives on or off:
ALL=INDEX,FOLLOW and NONE=NOINDEX,NOFOLLOW.
Some examples:
<meta name="robots" content="index,follow">
<meta name="robots" content="noindex,follow">
<meta name="robots" content="index,nofollow">
<meta name="robots" content="noindex,nofollow">
Note the "robots" name of the tag and the content are case insensitive.
You obviously should not specify conflicting or
repeating directives such as:
<meta name="robots"
content="INDEX,NOINDEX,NOFOLLOW,FOLLOW,FOLLOW">
A formal syntax for the Robots META tag content is:
content = all | none | directives
all = "ALL"
none = "NONE"
directives = directive ["," directives]
directive = index | follow
index = "INDEX" | "NOINDEX"
follow = "FOLLOW" | "NOFOLLOW"
|