【META】robotsで検索エンジンを制御。googleはインデックスから削除する日時を指定できるのね

metaタグの robotsで検索エンジンのロボットをある程度コントロールすることができます。

が、この指示に従ってくれる検索エンジンしか制御できませんのでロボット全てをどうこうできるものじゃないわけですが、
でも、紳士的な主要な検索エンジンに有効なだけでも大事です。

まとめておきます。

書式は
<meta name=”robots” content=”index,follow,noarchive” />
こんな感じです。
contentでいろいろしていします。

all
すべて許可する。

none
すべて許可しない。

index/noindex
ページを登録する/しない。

follow/nofollow
リンク先のページをたどることを許可する/しない。

archive/noarchive
ページをキャッシュすることを許可する/しない。

noodp
検索結果に表示する文章にDMOZを使用しない。
DMOZは ボランティアで運営されているオープンなディレクトリです。

contentsはカンマで区切って複数指定できます。
たとえば、
<meta name=”robots” content=”index,nofollow”>
こちらの場合は、 このページは登録してOK、このページから先はNOということになります。

 

また、核検索エンジン専用の制御もあります。
たとえばgoogleさん専用のGooglebotというのがあります。

<meta name=”googlebot” content=”noarchive”>

とすると、このページはGoogleのロボットだけにキャッシュを許可しないということになります。

上記の制御以外にも、

noimageindex
画像の登録(画像検索)のみ許可しない。

nosnippet
検索結果に要約文を表示させない。

unavailable_after:日時
期限を過ぎたら Google のインデックスから削除されるように指定。
日時の指定はRFC 850 形式で、以下のようになります。
<meta name=”googlebot” content=”unavailable_after: 25-Aug-2011 15:00:00 EST”>

これは便利かも。

googlebotについて詳しくはgoogleのこちらをご覧ください。
 ロボットを使用して Google ニュースをブロックする

cavycraft の紹介

Webデザイン事務所 CavyCraft -ケイビークラフト- 代表です。
カテゴリー: METAタグ   パーマリンク

コメントは受け付けていません。