ホーム > ラ行 > robots.txtとは

robots.txtとは

こんにちはWEBチップス管理人です

WEBマーケティング関連の情報をお届けします!!

-

robots.txt

【英語表記】 robots.txt

robots.txt(ロボッツドットテキスト)とは、検索ロボットまたは、

スパイダーと呼ばれているプログラムに対し、クローリングされたくない

WEBページを記述する事でクローリングを制限する事の出来る命令文。

例えば下記の様なディレクトリを持つWEBサイトがある。

index.html —-
|– img
|– php
|– news

このWEBサイト中の、PHPフォルダ内を検索エンジンに見られたく無い場合、

ウェブサイトのルートディレクトリ(index.htmlと同階層)に

robots.txtを設置し、適切な命令を記述する事で可能となる。

この場合の命令文は、

────────────────────────
User-agent: *
Disallow: /php/
────────────────────────

と記述することで、検索データベースへの登録を禁止する事が出来る。

制御したいファイルが存在しない場合robots.txtを設置する

必要は無いが、SEO的な観点では設置した方が良いと言える。

理由は、優秀な検索ロボットがWEBページを巡回する場合にはまず

robots.txtを探すからである。

制御したいファイルが無い場合は、下記の記述をルートディレクトリへ

設置する事をお勧めする。

────────────────────────
User-agent: *
Disallow:
────────────────────────

これは、全てのロボットが全てのページを巡回しても良い。

という命令となり、検索ロボットも迷わずクロールが出来る様になる。

最近(08.08.0現在)サイトマップ(XML)のURLを記述する事で、

サイトマップの有無をクローラーに知らせる事が可能となった。

記述方法は以下の通り

────────────────────────
User-agent: *
Disallow:
Sitemap: http://www.seo119.com/sitemap.xml
────────────────────────

-

ブログランキングに参加しています!

ご協力していただけると嬉しいです

にほんブログ村 ブログブログ ブログノウハウへ

——————————-

WEBマーケティング情報WEBチップス

written by RIE

——————————-



RSS リーダーで購読する

コメント:0

コメントフォーム
プロフィールと個人設定

トラックバック:0

このエントリのトラックバック URL
http://web-chips.net/%e7%94%a8%e8%aa%9e%e9%9b%86/%e3%83%a9%e8%a1%8c/2009-08-04/robotstxt%e3%81%a8%e3%81%af/trackback
Listed below are links to weblogs that reference
robots.txtとは から SEO対策なら“WEBチップス”

ホーム > ラ行 > robots.txtとは

カレンダー
« 8 月 2009 »
M T W T F S S
          1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31            
外部PR

ページのトップに戻る