CYBER@GARDEN

home > Web::Blogoscope > Googleサイトマップ解説

Web::Blogoscope

Googleサイトマップ解説

Googleサイトマップ(Beta)が日本語に対応した。ユーザーがGoogleのインデックスにWebページを直接登録するサービスだ。

トップページでは次のようなメリットが謳われている。

  • サイトの統計情報とクロールできなかった URL に関する情報が確認できるようになります
  • クロールの精度が高まり、より多くのウェブ ページが検索結果に表示されるようになります
  • 最新のページを検索結果に反映できます
  • ページの最終更新日や更新頻度など、ウェブ ページに関する具体的な情報を送信して、クロールがより効率的に行えます

また、Googleサイトマップを利用すると、そのサイトの「クロールに関する情報」や「検索クエリに関する情報」などのGoogleの統計データが取得できる。

[スクリーンショット: Googleサイトマップ 統計情報 クロールに関する情報]

[スクリーンショット: Googleサイトマップ 統計情報 検索クエリに関する情報]

利用にはサイトマップファイルが必要

Googleサイトマップの利用の際に必要なのが「サイトマップファイル」だ。既存の(X)HTML形式で作成したものではなく、新たに専用のXML形式で作成する必要がある(ほかにもいくつかの形式が認められている)。

今後、サイトマップファイルの用意は、必須のSEO手法となるだろう。サイトマップファイルの作成方法についてはヘルプに詳しい説明があるが、いくつかの補足を含めて以下で解説しよう。

サイトマップファイルのXMLフォーマット

全体像を示すと次のとおり。エンコードは「UTF-8」と決められている点に注意。

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
  <url>
    <loc>http://www.cybergarden.net/</loc>
    <lastmod>2005-11-17T12:00:00+09:00</lastmod>
  </url>
  <url>
    <loc>http://www.cybergarden.net/blog/</loc>
    <lastmod>2005-11-17T12:00:00+09:00</lastmod>
  </url>
   :
  (必要なだけ。ただし50,000個まで)
   :
</urlset>

ルート要素はurlset要素。子要素としてurl要素を必要なだけ含める。url要素の子要素のloc要素が該当ページのURLlastmod要素が最終更新日だ。時刻は示さずに日付だけでもよい(例: 2005-11-17)。

なお、ひとつサイトマップファイルに含められるURLは50,000個まで、ファイルサイズは10MBまでと決められている。

オプション要素の指定

オプション要素として、changefreq要素で更新頻度を、priority要素で優先度を指定できる。changefreq要素ではalwayshourlydailyweeklymonthlyyearlyneverのいずれかの値が、priority要素では0.0から1.0までの値(デフォルトは0.5)が指定できる。

優先度は、あくまでサイト内での相対的な基準であり、他サイトのページとは比較されない。つまり、すべてに「1.0」としても無意味となる(=0.5として扱われると考えられる)。

<url>
  <loc>http://www.cybergarden.net/blog/</loc>
  <lastmod>2005-11-17T12:00:00+09:00</lastmod>
  <changefreq>daily</changefreq>
  <priority>0.7</priority>
</url>

特殊記号や非ASCII文字のエスケープ

特殊記号「&」「'」「"」「<」「>」の5つは、それぞれ文字参照「&amp;」「&apos;」「&quot;」「&lt;」「&gt;」でエスケープする必要がある。たとえばURLに「&」を含める場合は次のようにエスケープする。

http://www.cybergarden.net/forum&amp;mode=view

ASCII文字についても、ISO 8859-1に基づいてエスケープする必要がある。たとえば「セディーユつきのC」は「%C7」、「ウムラウトつきのo」は「%F6」とエスケープする。エスケープのためのHex値(16進数値)についてはISO 8859-1 (Latin) Charcters Listを参考にするとよい。

サイトマップファイルを圧縮する場合

サイトマップファイルはgzip形式(.gz)で圧縮し、アップロードすることもできる。含められるURLは50,000個まで、ファイルサイズは未圧縮状態で10MBまでだ。

WindowsではLhacaなど、MacOSではGZipandaなどの無償ソフトウェアを利用することでgzip形式に圧縮できる。

複数のサイトマップファイルを使用する場合

サイトマップに含めるURLが50,000個を超える場合や、ファイルサイズが10MBを超える場合は、サイトマップインデックスファイルを作成することで、複数のサイトマップファイル(1,000個まで)のインデックスとすることができる。

<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.google.com/schemas/sitemap/0.84">
  <sitemap>
    <loc>http://www.cybergarden.net/sitemap1.xml</loc>
    <lastmod>2005-11-17T12:00:00+09:00</lastmod>
  </sitemap>
  <sitemap>
    <loc>http://www.cybergarden.net/sitemap2.xml</loc>
    <lastmod>2005-11-17T12:00:00+09:00</lastmod>
  </sitemap>
   :
  (必要なだけ。ただし1,000個まで)
   :
</sitemapindex>

通常のサイトマップファイルと異なり、ルート要素にsitemapindex要素を、子要素にsitemap要素をサイトマップファイルの数だけ置く。loc要素が該当ファイルのURLlastmod要素が最終更新日だ。

アップロード場所

サイトマップファイルはルートディレクトリにアップロードしておこう。サブディレクトリにアップロードする場合は、それ以下の階層のURLしか含めることができない点に注意(もし含めたとしてもクロールされない)。

サイトマップファイルがひとつの場合

http://www.cybergarden.net/sitemap.xml

サイトマップファイルが複数の場合

http://www.cybergarden.net/sitemapindex.xml
http://www.cybergarden.net/sitemap1.xml
http://www.cybergarden.net/sitemap2.xml

なお、ファイル名に特に決まりはない。

追記 (2005-12-02)

サイトマップファイルをアップロードしてからしばらく経たないと、統計情報その他は見られない。データの取り込みに一定時間かかるということ。どのぐらいかはそのサイトによるが、1日(24時間)ぐらいは待つことがあると考えてよいと思う(13:43)。

追記 (2005-12-14)

Googleサイトマップのステータスで「不適切な日付」というエラーが表示される場合は、lastmod要素の「時間」と「タイムゾーン」を削除し、「日付」だけにする。

[悪い例]
<lastmod>2005-11-17T12:00:00+09:00</lastmod>
[よい例]
<lastmod>2005-11-17</lastmod>

これはGoogleサイトマップ側の問題であり、将来的には解消されると考えられる(15:55)。

追記 (2006-07-04)

現在、「不適切な日付」問題は解消されている(「時間」と「タイムゾーン」を指定してもオーケー)。

Posted on 2005-11-18T01:25+09:00 | Category: Webトレンド

トラックバックPings

トラックバックのURI:
http://www.cybergarden.net/mt/mt-tb.cgi/253

» [Clip] Googleサイトマップ日本語版、Windows Live・Office Liveは広告モデル、AMEXのホリデーキャンペーン from アークウェブ ビジネスブログ
中野です。遅くなりましたが、11月18日のクリップです。 あなたのサイトをGoo... [Read More]

Tracked on 2005-11-18T19:29+09:00

» Googleサイトマップ日本語版登場! from GO!GO!パニッカー スガ
最近ゴリゴリ仕事してますな。Google。 てなわけで、早速使うてみた。 あなたのサイトをGoogleはどう見てる?--Googleサイトマップ日本語版が... [Read More]

Tracked on 2005-11-23T16:25+09:00

» Googleサイトマップ from アフィリエイトに本格的に挑戦
昨日これに挑戦したものの大苦戦。「python」というソフトを使って自動生成する方法がよく分からないので、とりあえず諦めて手動で作成する道を探った。そこで... [Read More]

Tracked on 2005-11-29T10:34+09:00

» グーグルサイトマップ(Google Sitemap)日本語版でサイトクロールが分かる from 無料インターネットサービス日記
グーグルサイトマップ(Google Sitemap)日本語版でサイトクロールが分かる グーグル(Google)は、ユーザーが自分のサイトをGoogle... [Read More]

Tracked on 2005-11-29T11:54+09:00

» グーグルサイトマップ(Google Sitemaps)に日本語版が登場 from グーグルの世界(GOOGLE WORLD)
グーグルサイトマップ(Google Sitemaps)に日本語版が登場 グーグル(Google)は、グーグル(Google)に効率よくサイトをクロー... [Read More]

Tracked on 2005-11-29T13:46+09:00

» トラックワード、αブロガー発表 from アカラボ
トラックワード α版公開にご参加いただいたブロガーの中から、「- ブロガーが強い 検索キーワード -」の各ワードでトップになられた方を発表します。 #αブ... [Read More]

Tracked on 2005-12-15T01:20+09:00

» Googleサイトマップ特別レポートを無料で手に入れよう! 2(0512... from ヒマラヤ水晶が好き!ヒマラヤ水晶の事ならBHSにお任せ!
Googleサイトマップに関する情報の続編です。このGoogleサイトマップを自分のWebに導入するとどうなるのか…新しいページを創ってもかなり早くGoo... [Read More]

Tracked on 2005-12-17T08:01+09:00

» Googleサイトマップのお勉強 from みんなで実践『とっておきの秘技 人とお金が集まるブログ作りの秘伝書』
Googleサイトマップをいかに活用するか探し勉強してみました。 CNET Networks Japanにて『あなたのサイトをGoogleはどう見てる?... [Read More]

Tracked on 2005-12-30T17:48+09:00

» Googleサイトマップを利用して最新の更新情報をGoogleに送信! from 21世紀のアフィリエイト通販生活
あなたのサイトをGoogleはどう見てる?--Googleサイトマップ日本語版が... [Read More]

Tracked on 2006-01-02T19:49+09:00

» Movable Typeでgoogleサイトマップを作成 from サラリーマンの気ままなブログ
前回のgoogleサイトマップにて手動でgoogleサイトマップを作りましたが、今回は Movabl... [Read More]

Tracked on 2006-01-04T12:50+09:00

» Google サイトマップに対応させよう from ブログで稼ごう ガリンペイロ
SeesaaブログでGoogleサイトマップ設定しましたが、robots.txtのカテゴリー・過去ログ回避の問題はどうなんでしょうね。 [Read More]

Tracked on 2006-05-09T19:32+09:00

» blog開発日記4 from アタフタ日記
今更ながらGoogleサイトマップをチェック。 rss作成ルーチンを改造してsitemap.xmlの生成ツールを作成。登録してみる。これは、Google... [Read More]

Tracked on 2006-05-10T12:11+09:00

» Google ウェブマスター ツールの疑問点 from jungle gym :: Designer's monologue
Google のサービス(ツール)にウェブマスター ツールという、以前はグーグル... [Read More]

Tracked on 2006-10-03T13:47+09:00

» グーグルサイトマップ google sitemap とは from 01WEBマスター【WEB管理人のための基礎知識】
グーグルロボットのためのサイト案内地図 [Read More]

Tracked on 2006-10-20T03:30+09:00

» seesaaブログをお使いの方!朗報です(^▽^) from ディスカバリーネット~初心者編~
皆さん、サイトマップって、ご存知でしょうか?? サイトマップとは、文字通り、”サイト内の地図”の様な物です(^▽^) "宝探し地図”といった方がいいか... [Read More]

Tracked on 2006-11-02T10:04+09:00

コメント

« 飛べ、白い鳥! | ブログトップ | エアロライフステッパー »