Pages

2005-11-24

Blogger にカテゴリー

クリボウさんの「Blogger でも Category」にコメントしようとしたところ、長〜くなる予感があったのでエントリーにした。

Blogger でカテゴリーらしきものを導入しようという試みはいくつかあって、clmemo@aka でも九十九式カテゴリー検索(改)はてなブックマークを使ったタグ型カテゴリーを実践している。クリボウさんが紹介しているカテゴリーの方式は m. 氏のエントリーを元にしたもの。クリボウさんの言葉を引用すると

Google Blog Search の検索結果を RSS で出力し、 それを Feed2JS でページ内に書き出す方法

だそう。

それで、ぼくがコメントしたかったのは、この方法が九十九式(改) の更なる改良版に見えるということ。この方法を考えた方は外国人さんだから、きっと九十九式カテゴリーは知らないでしょう。だから、同じやり方を二人の人が考えたのかな... と思うわけ。そこら辺の違いとかを、少しばかり突っこんで記事にした。

九十九式カテゴリーの歴史

九十九式カテゴリーは次の二つのアイデアから成っている。

  • カテゴリーに当たる「キーワード」を記事のタイトルに含める
  • 「『キーワード』を検索エンジンで検索するリンク」を作る

ブログの記事を追う形で、九十九式カテゴリーの歴史をば書いてみませう。

九十九式: サイト内カテゴリ検索方法 (2005-03-02)

Google のサイト内検索で intitle:カテゴリー名 とすることでタイトル内に含めた「カテゴリー名」を検索できる。とした最初の記事。また、読者に検索してもらわずとも、検索用のリンクをブログ側で用意することも提案している。

この方式の欠点は、Google のインデックス化までにタイムラグがあること。インデックスに漏れがあること。特に新規作成したブログは Google のクローラーが来てくれず、一か月以上インデックスされないことがザラ。

clmemo@aka: Blogger でカテゴリー・サーチ (2005-05-10)

カテゴリー検索用のリンクをフォームを使ってプルダウン・メニュー化する方法について言及

clmemo@aka: カテゴリー検索を Blog Search に変更 (2005-09-18)

検索エンジンを Google 検索でなく Google Blog Search

に切り替えた。インデックスの効率が数段に向上した。Blog Search リリース直後は 2005-06 以降のインデックスしか用意されてないことが懸念されたけど、最近は古い記事もインデックス化されているみたい。

m. さんが九十九式を知らないであろうことを承知で、上の年表形式で違いを書くと...

Pappmaskin Diaré Techblog: Blogger Categories (2005-10-17)

Blog Search の検索結果をユーザーに直接見せるのでなく、検索結果ページの RSS と Feed2JS を利用して、ブログ側で用意したページに結果を表示させるようにする。メリットは、検索結果ページのデザインを、ブログと統一できること。

クリボウの Blogger Tips: Blogger でも Category (2005-11-23)

m. さんの方法では日本語が通らなかったので、日本語が通るようにした。その他、色々と使い勝手を向上。

最初の Google 検索だと、インデックスの更新速度がネックで、ほんとオマケ程度のものだった。だから一番のキモは、GoogleBlog Search を出してくれたことだと思う。インデックスの漏れはほとんどないし、記事を投稿してすぐにインデックス化されるし、RSS での検索結果配信もサポートしてるし... イイことずくし!

intitle 検索

九十九式と m. さんの方法の違いをもう一つ言えば、検索範囲の違い。

九十九式は「記事のタイトル」だけ検索するのに対して、m. さんの方法は「記事全部」を検索する。

ブログの作者がカテゴリーを必ず記事に含めるようにしているなら、記事全部を検索するのは冗長に過ぎる。ノイズな情報 (例えば IM を検索したら記事中の IME にマッチするとか...) を見つけてしまうことになるでせう。

Google Blog Search でも intitle: 演算子が使えるので、これで記事タイトルだけに検索を絞ってみては如何?

ゆるいカテゴリー名

最後に一つ提案。

ほとんどの人は、「Blog」で検索するようにカテゴリー・キーワードを決めたら、そのキーワード (この場合 Blog) をタイトルに含めるようにすると思う。いいかえれば、検索キーワードとタイトル内のキーワードが一対一対応しているかと思う。

でもそうすると、カテゴリーの数がそんなに多く増やせなくなる。強引に数を増やすと、カテゴリー部分がゴチャゴチャする。

ここで提案なのが、検索キーワードとタイトル内のキーワードを一致させない方法。

きっと具体例を出す方が早い。

clmemo@aka では、「Blog ツール」というカテゴリーを次のように定義している。

intitle:"Movable Type" | intitle:HaloScan | intitle:Flickr | intitle:SiteMeter

見て分かる通り、Movable TypeHaloScanFlickrSiteMeter の「どれか」が「Blog ツール」というわけ。

これは、Google の | (OR 演算子) を使ってる。

タイトルには、ある程度小さな単位のキーワード (HaloScan とか Flickr) を振っておき、検索する時に「Blog ツール」としてそれらを一気に OR 検索で検索する。SiteMeter の記事だけ多くなったから、独立したエントリーを作りたい、なんてことも簡単にできる。逆に、新しいツール (例えば Google Analytics とか) を「Blog ツール」の検索に加える。なんて事も一発でできる。どうでしょう。

2 comments:

  1. intitle: 演算子が頭になかったわけではないのです。けれど検索対象をタイトルだけに絞ってしまうと、カテゴリ導入のハードルが高くなってしまうように思ったのです。

    たとえば検索されることを意図せずにタイトルをつけているサイトでは、(特にうちのブログなんかがそうですが、)タイトルに新たにキーワードを加えると、確実に記事単独ページの URL が変わってしまい、サイト内外のリンクを変更しなくてはいけないという問題が出てきます。Backlinks にも Google の Blog Search にも旧 URL でのデータが消せずに残ってしまいますし…(これはこれで別の問題なんですが)。

    でもやはりおっしゃるとおりで、九十九式カテゴリ検索のタイトル内検索の方が、意図したカテゴリをノイズなしに表示するのに適しているでしょうね。僕も新しいブログをつくるときには実践しようと思います。

    タイトル内検索を意図して、キーワードを含んだタイトルをすでにつけている人は、うちのブログで紹介したカテゴリ表示法で、リンクで指定する検索語を tag=intitle%3Ablogger という風に指定してやることで、タイトルのみを検索対象にすることができます。

    ReplyDelete
  2. クリボウさんのおっしゃる通り、記事タイトル部分のみに検索を限定すると、既存ユーザーに対してカテゴリー導入のハードルが高くなりますね。カテゴリー検索のために、記事タイトルを修正するのはパーマリンクの問題を含めて面倒で大変ですし... 本文も検索範囲に含めてノイズが入るのをよしとするか、今までの記事がひっかからなくなるのを覚悟の上でタイトルだけに検索範囲を絞るか。非情な決断が迫られそうです。

    新しいブログの時は、intitle をどうぞお試し下さい ;)。

    ちなみに、うちでは記事のタイトルに |category| のつく時とつかない時があります。実は、つかない時は、記事タイトルの中に category キーワードを含めているのです。例えば、この記事のカテゴリーは「Blogger」なのですが、「Blogger にカテゴリー」という風にタイトル内に自然に含めるようにしています。

    もう一つ例を出すと、「Web design」というカテゴリーはタイトルの中に入れにくい単語ですが、実はこのカテゴリーは「HTML」と「CSS」と「JavaScript」と「Ajax」の OR検索 になっていて、「CSS で ○○ するのは」とか「◎◎する JavaScript」というタイトルが自然と「Web design」というカテゴリー名で検索できるようになっています。

    ReplyDelete