「分類」は、奥が深い
 『livedoor グルメ』の根岸です。今日はウェブサイトの構築に欠かせない分類法の話です。
 ウェブサイトを作るとき、いつも頭が痛いのが「分類」の問題です。
 たいがいのウェブサイトは、なんらかの目次やメニューを用意して、読者がコンテンツを容易にたどれるように工夫します。
 この目次やメニューを作るのが、簡単なようで奥が深い。舐めてかかると、せっかく作ったコンテンツを利用してもらえないとか、管理の手間ばかりかかるとか、痛い目にあいます。livedoor グルメのように、5万件もの飲食店のデータを扱う場合はなおさらです。
 livedoor グルメの場合、和食、西洋料理、中華料理、エスニック、スイーツなど9つの料理の分野があり、西洋料理の中では、フランス料理やイタリア料理という中分類に別れ、イタリア料理の中ではピザやパスタといった、小分類に別れています。
 これは伝統的な階層による分類法です。現代に生きる僕らは、無意識にこういった分類法を使いこなしていますが、分類法というのは、分類学=「タクソノミー(Taxonomy)」という学問になるくらい奥が深い。
 中学校か高校で習ったのは生物学の分類法の話で、カール・リンネという偉い学者が、膨大な生物の体系を初めて効率的で誰にでもわかるようにしたのでした。今では生物学の中に『分類学』という専門学があって、そこに一生を捧げる研究者もいます。
 整理分類に熱心な学問がもうひとつあって「図書館学」です。世の中のありとあらゆる知識を整理分類してしまおうってんですから、生物学以上に野心的な学者さんたちです。ポピュラーなのは、「十進分類法」というやつで、「日本十進分類法」では、すべての書物を、
  • 総記
  • 哲学
  • 歴史
  • 社会科学
  • 自然科学
  • 技術・工学・工業
  • 産業
  • 芸術
  • 言語
  • 文学
の10大分野をもとに細分化して分類しようとしています。

 ちなみに、みなさんの大好きなマンガは「芸術-絵画-漫画、挿絵、童画」にしっかり分類されています。ゲームは「芸術-諸芸・娯楽-室内娯楽-テレビゲーム」と補助的な扱いの第4段階ですが、存在します。しかし、アニメとかアニメーションという言葉は見つかりません。僕らが世界に誇るオタク文化作品であるガンダムやボトムズやマクロスやパトレイバーやエヴァが、果たして「芸術-演劇-映画」の中に分類されるのか、「漫画、挿絵、童画」の一種とみなされるのかは、この詳細な分類表を見てもわからないのです。
 現代社会において、情報とコンテンツは猛烈な勢いで分化を繰り返し、新しい分野を生み出していきます。それらをいちいち丁寧に考察して分類して名前をつけても、すぐに消滅したり、新しい分野が生まれてきます。
 また、人は生まれ育ったバックグラウンドによって異なる見方をします。誰かが考えた分類が、必ず適切である保証はありません。
 だから、「現代社会ではタクソノミーがうまく働かない」というのかというと、そうではない。それぞれのユーザーのニーズをしっかりと捉えて適切に設定すれば、ちゃんと使える分類になります。
ウェブサイトのタクソノミー
 現代の分類法の基本に『LATCH』というのがあります。
Location 位置
Alphabet アルファベットや五十音などの名前順
Time 時間、歴史
Category 分野分け
Hierarchy 程度、大小、重要性

 livedoor グルメにあてはめると、

Location 地域、エリア、最寄り駅による絞り込み
Alphabet お店の名前順表示、名前による検索
Time お店とコメントの投稿順表示
Category 料理の種類による絞り込み
Hierarchy 採点の高い順、コメントの多い順の表示
 となります。
 livedoor グルメの前身となった『東京グルメ』では、とくにLocationとCategoryにこだわった、という話を以前も書きました。
 料理は300以上の詳細カテゴリを用意し、ユーザーがお店を登録するときに、最大5つまでの分野を設定できるようにしました。たとえば、カレーとラーメンとか、カレーとスパゲッティという、日本ならでは独特の品揃えのお店も、この方法なら複数のまったく異なる分野からたどることができます。
 東京グルメは約300のカテゴリ×約1200の駅、実質36万以上のニッチカテゴリに対応し、それが熱心なユーザーに支持されてお店やクチコミの登録が進みました。もうひとつの利点はSEOです。カテゴリ分けが詳細なほど、ニッチな検索にヒットする可能性が増えて、ユーザーを呼び込むことができます。SEOに強いことは、いまでもlivedoor グルメの特徴のひとつとなっています。
 ちなみに、旅行系のクチコミサイトである『フォートラベル』の野田社長に成功の理由を尋ねたときにも、「開始当初から、海外で約4000地域、国内で約3000地域にカテゴリ分けして地域という箱をしっかり作ったこと」と言っていました。
 『オールアバウト』の江幡社長も、「インターネットは能動的なメディア。ユーザーは検索によって自分の必要な情報を探し出すので、どうしても辞書的になる。それに対して適切な構造で情報を提供するためにタクソノミーの発想でガイドサイトを43分野、約500テーマに分類して成功した」と言っていました。
タクソノミー自体をCGMしちゃった「フォークソノミー」
 タクソノミーは、うまく作ると強力な武器になりますが、適切で詳細なカテゴリ作成は、かなり労力がかかる上、世の中の動きに合わせて改訂や拡張が必要になり、管理運営コストがけっこうかかります。
 そこで、「カテゴリ分けの作業もユーザーにやらせちゃえば、いいじゃん!」という発想が出てきました。
 「人々(forks)」による「タクソノミー(Taxonomy)」を意味する造語で「フォークソノミー(folksonomy)」と呼ばれています。
 ソーシャルブックマークの『del.icio.us』や写真共有サイトの『Flickr』で、URLや写真に、自由にキーワード(タグ)を付けられるようにしたものが、そのハシリだといわれています。ユーザーが自分でキーワードをつけて分類すれば、管理の手間が省けるだけでなく、ユーザーと管理側の考え方のギャップによるカテゴリ設定の食い違いもなくなります。結果としてSEO的にも、より有利になるはずです。
 また、タグに使われているキーワードを集めて、使用頻度の高いタグほど大きく表示する「タグクラウド」というアイデアも、新しいUIとして提案されました。
 ライブドアのサービスでも、『livedoor クリップ』や『livedoor PICS』でタグによるフォークソノミーが導入されています。PICSで、「紅葉」「もみじ」「銀杏」などのキーワードで検索すると、みごとにドンピシャなユーザー投稿写真が表示されます。写真のようにジャンルが幅広くて、あらかじめ分類を用意するのが困難で、かつテキストマイニングで自動設定するのが難しいような対象に対しては、タグによるフォークソノミーはかなり有効だといえます。
 ただ、フォークソノミーがどんな場合でも万能なわけでもありません。

 よくいわれることですが、人によって考え方が違うだけでなく、ひとりの人でも長い期間の間に統一的にタグをつけることができるかというと、かなり怪しいです。
 また、「タグが表しているのは、カテゴリではなく内容だ」という指摘もあります。

 前述のPICSで、「紅葉」で検索したとき、「もみじ」と「銀杏」の写真が必ずすべて含まれるわけではありません。「銀杏」というキーワードで検索したときには、銀杏型のアクセサリの写真も含まれたりします。
 飲食店やアミューズメント施設のように、全体数が数千とか数万に限られていて同じアイテム(お店や施設)をほかの人があとから利用することを前提にしている場合はタクソノミーが、写真やブックマークのように、毎日数百数千も新しいアイテムが登録されるような場合はフォークソノミーが適しているようです。

 アイテムの数でその中間になる、映画や本やマンガといったコンテンツ類の場合は、タクソノミーとフォークソノミーの併用がいいのかな? という気がしています(実は『本が好き!』というサービスも担当しているので)。