こんにちは、齊藤です。
7月15日にライブドアに入社しました。livedoor Readerlivedoor クリップを担当しています。前職はエンジニアでしたので、技術の話もできるディレクターとして頑張ります。

今回は、「セマンティック WEB 」をサービスの企画に活かすための実例を紹介していきたいと思います。皆さんは「セマンティック WEB 」という言葉を聞いたことがあるでしょうか。今回はセマンティック WEB 構想を簡単にご紹介して、そのビジネス的な観点を考察してみたいと思います。

【01】セマンティック WEB 構想とは何か

セマンティック WEB は、WEB 上に存在する様々なページにメタデータを付与することによって、WEB の世界を単純なデータの集合から進化させて、「意味」や「関係性」を持たせた巨大なデータベースにしてしようという構想です。その具体的な表現方法として、XML / RDF / OWF などの言語で文章を構造化・関連づけするが提唱されています。セマンティック WEB に関しては、 The Web Kanzakiのスライド資料が非常に充実していて参考になります。

セマンティック WEB が提唱された背景には"HTMLの限界"があります。本来、HTML / CSS は文章を人間が把握しやすいように整形して表示することを目的としていました。しかし、コンピュータが見たとき、その文書が何について書かれたものなのか、文章の途中に出てくる単語は商品名なのか人名なのかなどを自動判別することが困難です。コンピュータから見ても文章構造や関連性がわかるように再構成していくのが、セマンティック WEB です。

【02】学術的議論からビジネスの世界へ

今までセマンティック WEB は学術的な分野や、W3C などの WEB の標準仕様の検討の場で議論されていたのが中心でした。しかし、近年の技術動向の変化から状況は変わりつつあると感じています。例えば今年、W3C が HTML5 の草案をまとめあげ、草案の中にセマンティック WEB の観点を盛り込みました。ブラウザや検索エンジンも対応へ向けて動き出してきています。

【HTML5】
W3Cは次期 HTML5 草案の中で、文章の意味の割り当てを定義できるタグを追加しました
セマンティックHTMLの規格化に向けたHTML5のドラフト

【Internet Explorer】
次期 IE8 では Web ページ内の文字列に対して「これは住所」「これは商品情報」「これはプロフィール情報」といった意味がタグを使って付与できるように実装を進めています。
【詳報】セマンティックWebに向かうIE8の「8つの強化点」(ITpro)

【Yahoo!】
Yahoo もあらゆるセマンティック情報を収集する方針を打ち出しています。
Yahoo!、検索のオープン化とセマンティック Web 対応を明らかに(ITmedia)


さらに、XHTML の中でもセマンティックに情報を記述できるmicroformat(XHTML の中で文書構造を示す簡単なフォーマット。XHTML の属性として記述する)の登場も変化を後押ししています。技術的にはかなり実用段階までの土台が整ってきました。いま必要とされているのは、これらの構想や技術を活用したビジネスモデルの構築です。

【03】情報検索のイノベーションとしての価値

特にビジネス的な価値があると思われるのが、情報検索の分野です。今までHTML の限界が検索エンジンなどの情報検索にも制約を与えてきました。現在の検索エンジンは、収集した HTML に無差別にキーワードを投げて、結果を全件表示するという段階にとどまっています。検索エンジンの検索精度を担保しているのは、検索順位でしかありません。

しかし、セマンティック WEB によって文章データが構造化されると、より精度の高い検索結果を導き出すことができ、そこにはページに埋め込まれている住所やレビューなどの要素も抽出して検索結果に加えることができます。実際にそういうサービスが既に始まっています。

【microformatを利用した例】

Yahoo Local
Yahoo Local では地域の検索結果に店舗の情報を載せたい場合、Yahoo に登録して申請しなくても、店舗のページで microformat が使われていたら自動登録します。

マタタビ
JTB中部が運営するマタタビでは、外部サービスとの連携に microformat を使用しています。外部アプリと連携して、他のユーザーの連絡先を vCard 形式で抜き出して、Outlook に追加することや、同じタグの写真を Flickr で探すことができます。

Google Maps
Google Maps では、検索結果に対してmicroformatの hCard のクラスを挿入しています。他のサービスに住所や電話番号を流し込むこともできます。

【Wikipediaを語彙の集合として活用した例】

Faviki
Favikiはソーシャルブックマークサービスですが、ブックマークする際のタグに Wikipedia の項目名が使われています。Wikipedia を共通の語彙の集合(オントロジー)として扱い、そこにソーシャルタギングの着想を取り入れた新しいサービスです。


上記のように多様な情報検索のスタイルが出現しつつあります。今まで検索エンジンの全文検索には実現できなかった高度な検索や、単語と単語の関連性表示、他のアプリケーションとの連携において、セマンティック WEB は威力を発揮しています。

【04】CGM のメタなプラットフォームとしての価値

セマンティック WEB は共通のタグを手がかりに、WEB の世界を再構築するものであるため、CGM 間の情報量や方向性やデザインの違いはあまり重要ではありません。RSS リーダーのように、情報を一元的な場所に集め、ユーザー自身が目的に応じて使い分けていくアプリケーションが今後ますます盛んになってくると思われます。

今まで RSS リーダーは、サイトのタイトルや要約文を平文のテキストとしてしか得ることができませんでした。しかしセマンティックWEBの中では、単語や単語の意味・数値・住所・電話番号・ユーザーのつけたタグなどの区分ごとに情報を得ることができます。活用の幅が一気に広がることになります。

【05】ディレクターとセマンティック WEB

今までお話してきたように、セマンティック WEB は既に進行しつつある WEB の次なる技術です。セマンティック WEB を理解していくことは、サービスの企画を考える上でディレクターも不可欠な状況になりつつあります。また、その構想を理解することによって新しいビジネスチャンスをつかむ可能性が広がります。

ライブドアでは、livedoor Reader を使って、RSS での更新情報をチェックできるサービスを提供しています。しかし、今後のセマンティック WEB の流れの中で、XML / RDFによって実現できることは今以上に一層高まってくると思います。多様化する検索ニーズを満たすために、技術動向を見極めながらサービスに活かしていきたいと思います。

ライブドアでは、WEB の先端に関心を持って追い続けるディレクターを募集しています。