Contents
- 江渡 浩一郎
- 独立行政法人 産業技術総合研究所
- 情報技術研究部門 情報流デザイングループ
- なぜWiki小話でPodcastleの話なの?
- Podcastleとは何か
- 新しい検索サービスの形
- 集合知によるシステムの改善
- CD-DB
- ソーシャルブックマークのタグ
- ネットを日本語化する:Japanize
- Amazon Mechanical Turk
- Wikipedia
- 集合知によって改善するWebシステム
- Podcastleの対象領域とは
- 音声認識の本質的な弱点
- 音声認識の本質的な弱点(2)
- 音声認識を人間が補完する
- 集合知による音声認識の改善
- PodcastleとWikiの関係
- MashUp.request
- Plaggerとの連携
- 「読み」のmicroformats
- まとめ
集合知を活用したWebシステムとしてのPodcastle
■なぜWiki小話でPodcastleの話なの?
- 塚本「Podcastleって、Wikiなんですか?」
- PodcastleとWikiはどんな関係があるのか?
- Podcastleとは何か、Wikiとは何かを考える必要がある
- Wiki小話でPodcastleの話をすることに
■Podcastleとは何か
- 検索できる閲覧できる編集できる
- 3つの違う顔を持つWebサイトである
- 検索する → 検索サイト?
- 閲覧する → RSSリーダー?
- 編集する → Wikiサイト?
■新しい検索サービスの形
- ジミー・ウェールズによる新しい検索エンジン
- ユーザが検索結果を改善できる検索サービス
- 集合知によって結果を改善するWebシステム
- その萌芽と見るのが正しいのではないか
■集合知によるシステムの改善
- 実は昔からある
■CD-DB
- 音声トラックデータから情報を自動的に取得
- CDのタイトル、アーティスト、曲名が取得できる
- データが存在していない場合はユーザが入力できる
- 結果、極めてマイナーなCDでも情報が取得できる
- Webで情報入力 → CDプレイヤーで利用
■ソーシャルブックマークのタグ
- URLを登録する際にタグをつける
- たくさんの人がタグをつけることによって、もっともらしいタグが推測されるようになる
- タグをつけるのは手間だが、集合すると利便性が向上
- プラスのフィードバックループが発生する
■ネットを日本語化する:Japanize
- ネットを日本語化する:Japanize
- ユーザが自主的にWebサイトを日本語化する
Podcast => ポッドキャスト Speech Recognition => 音声認識
- 非常に平易な翻訳の組で表現している
- インタフェースを平易にすることで参加者増を狙う
- 参照: 奥一穂、WEB+DB PRESS Vol.36
■Amazon Mechanical Turk
- Amazon Mechanical Turk
- 人間しかできないと思われる動作を、プログラムの一部として記述する
- 例: 翻訳、画像の認識、一般的な知識の集積など
- しかしこの試みはうまくいっていないように思われる
- 人はお金で動くという誤った前提条件に基いている
■Wikipedia
- フリーの百科事典を作るという理想
- 百科事典では無いにしても、知恵の集合となっている
- Wikipediaをベースとした検索エンジンへと発展
■集合知によって改善するWebシステム
- CDのタイトル、Webサイトの翻訳情報、URLのタグ
- Webで情報入力 → メタなレベルで利用
■Podcastleの対象領域とは
- Podcastleが必要とする集合知は何か
■音声認識の本質的な弱点
- 本質的に、音声認識は完全ではありえない
- 人間でさえ、音声認識は完全ではない
- 聞きとりにくい声は人間でも聞きとれない
- 知らない単語は人間でも聞きとれない
■音声認識の本質的な弱点(2)
- しかし、人は機械に完全を求める
- 人が聞きとれなくても機械は聞きとれるはずと思う
- 人が知らない単語でも機械は知ってるはずと思う
- 機械は完全であるという幻想を持っている
■音声認識を人間が補完する
- 機械が聞きとれない単語でも、誰かは聞きとれるはず
- 機械が知らない単語でも、誰かしら知ってるはず
- その「誰か」は、どこにいるのか?
■集合知による音声認識の改善
- 音声認識の持つ本質的な弱点を集合知で改善する
- 「誰か」は、改善できるに違いない
- その「誰か」は、どこにいるのか?
- そこでWeb 2.0ですよ
- 「誰か」が聞きとったテキストがみんなの役に立つ
■PodcastleとWikiの関係
- 結局、集合知の活用という点では共通している
- Web 2.0の未来は明るいぞ
■MashUp.request
- Plaggerとの連携
- microformatsによる情報取得
■Plaggerとの連携
- PodcastleからどんなRSSを吐けばいい?
- iPod用RSSなどいろいろな要求がありうる
- とても全部の要求には答えられそうにない
- そこで「それPla」ですよ
- Podcastleは最小限のRSSを提供する
- それを元にPlaggerで任意のRSSを生成する
- どっちもウマー
■「読み」のmicroformats
- 言葉の読みを自動的に取得したい
- 蒼井優
<p><b>蒼井 優</b>(あおい ゆう、
- microformatsを使ってみる
<p><b><span class="kanji">蒼井 優</span></b> (<span class="yomi">あおい ゆう</span>、
- 最小限の努力で読みを指定できる
- クラス名はもうちょっといいのが無いかなぁ
■まとめ
- 集合知を活用したWebアプリケーションの夜明け
- マッシュアップで行こう
- Web 2.0の未来は明るいぞ
Last modified: 2007-01-09