Google 辞書機能とオンライン辞書など

Google で辞書が引けるようになったことが話題になっている。
英語版 http://www.google.co.jp/webhp?hl=en のみの機能。検索方法には2種類ある。

この定義を提供しているのは WordNet http://www.cogsci.princeton.edu/~wn/ という,プリンストン大学認知科学研究室に基盤を持つプロジェクト。そのデータベースは公開されていて,ウェブ上でも検索できるし,ダウンロードしてローカルで使うこともできる。PDA用の辞書 Noah もここのデータを利用している。プロジェクト側としては,Google 経由でどんな単語が検索されたかがわかれば,有用な資料になるだろう。

Google 自体は以前から辞書機能を提供していた。英語版で単語やフレーズを検索して現れる結果画面の,Web Images Groups Directory News と並ぶタブの下に Searched the web for *** という文が表れるが,この *** が Dictionary.com http://dictionary.reference.com/ へのリンクになっている。(あまり長いフレーズは登録されていないようだけど,get in なんかはフレーズで見出し語になっていた。)Dictionary.com は American Heritage Dictionary (AHD) や Webster's Revised Unabridged Dictionary のほか,WordNet のデータや各種専門辞書のデータを利用している。WordNet だけの検索(上の検索方法のうちコロンを使わないほう)よりこっちのほうが使い勝手もいいと思うが,あまり知られていないようだ。例:http://www.google.com/search?hl=en&ie=UTF-8&oe=UTF-8&q=cognitive&btnG=Google+Search

ウェブ上ですべてのデータが検索できる英語の辞書というのは,そんなに珍しくない。AHD は http://www.bartleby.com/61/ でも引ける。外国人の学習用英英辞典でも,Oxford Advanced Learner's Dictionary (OALD) が http://www.oup.com/elt/oald/ で,Cambridge Advanced Learner's Dictionary (CALD) が http://dictionary.cambridge.org/ で制限なく引ける。Longman Dictionary of Contemporary English (LDOCE) も,かつては同じことができたような(不確かな)記憶があるが,今はできないようだ。COBUILD http://titania.cobuild.collins.co.uk/index.html は,その原資料である Collins WordbanksOnline English corpus を機能制限付きで無料公開している。Macmillan English Dictionary (MED) http://www.macmillandictionary.com/aboutthissite.htm は当初からそうした機能は一般公開していない。辞書を購入したユーザーに限定。http://www.mlh.co.jp/med/online.html
これをみて,各社の著作権保護に対する考え方の違いもなんとなくわかる。今 Big5 と呼ばれている上述の(AHDを除く)学習用英英辞典の新版には,どれも高機能の CD-ROM が付属しているが,プロテクトのかけ方に大きな差がある。LDOCE と MED は,フルインストールしても30日ごとに CD-ROM の挿入を要求する。OALD と CALD はそこまで要求しない。COBUILD はどうだったっけ(持ってないからわかんない)。