z is for zokkon

50代男性が健康と幸福を追求する日常をつづります

ググる言語学?

言語学の研究をググってするというのはありなんだろうか?」「論外です」
以上。
古い話題で恐縮ですが。
上の記事に対するブクマには「Googleに頼ったらアルゴリズム変わったときに追試できねーじゃん。科学と呼べないだろ。」という感想をつけたのだが、最近はウェブのあり方も変わってきたので、別の理由も思いついた。

昨晩twitterで書いたことなんだけど、Citigroup plans to pare US stake という新聞の見出しを見て、pareとstakeを共起させるのはどれくらい広く使われているのか、そしてどれくらいくだけた表現なのかと思って pare stake と入れて検索してみたら、検索結果はほとんど同じソースで占められた。配信元の通信社の文章を転載したものがほとんどだったのだ。@fukumimiの助言に基づいて言語を英語に切り替えて検索してみると、日本語版Googleよりはバラエティがあり、インドの新聞が目につくようになったが、やはり同じソースが目立つ。検索業者が最近のニュース記事を重視するアルゴリズムを採用しているのか、ニュースの転載先が増えているのか、その両方なのか、判断材料がないが、英語に関しては検索エンジンを簡易コーパス代わりに使える牧歌的な時代は終わった。その方法はもうほとんど破綻していると言っていいと思う。

英語コーパスと言語教育―データとしてのテクスト
4469213217