Googleの新たなランキング手法が明らかになったそうです。この
英語の特許文書を読めば全てが分かります。英語に自信のあるあなたの出番ですよー。
はい、自分で読みます。
最初に書いてあるのは、
サーチエンジンに登録されてからの日数(age)がポイントであるということです。確かに情報源のページがあって、それから徐々に他のページが派生していくと考えられます。つまり、
ある情報について老舗であればあるほどスコアが高くなるという仕組みのようです。
それから、あるページへの関連付けが一定期間中にどれくらいの割合で変化したかがポイントであるということです。つまり、
より短期間により多くのページの興味を惹きつけたページほどスコアが高くなる仕組みです。
また、
ある一定期間にある検索結果の中からどのくらいクリックされたかというデータを、履歴データという物に持っていて、スコアに影響を与えるようです。計算機では把握できない部分をユーザからのフィードバックで補おうという考えでしょう。履歴データには他にも、
- あるキーワードに関連して頻繁に出現するキーワード情報
- 期間によって異なった検索結果を導くキーワード
- 新鮮さがどれくらい失われているか
- ある期間にページへのリンクがどのくらい出現し、どのくらい消えたか
- リンクの新鮮さ(確かに時間が経つとGoogleの順位が下がることある。うん。)
- アンカーテキスト(リンクのタグで囲まれたテキスト)の変化
- トラフィックパターン(?)
- ユーザがそのページに滞在した時間(これは検索結果の中からそのページがクリックされてから、別のページがクリックされるまでに経過した時間のようだ。なるほどね。)
- ドメインに関する情報(ネームサーバーにないドメインのページはスコアを下げるとか)
- 過去のランキングデータ
- どのくらいユーザがお気に入りに登録したり、そこから削除したりしたか??
- アンカーテキストの成長プロファイル(どんな風にアンカーテキストが増えているかというもの?)
- 独立したピアのつながり
- ドキュメントのトピック
などが(
履歴データとして)含まれているようです。あとはよく知られたページランクアルゴリズムの説明だと思います。
特許のClaimsの部分だけであまりに長すぎてぐだぐだになってしまいましたが、Googleにはページのランク付けにこのような技術を利用している(もしくは利用しようとしている)ということです。んー、すごいです。意図的にランキング操作をするのはかなり大変な気がします。
結局のところGoogleで高い順位を目指すには、より良い中身のコンテンツを作ることが一番の近道である、ということに私も同感です。