GMOインターネットグループの技術情報は新しいサイトに移管しています。 新しいサイトはこちら

社内レポート

2011年7月27日(水)

Googleの新アルゴリズム「パンダアップデート」

機械によるサイトの品質評価によって、よりユーザーの利益を追求した検索環境へ

GMO SEOテクノロジー株式会社(現 GMO TECH株式会社) 代表取締役社長 兼 GMOインターネット株式会社 WEBプロモーション研究室 首席研究員 鈴木 明人が解説。
全世界の英語圏において導入されたGoogleの新アルゴリズム「パンダアップデート」について執筆。

記事INDEX

はじめに

前回までセマンティックWebについて執筆して参りましたが、今回は趣向を変えてGoogleの新アルゴリズム「パンダアップデート」について執筆したいと思います。
既にご存知の情報もあるかとは思いますが、本レポートが少しでもサイト運営の参考になれば幸いです。

パンダアップデートと、その目的

パンダアップデートとは、Googleの新アルゴリズムの名称で、本アルゴリズムを開発したキーパーソンが「パンダ」という名前だったことから命名されたようです。 まず先行して導入されたのが米国圏で、2011年2月24日(米時間)から開始されており、続いて、2011年4月11日(米時間)に全世界の英語圏において導入されました。

本記事を執筆時点の7月20日時点では、日本語圏への導入は正式に発表されておりませんが、いずれにしても導入されるのは時間の問題かと考えられます。
では、この「パンダアップデート」の目的とは何でしょうか? それは、以下のような項目に該当するようなサイトを検索結果から排除することとなります。

1 : 自動生成系コンテンツを用いたサイト
→自動的に記事をクロールしてきてページを生成するような人間の手を介さないコンテンツを用いているサイト。

2 : コンテンツに信ぴょう性が無いサイト
→GoogleのブラウザであるChromeの拡張機能にて提供中の検索結果をブロックする機能(ユーザが検索結果に表示したくないサイトをブロック)をアルゴリズムの一部に取り入れて判断している模様。

3 : 複数のページにおいて文脈を変えずにキーワード単位で変更が加えられているサイト
→文字通り、文脈のテキストは変えずにルール化したテキストでサイトを構成しているようなサイトが対象。

4 : メインコンテンツよりも広告が多く目立つサイト
→ファーストビューに入ってくるコンテンツの大半が広告である場合など、広告のクリックなどが目的と捉えられるようなサイトが対象。

5 : 用語集的なコンテンツで他サイトと同様の内容を流用しているようなサイト
→用語集やWiki等の他サイトと同じような内容を扱ったコンテンツを多用しているサイトが対象。


つまり上記を一言で言うなら、ユーザにとって利益にならないコンテンツ = 低品質なサイトを排除することを目的としているということです。
また、機械がサイトの品質を評価するという難しい領域に更に奥まで踏み込んだのがパンダアップデートであると言えます。

ちなみに同アルゴリズムでは、サイトのAuthority(権威)に関わらず、該当するサイトは検索結果から排除されておりますので、大変厳しいアルゴリズムと言えるかもしれません。

パンダアップデートに備えるべくGoogleがサイト管理者に用意したガイダンス

Googleはサイト運営者が管理するサイトを正しく評価できるようにガイダンスを提供しています。 ガイダンスは23項目からなっており、以下が詳細となります。

01 : サイトに掲載されている情報は信頼できますか?

02 : サイトに掲載されている記事は専門家や熟知している人によって書かれていますか?
それとも浅い内容を扱っていますか?

03 : 若干異なるキーワードを用いて似たような記事を書いていたり、冗長したような記事を扱っていませんか?

04 : 自身のサイトはクレジットカードの情報を扱っても問題がないサイトですか?

05 : 綴りやスペル、記事の事実関係に誤りがありませんか?

06 : 記事はサイト読者の利益を目的としていますか?
それとも検索順位を目的としていますか?

07 : サイトではオリジナルのコンテンツや情報、レポートなど独自の要素を提供していますか?

08 : 同じ検索結果に表示されるサイトと比較した場合に、自身のサイトは大きな価値を提供していますか?

09 : コンテンツの品質をどの位管理していますか?

10 : 記事に表裏がある場合、その両面についても説明していますか?

11 : 扱っている内容について、Authority として認識されていますか?

12 : コンテンツが多数のクリエイターなどにより大量に生成されている、または大規模なネットワークに展開しており、サイトやページなどをケアできていない状態が発生していませんか?

13 : 記事は丁寧に編集されていますか?
それともずさんな編集となっていますか?

14 : 健康関連のクエリ(検索)であった場合、サイトの情報は信用できますか?

15 : サイトに名前を記載している場合、正式な情報源として認識できますか?

16 : 記事はトピックについて完全または包括的な説明を提供していますか?

17 : 記事は洞察力に富んだ分析や興味深い情報を提供していますか?

18 : 提供しているページは、友人にお勧めしたり共有したいと思える内容ですか?

19 : メインの記事から気をそらすほどの過剰な広告を提供していませんか?

20 : 印刷した雑誌や百科事典がページの中で扱われていても見たいと思えますか?

21 : 記事は実質的な中身が無かったり、役立つ情報が欠けていませんか?

22 : 細部まで配慮し注意を払ってページを作っていますか? それとも関心を払ってませんか?

23 : ユーザがサイトやページを見た時にクレームを言うことはありませんか?

漠然としているので読み辛いかも知れませんが、要約すると “ユーザに見て貰うべき価値あるコンテンツを提供しているのか” が焦点となっています。

パンダアップデートで気を付けるべきサイト

パンダアップデートで気を付けるべき点については、前述の通りですが、実際に気を付けるべきサイトにはどのようなものがあるでしょうか?
サイト運営者にとって特に身近な点が、APIやRSSフィードなどを利用しているようなコンテンツシンジケーション系のサイトと言えるかもしれません。

近年、様々なAPIやRSSフィードの普及により、サイト内のコンテンツの一部として外部サイトの一部コンテンツを利用するという形態が多くなりました。
以前のSEOであれば、取り込んだコンテンツからの流入や、ページボリュームを増加させることを目的(SEO目的)として利用する機会が多かったのですが、今後、同アルゴリズムが日本に導入された場合には、低品質なコンテンツがサイト内に複数存在するということになりかねないので注意が必要です。

また、今まで通用した施策の一つとして、複数の物件情報を展開しているポータルサイトが、自社サイトのAPIを活用して、物件情報を使い回し多くのサイトを構築するという手法も注意が必要です。
多くの場合、複製したサイトにおいて構造などに差異はあるものの、利用している物件情報そのものが使い回しであり、多くの詳細ページにおいて説明文などが共通となっているケースが少なくありません。
さらに物件詳細ページと大本となるサイトはリンクで繋がっているケースが大半を占めていると考えられますので、検索エンジン側からすれば、コピーサイトであると容易に想像できます。

上記までで、特にAPIやRSSフィードを活用しているサイトを例に挙げましたがコンテンツシンジケーションは、導入ハードルが低いため、個人サイトにおいても実施されているケースがあると思われます。 思い当たる節がある方は、ぜひ一度この機会に運営されているサイトを点検されてみてはいかがでしょうか。

最後に

今回はGoogleが英語圏で導入した「パンダアップデート」について取り上げてきましたが、前述のとおり、パンダアップデートは “サイトの品質” に踏み込むという点で大きく進化しており、機械がサイトの品質を判断するという領域において、一歩先を行くアルゴリズムと言えます。

この点は、前回までに執筆したセマンティックWebと重なる部分があり、品質を分析するという点で、文脈や言語解析の部分などが我々が思うよりも更に進化していると考えられます。
今後益々、広告やトラフィックを稼ぐことだけが目的のサイトなどは淘汰され、ユーザにとって有益なコンテンツ = 情報を提供しているサイトが存続すると想定されます。

次回パンダアップデートについては、何か進捗があり次第、またSEO業界レポートで取り上げていきたいと思います。

NEXT >企業のWeb担当者が意識するべきSEOの6つのプロセスについて


2011.6.27



*本文中に記載されている会社名および商品名・サービス名は、各社の商標 または登録商標です。