PageRankの概要とch値の求め方についてのメモなど。
GoogleからPageRankを取得
通常、Google Toolbarをインストールすれば、Webブラウザ上から、閲覧しているページのPageRankを確認することができます。
しかし、それ以外の方法で、PageRankを取得したい場合、Googleに問い合わせる際に、そのページのURLとともに、ch値と呼ばれるそのURLのチェックサムを把握しておく必要があります。ch値については、
のブログ内で、その求め方が公開されています(PHP版)。
また、各言語で実装されたPageRank取得スクリプトには、以下のようなものがあります。
- WWW::Google::PageRank - Perlのモジュール。
- ruby script to get Google PageRank - Rubyで実装されたPageRank取得スクリプトと解説。
gplank.pl
試みにPerlで書いて*2みたPageRank取得スクリプト*3。引数もしくは標準入力から、http://またはhttps://で始まるものがあれば、そのURLに前に0〜10までのPageRankを付けて表示します。Googleによってランク付けされてないものに関しては、NO_INDEXを付加。
【使用例】 % ./gplank.pl http://www.google.com/ 10: http://www.google.com/ % cat url.list | ./gprank.pl 10: http://www.google.com/ 10: http://www.yahoo.com/ ...省略 % curl -s http://www.somedomain.com/sitemap.xml | \ perl -nle 'm"<loc>(.+?)</loc>" && print $1' | gprank.pl | sort ...省略
関連情報
- Google の人気の秘密 - Google自身によるGoogleが支持されている理由についての解説。
- Google の秘密 - PageRank 徹底解説 - PageRankについて、その基本的な概念と求め方の原理について解説している。