Google

Google reCAPTCHAの新機能!1クリックでBOTを見分ける

  • このエントリーをはてなブックマークに追加
  • Pocket
  • LINEで送る
reCAPTCHA

GoogleがreCAPTCHAサービスの新機能を発表しました。

reCAPTCHAって?

みなさん一度は見たことあるでしょう。コレです。

google reCAPTCHA

あなたがBOTではなく人間であることを認証するやつ

どこかのサイトにログインするときや、ブログにコメントするときなどに、スパム送信のプログラム(BOT)ではなく人間であることを認証するためのやつです。わざと読みにくくした文字を人間様に入力させるあの忌まわしいやつです。こいつがreCAPTCHAと呼ばれています。

何が新しくなったの?

なんと文字入力が不要になりました。下記のような「I’m not a robot」と書かれたチェックボックスをクリックするだけで認証完了するようになりました。
魔法のような話ですよね。たったワンクリックであなたがBOTではなく人間であることが認証されてしまうだなんて。


新reCAPTCHAはワンクリックでおしまい

新reCAPTCHAではチェックボックスをクリックするだけで認証完了

どんな技術で?

Googleが開発したAdvanced Risk Analysisという技術によってユーザーが人間「らしい」ことを検出しているようです。Advanced Risk Analysisでは、IPアドレス、クッキーに記録されたトラッキング情報、マウスの動き方に基づいて、人間であるかBOTであるかを推定することができます。
例えば、あなたが過去にも同様のreCAPTCHAを問題なくクリアしていて、IPアドレスも怪しくなければ、Googleはあなたのことをほぼ間違いなく人間であると見なし、CAPTCHA(文字入力)する作業をスキップしてくれます。Googleでは、この機能をNo CAPTCHAと呼んでいるそうです。
逆に、あなたがプロキシ経由でreCAPTCHAにアクセスした場合は、GoogleはあなたのことをBOTの可能性が高いと見なし、とても難しいCAPTCHAを求めてくることでしょう。

その他の新機能

モバイル端末でもCAPTCHAの入力がしやすいインターフェースも追加されました。モバイル端末での利用が増えたこともあるんでしょうね。

モバイル端末でも扱いやすくなったreCAPTCHA

モバイル端末上でも入力しやすいインターフェースが提供されました

また、いちいち文字入力をさせることなく、似ている画像を選択させるタイプの新しいCAPTCHAも追加されました。モバイル端末では扱いやすいですね。

画像選択でモバイル端末でも扱いやすくなったreCAPTCHA

似ている画像を選択させることでモバイル端末でより利用しやすくなりました

reCAPTCHAのスゴイ裏側

reCAPTCHAで利用者から集めたデータは本や新聞のデジタル化にも活用されています。
これまで下図のように1つのCAPTCHAに2つの文字列が表示されていたと思います。

reCAPTCHAによる正解データ収集(テキスト)

正解が分かっている文字列と分かっていない文字列がCAPTCHAに用いられている

実は、このうち片方に予め正解が分かっている認証用の文字列、もう片方にまだ正解が分かっていない文字列が表示されています。
図の例では、overlooksという正解が分かっている認証用の文字列が表示されています。したがってユーザーも正しくoverlooksと答えないといけません。
しかし、inquiryの部分は、実はGoogleもなんて書いてあるか分かっていない文字列。本や新聞から適当に切り抜いた文字列画像が表示されているだけなんです。これをユーザーに答えさせることで、本や新聞に書かれている文字列の正解データを集めています。
もちろん、inquiryの部分はデタラメでも認証は通ってしまいます。そのためGoogleは複数ユーザーのCAPTCHAで同じ文字列画像を用いて、統計的に正解データを集めることをしているようです。

Googleはこの方法で、2012年にアメリカの新聞であるNew York Timesを30年分デジタル化し、また翌年の2013年には、1851年から現在までの合計1300万件もの記事のデジタル化を完了させています。驚きですね。
またreCAPTCHAで得られた、大量の文字列画像の正解データはOCR技術の研究開発にも活用されています。

reCAPTCHAによる正解データ収集(数字)

正解が分かっている数字と分かっていない数字がCAPTCHAに用いられている

また最近では、Googleストリートビューから切り取ってきた住所のナンバープレートもCAPTCHAに利用されてきました。
これも同様に、ユーザーに正解を答えてもらうことで、Googleマップに住所の番地を紐づけて位置情報の精度向上などに活用しているそうです。

reCAPTCHAによる正解データ収集(画像)

正解が分かっている画像と分かっていない画像群がCAPTCHAに用いられている

そして、今回新しく追加された画像選択によるCAPTCHAで収集するデータは、物体認識技術や画像検索技術などに活用されていくと予想されます。

ただのBOT避けのreCAPTCHAかと思いきや、裏でこんなすごいことやっているんですね。
ビックデータの時代、データをより多く持っているところが勝つと言われています。データを最大限に活用していこうとする姿勢が、Googleの優れた技術を築き上げているのだと感じさせられます。

  • このエントリーをはてなブックマークに追加
  • Pocket
  • LINEで送る

コメントを残す

*