3 月 14 日(月)の朝、東京オフィスに出社した Google マップのプログラムマネージャ、村上陽祐は、Picasa ウェブ アルバムを見て驚いた。午前 2 時にスタートしたばかりの「避難所名簿共有サービス」に、すでに大量の写真データが投稿されていたからだ。
ただし、避難所名簿共有サービス単独だとそれほど利便性は高くない。確かに避難所名を頼りに 1 枚 1 枚写真を見ていけば、知人や家族の安否を確認できることもあるだろうが、これにはかなりの手間がかかる。やはり人名などのデータから検索できるようにするのが望ましい。Google は自社のミッションを「世界のあらゆる情報を整理して世界中の人がアクセスできるようにすること」としており、この思想は社員の中にも浸透している。
では、画像データとして送られてきた名簿をどうやって検索できるようにするか。
Google は高度な画像処理技術を自社開発している。例えば、Google ブックスでは、ブックスキャナが書籍のページをめくりながら自動的に撮影、画像データから文字を抽出してデジタルデータ化する。このように、画像データ内の文字を認識してテキストデータに変換する仕組みを OCR(Optical Character Reader / Recognition)という。OCR 技術は年々進歩しており、手書き文字でもかなりの認識率を示すようになっているが、まだ人間には及ばない。特に、混乱した避難所の名簿の文字は、走り書き、殴り書きだ。米国のチームが OCR の技術を使って作業効率を上げられないか検証をしたが、実現性が低いということがわかった。
Google 社内では避難所名簿をデジタルデータ化するためのさまざまな方策が検討されたが、家族・知人の安否を求める人々に一刻も早く情報を届けるため、一番原始的な方法を採用することにした。つまり、人間が 1 枚 1 枚の写真を見て、書かれている名前その他の情報を読み取ってパーソンファインダーに入力するのである。
村上は、どうしたら効率よくテキスト化の作業を行えるか思案した。新たにシステムを開発するとなると時間がかかりすぎるため、Google ドキュメントのスプレッドシートを社員で共有し、進捗状況を管理する。Picasa ウェブ アルバムにアップロードされた写真には、それぞれ異なる URL(インターネット上の住所)が割り振られているので、これをスプレッドシートにコピー。Picasa ウェブ アルバムに投稿された写真にはコメントを付けられるようになっているので、ここに「作業開始」「完了」と記入して、作業の重複を防ぐ。そして、スプレッドシートに入力したデータをパーソンファインダーへと転記していくようにすればよさそうだ。
村上はふだんいっしょに仕事をしているチームのメンバーに声を掛け、社内メーリングリストでもボランティアを呼びかけた。50 人ほどのメンバーが集まったので、図版入りの手順書を作って作業内容を説明し、14 時ころには作業をスタートさせた。
15 日(火)になると、社内ボランティアの数は 85 人にまで増えていた。作業している人間が普段担当している業務はさまざまで、マーケティング担当やセールス担当もいれば、Google 日本語入力やウェブブラウザの Chrome を開発しているエンジニアもいた。ふだんは難解なプログラムコードと格闘しているエンジニアも、写りの悪い名簿の写真から何とか名前を読み取ろうと奮闘していた。また、基礎技術を担当しているエンジニアは、作業を効率化するための Chrome 拡張機能を開発し、15 日の午後に社内で公開した(23 日(水)には一般向けにも公開された)。この拡張機能は、Picasa ウェブ アルバムのコメント欄から情報をコピーしてパーソンファインダーに転記してくれるというものである。海外オフィスからも、日本語の読み書きができる社員が何人か作業に参加し、タイムゾーンの異なる東京オフィスのサポートに当たった。