猫でもわかる 秘密の英語勉強会

Yahoo、10億を越えるアカウントの情報流出

今回の記事はこれ。Yahoo discloses hack of 1 billion accounts

えっと、Yahoo が・・・・・・?

disclose は「発表する」とか「明らかにする」という意味。close の反対だね。だから記事タイトルを直訳すると「Yahoo が 10 億アカウントのハック (流出) を発表」ということ。

10 億人分のアカウントが盗まれちゃったんだって。

盗まれちゃったって、とんでもない数じゃないですか。今の世界人口は 73 億人でしょ。

実際は 1 人で複数アカウント持ってる人も多いだろうけど、大変な数であることには変わりないね。

10億を越えるアカウントの情報流出

Yahoo 10億を超えるアカウントの情報流出

記事の内容を簡単に要約するとこんな感じ。

Yahoo は今日、10 億以上のユーザアカウントが 2013 年 8 月に流出していたことを発表した。同社は今年 9 月にも 5 億アカウントのデータ流出を報告していたが、今回のデータ流出はそれとは別件だという。

Yahoo の情報セキュリティ担当者ボブ・ロードによると、10 億アカウントのデータがどのように流出したのかはまだ不明とのこと。流出したユーザアカウント情報には、名前、メールアドレス、電話番号、誕生日、ハッシュ化されたパスワード (MD5)、さらに場合によってはセキュリティの質問と回答が含まれている可能性がある。

Yahoo は情報流出に関する警告を受け、外部専門業者の協力のもとデータ調査を実施した。流出データには支払情報や平文のパスワードは含まれていないようだ。ハッシュアルゴリズムの MD5 は今や安全とは言えず、ネットで検索すれば簡単にパスワードを探し出すことができる。

Yahoo は影響するアカウント所有者に通知を行い、パスワードの変更を求めている。

僕のところにはメールは来てないっぽいな。日本でも影響あるのかな?

どうだろうね。どちらにしろパスワードは変更しておいた方がいいんじゃない?

さて、今回の例文はこれ。

 例文

The hashing algorithm MD5 is no longer considered secure and MD5 hashes can easily be looked up online to discover the passwords they hide.

ハッシュアルゴリズム MD5 は今や安全とは言えず、MD5 でハッシュ化したパスワードはネットで簡単に見つけ出すことができる。

今回は接続詞 and で 2 つの英文が並列になっているよ。1 つ目の文の主語は The hashing algorithm MD5 で「ハッシュアルゴリズム MD5」。

その後の is no longer considered secure が「もはや安全だとは考えられていない」。no longer が「もはや〜でない」という否定の意味になるんだよ。

その後の and 以降がもう 1 つの文。この文の主語は MD5 hashes で「MD5 ハッシュ」。

can easily be looked up online が「ネットで簡単に検索できる」。

to discover the passwords が「パスワードを見つけるために」で、その後に関係代名詞の that が省略されている。

that they hide が「それが隠している」となって、直前の passwords に説明を加えている。直訳すると「MD5 が隠しているパスワードを見つけるために」、つまりハッシュ化する前のパスワードを簡単に見つけることができるということ。

2 つの文が 1 つにまとまっているから長いですね。

ところで、そのハッシュアルゴリズム MD5 って何ですか? 暗号文を作る仕組みですか?

いや、ハッシュ化と暗号化は似ているけど違うんだよ。暗号化というのは元の文 (平文) を意味不明なデータに変換すること。その変換されたデータは、元の文に戻すことができるの。暗号文を元に戻すことを複合というよ。複合化ではなく複合ね。

ハッシュ化も元の文を意味不明なデータに変換するところは同じなんだけど、元には戻せない。そのハッシュ化を行う仕組みをハッシュアルゴリズムと言って、そのアルゴリズムの 1 つに MD5 (Message Digest Algorythm 5) という名前が付いているの。

元に戻せないって、意味あるんですかそれ? 意味不明なデータのままじゃないですか。

たとえばパスワードを「sakana」と設定するよね。そのパスワードをハッシュ化して、たとえば「320143」になったとする。そのハッシュ化された「320143」がサーバに保存されるの。パスワードの「sakana」は保存されない。

そしてユーザがログインするときに「sakana」と入力すると、それをハッシュ化した「320143」とサーバに保存されているデータが一致するかどうかが確認されるの。元の文に戻す必要はないんだよ。

そんなことをして、どういうメリットがあるんですか?

パスワード「sakana」をサーバに保存するわけではないから、仮にサーバに保存されているデータが流出してもパスワードそのものがすぐにばれるわけではないでしょ。ハッシュ化された「320143」というデータは流出するけど、それは復元できないから元のパスワードは分からない。

ユーザが入力するのはあくまでパスワードの「sakana」だからね。ハッシュ化された「320143」がばれても大丈夫、というのが元々の狙いなんだよ。

でも、記事にもあるとおり MD5 でハッシュ化されたデータは今や安全ではないのだけどね。

そうなんですか。なんにしろ、一応パスワードを変更しておいた方が良さそうですね。

今回みたいにデータ流出があってもすぐに公表されないことがあるから、定期的なパスワード変更はやっぱり重要なんだね。

登場キャラクター

シン
英語が苦手な少年。ミサから英語を教わっている。

ミサ
英語を教えてくれる近所のお姉さん。