ラベル data-driven journalism の投稿を表示しています。 すべての投稿を表示
ラベル data-driven journalism の投稿を表示しています。 すべての投稿を表示

2016年1月26日火曜日

最近読んだもの。ランサムウェアの被害にあうオバチャン、情報過多など。

最近読んだり、聞いたりして興味深かったものをいくつか紹介。

■シリコンバレーを真似しないほうがいい。代わりにフローレンスなんかはどうだい?
https://hbr.org/2016/01/renaissance-florence-was-a-better-model-for-innovation-than-silicon-valley-is
Urban Plannerはみなシリコンバレーのまねをした町をつくりたがるが、だいたい失敗に終わる。なぜかというとシリコンバレーは新しすぎてそこからレッスンを学ぶには旬すぎる。だからそう、もっと昔のイノベーションのハブとなった町を見本とするべきだ。フローレンスとかね。(→イノベーションシティについて調べた本を絶賛発売中の人による寄稿だった)

■RadioLabのストーリー「Darkode」がすごく面白い。
http://www.radiolab.org/story/darkode/
もうすぐサンクスギビングだという頃、マサチューセッツ在住のふつうのおばちゃんに大惨事が訪れる。突如自分のPCが身代金要求型不正プログラムであるCryptoランサムウェアの被害にあい、ファイルを取り戻すために身代金をビットコインで払う羽目になる。いろいろな偶然が重なって散々な目にあう。このおばちゃんはウクライナ-ロシア系で、「ビットコイン」なんて言葉は初めて聞いたが、ランサムウェアのメッセージから、このランサムウェアの主はロシアとかウクライナ方面からの悪者に違いないということも察して、ロシア語で「あんたら地獄に落ちるわよ」と返信したりもしている。(笑)TORを初めてダウンロードしたり、ビットコインを手に入れるために大雪の中郵便局にいったり、レートが変動したり、乳児がいて忙しい娘にママ友との約束をキャンセルしてATMに行かせたり、笑えない話ですが、てんてこ舞いなおばちゃんの姿が笑えます。タイトルのDarkodeはスパムやボットネット、ランサムウェアを流布させるような一味の名称で、後半には某機関に転向したその創設者のインタビューも。

Cryptowallについては(日本語)
http://blog.trendmicro.co.jp/archives/11739

■所有者だけがアンロックできるスマート銃で、、ステキで劇的な射撃体験をシェアしよう
http://www.npr.org/sections/alltechconsidered/2013/05/15/184223110/new-rifle-on-sale
2013年に話題になった「スマートライフル」。wifiやカメラ、センサーがついてきて、トラッキングポイントという技術を使って、正確に射撃したり、録画した映像をソーシャルメディアに投稿できるものだ。悲惨な銃撃事件が耐えないアメリカですが、2016年に入ってからはオバマ大統領が銃規制の目的でスマート銃の導入を視野について検討するよう国土安全保障省に呼びかけをしたりしています。そうすれば、銃の所有者が、スマートディバイスとしての銃を持つようになれば、利用データなどの把握が可能になり、事件を防ぐことができるという考えのようですが・・・。

■3Dカメラで、容疑者の顔写真を照合し識別、これで東京オリンピックも安全だ
http://gizmodo.com/3d-cameras-will-help-tokyo-cops-take-futuristic-mugshot-1754924981
警視庁は、客観証拠の確保に努めようと技術的に進んだ取り組みを行なうことにしたようだ。朝日新聞が報じた、NPAの報告書の原文を見ると、「防犯カメラ等で撮影された人物の顔画像と、別に取得した被疑者の三次元顔画像とを照合し、個人を識別する」三次元顔画像識別システムを今年4月からすべての都内の交番に設置するとのことだ。この報告書には、他にもいろいろと興味深いテクノロジーについて掲載されている。通信傍受、高度情報技術解析センターの設置(済み)など。これらの取り組みの背景としては、「司法改革や否認事件の増加を受けて」とのことである。
(→NPAの報告書はわりと毎年読むようにしてるけど、記事の参照先がH26なのがちょっと不思議。朝日の元の記事は、警察周りあがりの記事を英語で執筆ものだろうからちゃんと調べたほうがよさそう。)

NPAの報告書(H26)
https://www.npa.go.jp/hakusyo/h26/honbun/html/qf320000.html

■インフォメーションオーバーロード~情報過多からの叫び~
https://hbr.org/2016/01/what-youre-hiding-from-when-you-constantly-check-your-phone
ちょっと前まではデジタルネイティブなんて呼ばれてもてはやされていたミレニアル世代ですが、現実はもっと暗いものよう。ニールセンやPEWの調査、それから最近増加しつつある「テクノロジー中毒」分野の研究によって、ミレニアル世代は、寝るギリギリまで常時モバイル端末などを手にしながらも、テクノロジーによってストレスを感じている。さらに、手元に携帯がないことは更なる大きなストレスともなり、どっちにしてもストレス!根本的にはミレニアムたちは職やお金といった基本的なところでのストレスが最も大きい。そして気を紛らわしたり活用することで他より抜きん出ることができる伴侶としてのテクノロジーと共に過ごすしかない。このところ、東海岸では情報過多についての議論が増えているような気がする。

■FOMOからJOMOへ。
http://www.wnyc.org/story/fomo-jomo/
上で紹介した「情報過多」について話す時に、使われるよく使われる英単語がFOMOだ。FOMOとはFear Of Missing Out(見逃すことの恐れ)。あなたも今週は一回くらい、どこかで、SMAP解散騒動に関する何らかの記事や、ベッキーとゲスの極みに関する何らかのコラムを読んだことだろう。(私は読まなかったし、テレビもないので、正直なんだかさっぱりだし、知らなくていいや)そして、職場や友人とそれらのトピックについて参照したおしゃべりを少なくとも一回は耳にしただろう。知らないとヤバイ、仲間はずれにされたくない、損した気分になりたくない、そんな気持ちがFear of Missing Outだ。このFOMOという言葉を生み出したメイカーベースの創設者、Anil Dashは、見逃すことを楽しめ!とJOMO(Joy Of Missing Out)を提唱。FOMOを生み出すようなプログラム、ソフトウェア、テック企業の文化背景などについても触れています。(ネット黎明期はそんなんじゃなかったって!)

■魂を売ったコンピュータ、プライバシー、データ保護の国際会議CDPD
https://ar.al/notes/why-im-not-speaking-at-cpdp/
その名のとおり、コンピュータ、プライバシー、データ保護という甚大なテーマを扱う年次会議、略称CDPDは今年もビッグネームスポンサーたちを抱えて素晴らしい会議を行なう予定だ。Google, Facebookはもちろんのこと、Palantirも。日本からは中央大学、明治大学も。もっとも国際的で大規模なタイプの会議だと思われますが、オープンソースでインディペンデントなモバイルハードウェアを作るプロジェクトindieのAral Balkanは怒って招待を断った。テック系のカンファレンスだったらやむをえないなと思う一方、彼はCDPDにはある程度期待感を持っていたんだろう。Palantirのロゴが記された会議で皮膚癌で亡くなったプライバシーアドボケートのCaspar Bowdenに功労賞を与えるなんて、侮辱行為に等しいとAralは感じているが、過去のスポンサーのロゴを見ると、そもそもそんなに期待できるものでもないかもね。

2016年1月8日金曜日

数値で測ることの恐怖

あけましておめでとうございます。
年始早々に暗くてすいませんが(年末に書いたんです)
データドリブンな世界における注意に続きがあるんです。続きというのは後からでてくるものですが、後ろにあるわけではなくて前にありました。なんだかもう、過去のゲームをもう一回やっているんじゃないかという気分になってきました。

Alexis C. Madrigalが、データドリブンな世界に潜む欺瞞を語るときに、自分の健康を計るうえで向き合う―がそれはうそっぱちであるもの―体重計について触れていましたが、最近手にした原克の著書「身体補完計画 すべてはサイボーグになる」はその源流となるところを紐解いているように感じます。

振り返ってみるとこの『計る』という行為の裏側には、アメリカ建国から自らの国力を高めるためという目的があった。クリーンで健康なアメリカ国民というのを広めるうえで、優性な血統が汚されることなきよう最新の科学を応用して測定する。そこに標準体型が数値として表され、見本となるような像(ノームとノーマ)まで作られていった。

ところで計るという行為と優性思想を考えたときに、私が思い出すのはベルギーの植民地であったルワンダで起きたジェノサイドである。学生のころ文化人類学の権威(と同じ苗字!)の講義を受けられる!とわくわくして聞きにいくと、ツチ族とフツ族の対立について少数派と多数派の文脈で語られるのみであったが、そののちにルワンダ虐殺についての映画作品「Sometimes in April」を見て、その背景のおぞましさを改めて思い知らされた。入植者が、鼻の高さで現地の人々をツチ族とフツ族に種別分けしたのだった。そして携帯を義務付けられている身分証に計測に基づき、いずれに属すか記されている。それがどちらかであるか、というもののみが登場人物たちの生死を分かつことになる。

身体の特定の部位を優性思想のもとに測定しソートする行為。もっと言うと、ツチかフツか明記した身分証を必携させており、識別子となって身分証に書かれていることが生死を分ける。ジグムント・バウマンのリキッドサベーランスとともに、これからのデータドリブンな社会が何を描いていくか、過去は十分に語っているような気がしてならない。最新の科学の力で数値化し、ソートするその行く末は「適合者」のみをあぶりだす行為だ。そしてその計測・解釈がすべて正しいという前提でのみ適合、不適合の二元性から、私たちは逃げることができない。

インターネットは歪んだ現実のみを流布する。それは「テクノロジー」と「健康」に偏っている。そして我々は哀れにも金を払ってフィットネスに通わなければならない。そしてフィットすべき標準のスコープとサンプルは、もっとずっと偏っている。

2015年10月20日火曜日

データドリブンな世界の注意書き

少し時間がたってしまったが、データドリブン依存について批判する記事が目に付いたのでいくつか紹介する。

ひとつは学術論文で、もうひとつはABCニューズネットワークがファンドしているポップカルチャー中心のネットメディアFusion。一般においても、学術分野においても、データから求めた解に依存することへ注意が必要だと認識する段階にあるということが見て取れる。

ではひとつめ、Sophie ChouRace and the Machine

MITの学生(と思わしき)で、ブルームバーグが開いたデータフォーグッドエクスチェンジ(#D4GX)というカンファレンスにて発表したもの。

ペーパーもプレゼン資料も、そんなに時間をかけてつくったものじゃない印象をうけますが、彼女のメッセージをかいつまんで要約すると次のようなことではないだろうか。
ユーザの行動を分析するデータマイニングは物事を断片的に決め付けて、ステレオタイプを助長しがち。人種(race)は文脈や行動、社会の中で変容するものだという構築主義の考え方に則れば、アルゴリズムで人種を断定するのはレイシズム。しかもこれらのデータを元に知識処理をしてステレオタイプを元に増幅させたり、医療、犯罪などの重大な判断を下そうとするものなのだから、もっと注意が必要。よって、社会構築主義的な人種の概念を持つことで偏見をさける新たな方法が必要。

うん、そうだね。と思うがずいぶんさらりとした内容である。

ふたつめ。Fusion.net掲載
The deception that lurks in our data-driven world(データドリブンな世界に潜む欺瞞)

こっちのほうが読み応えがあります。というのも、the AtlanticやWiredの編集長してたAlexis C. Madrigalが書いた記事だから。内容はざっとこんな感じ。
毎日、儀式のように私はウソっぱちデータと向き合っている。体重計にのって、自分をデブだと思ったり痩せたと思ったり・・・でも何キロあるからデブなんていうことではないだろう。本当はいろいろな尺度のなかで体重を併せて考えた結果、太りすぎだという応えに行き着くのだから。体重という生のデータは変動するから僕はわざと自分に厳しくしたいときはランニング後汗を書いてすぐに体重計に乗るんじゃなくて、一服しておなかを満たしてから乗るんだ。そうすると、ああまだ重い、がんばって運動しなくちゃ、って自分に言い聞かせることができる。ウソも方便だ。

というナラティブの中に、データと付き合う上で考えるべき3、4つの逸話が詰まっています。かなり簡単に言い換えると次のようなこと。(もちろん私独自の解釈や言い換えが混ざってます)

・権威ある科学雑誌「サイエンス」が調査したところ、同誌で発表された実験結果のうち、もう一回やってみて同じ結果がでたのはたった36パーセントで、データを扱う立派なサイエンティストたちの間でさえゆがみが出てしまっている。その背景にあるのは統計的に有意なデータばかりを使って有意な結果をもたらすp値のハッキングやセレクションバイアスなどがある。 
・複雑な世の中を簡易に処理できるよう統計を用いていった結果、森が死んだ。複雑な自然のエコシステムを、長い視野で見ようとせず、文字通り木を見て森を見ない行動。 (この話を読んで私は、ドキュメンタリー「All Watched Over By Machines of Loving Grace  - The Use and Abuse of Vegetational Concepts」のことを想起した)
・トラッキングにより分析が可能なウェブ広告は正確だと思ったらおお間違い。ブルームバーグの調査によると、トラフィックのうち多くの割合を非人間であるボット(ソフトウェア)が締めていて、これらの偽トラフィックによって広告費がつりあがっている状態にあり、これが今のウェブを煽動しているから、ろくな内容のない切り貼りの記事をまとめたサイトが広告費で儲かったりしている。

科学者じゃなくて一般ユーザも否応なしにデータ漬けの日々を送らなければいけない今、データとの付き合い方、向き合い方について誰もが考えなければいけない(AND 考えてもわりとやりようが無い)ようになっているのをよくあらわした読み物だったので取り上げてみました。