データジャーナリズム入門
津田マガ記事
(※この記事は2013年12月28日に配信されたメルマガの「世界のデータジャーナリズム最前線」から抜粋したものです)
データの集まりに視点を与えることで、それまで明らかになっていなかった事実を浮かび上がらせる――それが「データジャーナリズム」と呼ばれるジャーナリズムの手法です。このコーナーでは、主に海外のニュースサイトで紹介されている事例をネオローグのエンジニア・マサヒコがピックアップし、紹介しています。従来よりも「データ原理主義」的要素が色濃い新たなジャーナリズムは、「メディアの現場」をどう変えるのか。2、3年先のメディアビジネスを考えるうえでも必読です。
◆データジャーナリズム入門
12月14日に行われた「Webインテリジェンスとインタラクション研究会」[1] にご招待いただき、特別講演としてデータジャーナリズムの事例をご紹介しました。今回はいつもとは趣向を変えて、講演でお話しした内容のダイジェストをお届けします。
この連載を開始当初から読んでくださっている方にとっては復習のような内容になってしまいますが、連載もスタートから1年を過ぎて、途中から読み始めた方も増えているかと思います。このタイミングで「データジャーナリズムってなに?」という基本に立ち返ってみましょう。
講演で使用したスライドは、以下のURLからダウンロードしていただけます。ぜひあわせてお読みください。
http://www.slideshare.net/tsudamag/vol105-ddj
◇データジャーナリズムとは?
「データジャーナリズム」という言葉を耳にしたことがある人は、どの程度いるでしょうか? データジャーナリズムは「データで実現するジャーナリズム」「グラフィックを使用したプレゼンテーション」「インタラクティブ性」をもったジャーナリズムの手法と言われていますが、実は明確な定義はありません。
そこで、データジャーナリズムに関するふたつの事例をご紹介しながら、ヒントを探してみたいと思います。
ひとつ目は『The Data Journalism Handbook』[2] という書籍です。この本は、データジャーナリズムを実践するジャーナリストたちによって、2011年のMozilla Festivalというイベントのワークショップの中で執筆されました。O’reillyから書籍として出版されているほか、ウェブ上で無料の電子版 [3] を読むこともできます。
本書にはデータジャーナリズムの事例集に加えて、データの収集方法、分析手法、そしてその結果をどうやってプレゼンテーションするのかが書かれています。つまり、このハンドブックではデータジャーナリズムを「データを集めて、分析し、プレゼンテーションを行うもの」と定義しているということですね。
さて、もう一つご紹介するのは『The Data Journalism Handbook』の執筆者も審査員として参加する「Data Journalism Awards」[4] です。これは年に一度、世界中からの応募で集まったデータジャーナリズムの事例を審査し、優秀なものを選ぶアワード。まだ今年で2年目ですが、データジャーナリズムが話題になって多くの人の目に触れること、そしてデータジャーナリズムに関わる人々が互いに切磋琢磨することを目的としています。
このアワードは、データを使ったニュース記事やアプリケーション、ウェブサイトを対象にしていますが、大きな特徴は社会問題を重視しているということです。今年の受賞作品と受賞の理由を見ても、アルゼンチンのデータジャーナリズムの記事が国会議員の不正を暴いたり、英ウェールズで制作された記事が、家庭内暴力などを理由に保護された児童の扱いに変革をもたらすなど、「社会に変革を与えた」ことを評価していました。データジャーナリズムには「データを使って社会の問題を扱うもの」という側面もあるということです。
◇事例紹介
それでは次に、データジャーナリズムを理解するために3つの事例をご紹介しましょう。
01:How riot rumours spread on Twitter
http://www.guardian.co.uk/uk/interactive/2011/dec/07/london-riots-twitter
ひとつ目は、The Guardianによる「ロンドン暴動でツイッターに広まった噂の拡散」の調査。2011年のロンドン暴動の際に、ツイッター上で広まった噂を検証したものです。この調査では、「ロンドン動物園の檻が壊され、動物が市内に逃げ出した」などいくつかの噂が広まったとし、それぞれの噂についてのツイートを人力で収集・分類。そうして得られた結果をウェブ上でインタラクティブに表現することで、噂がどのように拡散し、収束していくのかを時系列で可視化してみせました。ビジュアルの美しさも見事です。
02:At the NationalConventions, the Words They Used
http://www.nytimes.com/interactive/2012/09/06/us/politics/convention-word-counts.html
ふたつ目は、New York Timesが2012年の米大統領選直前に公開した「党大会 彼らの言葉」です。これは、選挙の直前に行われた民主党と共和党の党大会でのスピーチの内容を分類したもの。党大会とは、それぞれの党が大統領選挙の指名候補者を選出するための大会で、全国から集った党員を前にセレブを含むさまざまな登壇者が「なぜその人が選ばれるべきか」をスピーチします。New York Timesは全スピーチの文字起こしを分析して、「よく使われる単語」が何回言及されたのかをカウント。たとえば「Jobs(雇用)」「Health(健康)」「Business(経済)」といった単語を、言及回数の多さがわかるバブルチャートで可視化しています。面白いのは、チャート上の単語をクリックすると、画面の下にその単語を含む発言がずらりと表示され、実際にどういう文脈で使われてたのかがわかるようになっているところ。このあたりは「ポリタス」[5] でも参考にさせてもらいました。
03:512 Paths to the White House
http://www.nytimes.com/interactive/2012/11/02/us/politics/paths-to-the-white-house.html
3つ目は、こちらもNew York Timesが2012年の米大統領選前に公開した「ホワイトハウスへの512の道」という記事です。米国の大統領選挙は、それぞれの州ごとに勝敗を決めてトータルで決着をつけるのですが、全米には民主党と共和党どちらを支持しているのかがほぼ決定的で事前に結果がわかっている州と、流動的でどちらに傾くかわからない州――「Swing States」があります。このNew York Timesの記事では「オハイオ州でオバマ氏が勝利した場合」「イリノイ州でロムニー氏が勝利した場合」など、それぞれの候補がもつ勝利のパターンを勝敗チャートを使って教えてくれます。Swing Statesの投票結果次第で勝敗が決まるという選挙の仕組みをわかりやすくビジュアライゼーションした秀逸な記事だと思います。ちなみにこのときの大統領選、選挙のアナリストなどの下馬評では、僅差あるいは終盤はロムニー氏がリードという声もあったのですが、この記事ではオバマ氏が有利だったことを事前に示していました。New York Timesといえば、同サイトでブログを執筆していたNate Silver氏 [6] が、オリジナルの数理モデルを使って全州での勝敗予測を的中させたことでも話題になりましたね [7] 。
◇データジャーナリズムの手法
ここからは、データジャーナリズムの事例を分類して紹介しつつ、代表的な手法についてお話しさせていただきます。
■グラフ化
データをグラフにしてわかりやすく表現することで、より多くの人が理解できるようになるだけでなく、見た目のキャッチーさで感心を呼び起こすこともできます。代表的な例として、ピッチ・インタラクティブが今年公開した「パキスタンでの無人兵器による攻撃の実態」の記事 [8] や、ProPublicaがThe Washington Postと共同で発表した「銃規制への議員の投票行動」の記事 [9] 、そしてThe Guardianの「米国の州ごとのゲイの権利の実現状況」の記事 [10] などがあります。
■マッピング
なんらかのデータの地域ごとの差異を表現するには、地図へマッピングするのが良いでしょう。Google社がデータと地図の関連づけをサポートするツールを公開していることもあって、この手法は非常に良く使われています。たとえば、今年ロシアに隕石が落下した事が話題になりましたが、その際にThe Guardianが公開した「隕石はどれだけ地球に落下しているのか?」[11] 、New York Timesによる「保険未加入の米国人がいる地域」の記事 [12] 、The Washington Postによる「バージニア州知事選挙の結果」[13] などなど、数多くの事例があります。
■アンケート
ユーザーからのインプットを受け付けてそのままデータに反映できるウェブならではの取り組みとして、アンケートもよく使われる手法です。franceTVによる「フランスにおける男女間の給料格差」[14] の記事や、CNNがダボス会議にあわせて行った「ダボスムード地図」[15] 、カナダのThe Globe And Mailが公開した「トロント市長の追放についてどう思う?」[16] などがあります。
■調査報道
調査報道は古典的なジャーナリズムの手法で、ぼく自身はデータジャーナリズムを調査報道の一形態として考えています。では、データジャーナリズムと従来の調査報道はどう違うのか? というと、「仮説に対する裏付けのためのデータ収集」ではなく、「データの中から仮説やファクト、ストーリーを見つけ出す」のがデータジャーナリズムなのではないかと思います。調査報道色の濃いデータジャーナリズムの事例としては、The Wall Street Journalによる「忘れられた核の遺産」の記事 [17] 、アルゼンチンのLA NACIONによる「アルゼンチンの国会議員の支出」[18] の記事、Wales Onlineによる「ウェールズの保護児童の移送先の実態」[19] の記事などがあります。LA NACIONとWales Onlineの記事は、今年のData Journalism Awardsの受賞作に選ばれています。
◇データジャーナリズムの展望と課題
それでは最後に、データジャーナリズムの今後の展望と課題について触れてみたいと思います。まず、データジャーナリズムが注目されるようになった背景には、「記者の主観に基づかない客観的な報道への期待」があると思います。これは、従来型ジャーナリズムへの反発とも考えられますが、データを基にすることによって精度の高い分析ができるという側面があるのは事実でしょう。
データに基づく記事と一緒に使用したデータが公開されることで、記事の内容を再現できる、検証可能なジャーナリズムになります。実際には、データジャーナリズムのプロジェクトが高度であれば、データの中から結果を引き出す作業も専門的な知識が必要になりますので、誰にでも再現できるというわけではないでしょうが、少なくとも手間をかければ検証は可能なはず。それがジャーナリズムのあり方にポジティブな影響を与えると思います。
そして、未来の予測です。今日ご紹介したNate Silver氏による選挙結果の予測のほか、国内でもニコニコ動画が行った2013年の参議院選挙の結果予想が実績を残しています。また、ぼくがツイッターで見かけたコメントで、「一番有名なデータジャーナリズムは、天気予報じゃないか」というものがありました。たしかに、天気予報はデータジャーナリズムですね。しかも、多くの人々の生活や経済活動に貢献しています。災害予防も含めて、データによる自然現象や社会問題の予測には期待できるのではないでしょうか。
しかし、課題もあります。
米国に電気自動車のベンチャーとして有名なTESLA社という会社があるのですが、このTESLA社の新型モデルの性能をめぐって、New York Timesの間でバトルがありました。発端はNew York TimesがTESLA社の新型電気自動車であるモデルSをレビューした記事 [20] 。New York Timesは、ドライブテストの途中に電池が切れて立ち往生したなどとして、モデルSの電池の性能が十分でないという、かなり厳しい内容の記事を掲載しました。これにTESLA社がブログで反論 [21] 。同社は、レビューに使われた車のドライブレコードを調べた結果、この車の充電が十分でなかったり、充電ステーションの手前で何度も行ったり来たりする不自然な走行をしていたなどの根拠を示しながらNew York Timesの記事が誤っていると主張しました。しかし、New York Timeはさらに「TESLA社のデータが語るもの、語らないもの」という記事 [22] を書いて、不自然な走行と言われたものは、暗闇の中で充電ステーションを探すのにウロウロせざるを得なかっただけだ、と反論。結局この件は、別のNew York Timesの記者が「手書きのメモを基にした記事は、車に残されたデータには適わない」[23] と暗に誤りを認めて収束を図る結果となりました。
このケースからわかるのは、データを基に構成した記事であってもそのデータの正確さが担保されなければ意味がない――データジャーナリズムには検証の必要があるということ。そして、同じデータを使っても、人によって記事の内容が変わりうるという解釈の課題があることです。データジャーナリズムであれば信頼できるという単純な話ではないわけですね。
さて、実例や手法を見ていただきながら、データジャーナリズムとはなにか? ということを考えてみました。これを機に、データジャーナリズム興味をもつ人が増えて、一緒にデータジャーナリズムを盛り上げていくことができればと期待しています。本日はありがとうございました。
■おまけ:今週のリンク
このコーナーを書くために、毎週できるだけ多くのデータジャーナリズム事例をチェックし、そのなかから厳選したものをご紹介するようにしています。掲載は見送ったものの面白い事例も少なくないので、簡単なリンク集をつけてみることにしました。興味のある方はぜひ目を通してください。いわゆるインフォグラフィックなど、データジャーナリズムではない事例も含みます。
・Global Forest Change
http://earthenginepartners.appspot.com/science-2013-global-forest
2000年から2012年の世界中の森林の変化を細部まで見ることができます。
・Prevalence of Diabetes in the World, 2013
http://healthintelligence.drupalgardens.com/content/prevalence-diabetes-world-2013
世界各国の糖尿病人口率を表した地図。
・Southern California’s housing recovery
南ロサンゼルスの住宅の復旧を表したインタラクティブな地図。
・Migration between prefectures of Japan in 2012
http://russiansphinx.blogspot.jp/2013/11/migration-between-prefectures-of-japan.html
日本の都道府県同士での人の移動を表しています。
・How Partisan Are Your Representatives?
http://beehivemedia.com/dataviz/partisanship/
米国各州の代表議員の党派心を表したインタラクティブグラフ、地域、性別、年代などを指定して見ることができます。
・London’s renting crisis
http://www.ft.com/cms/s/2/ad4ef6a4-503d-11e3-befe-00144feabdc0.html#axzz2lgzv1Rzb
ロンドンの賃貸の価格を表したインタラクティブな地図。
・Corruption Perceptions Index 2013
http://visual.ly/corruption-perceptions-index-2013?view=true
世界各国の政治の腐敗度をランキングにして表したインタラクティブな地図。
・Interactive population pyramid for New Zealand
http://www.stats.govt.nz/tools_and_services/interactive-pop-pyramid.aspx
ニュージーランドの人口の変化を時間を追ってみることのできるインタラクティブなグラフ。
・When income grows, who gains?
http://www.stateofworkingamerica.org/who-gains/
米国の平均所得の変化を表しています。
・Avian flu visualization
http://www.visualizing.org/visualizations/avian-flu-visualization
中国のインフルエンザ患者数を表したリアルタイムインタラクティブ地図。
・Are global CO2 emissions still rising?
http://www.visualizing.org/full-screen/204983
世界のCO2排出量をさまざまな視点から見ることができます。
・Nuclear Explosions since 1945
http://www.tableausoftware.com/public/gallery/nuclear-explosions
1945年以降に行われた核実験を国ごと、年ごとに表示したインタラクティブな地図。
・Map Your Political Representatives
http://mapyourreps.appspot.com/
住所を入力すると、その地域の政治的代表者を検索できるマップ。
・NYC Crime Map
ニューヨークの犯罪発生地域を表した犯罪マップ。
・Watch The World Grow Older, In 4 GIFs
http://www.npr.org/blogs/money/2013/12/09/247385046/the-global-population-boom-and-bust-in-4-gifs
日本、米国、ナイジェリアの人口構成の推移を表したグラフ。
・Medical costs are ridiculous, but procedures can be way cheaper down the street
http://www.bestmedicareprice.com/
疾患ごとにより安い医療費の病院を探すことのできるインタラクティブ地図。
・PriceMaps
http://pricemaps.betterdoctor.com/#/search/atherosclerosis-without-mcc
US Newsによる病院のランクと医療費を疾患ごとにまとめたインタラクティブ地図。
・How Much Hospitals Charge For the Same Procedures
http://www.nytimes.com/interactive/2013/05/08/business/how-much-hospitals-charge.html
病院がメディケアに請求した金額と実際に支払われた金額を表しています。
・Best Hospitals
http://www.nerdwallet.com/health/
住んでいる地域と病状から、最適な病院を表示するインタラクティブ地図。
・Mapping US Medical Prices
http://googlemapsmania.blogspot.jp/2013/12/mapping-us-medical-prices.html
上記4つのサイトをまとめて紹介しています。
- [1]
- http://www.sigwi2.org/next-sig
- [2]
- http://www.amazon.co.jp/exec/obidos/ASIN/1449330061/tsudamag-22
- [3]
- http://datajournalismhandbook.org/1.0/en/
- [4]
- http://www.globaleditorsnetwork.org/dja/
- [5]
- http://politas.jp/
- [6]
- http://www.fivethirtyeight.com/
- [7]
- http://wired.jp/2012/11/13/nate-silver-facts-election/
- [8]
- http://drones.pitchinteractive.com/
- [9]
- http://projects.propublica.org/guns/#bill1
- [10]
- http://www.theguardian.com/world/interactive/2012/may/08/gay-rights-united-states
- [11]
- http://www.theguardian.com/news/datablog/interactive/2013/feb/15/meteorite-fall-map
- [12]
- http://www.nytimes.com/interactive/2013/10/02/us/uninsured-americans-map.html?_r=0
- [13]
- http://www.washingtonpost.com/wp-srv/special/local/2013-elections/demographics/
- [14]
- http://appli-parite.nouvelles-ecritures.francetv.fr/
- [15]
- http://edition.cnn.com/SPECIALS/2013/davos/mood-map
- [16]
- http://www.theglobeandmail.com/news/toronto/react-whats-your-take-on-toronto-mayor-rob-fords-ouster/article5665207/
- [17]
- http://projects.wsj.com/waste-lands/
- [18]
- http://blogs.lanacion.com.ar/ddj/data-driven-investigative-journalism/argentina-senate-expenses/
- [19]
- http://www.walesonline.co.uk/news/wales-news/concerns-raised-over-welsh-children-2026375
- [20]
- http://www.nytimes.com/2013/02/10/automobiles/stalled-on-the-ev-highway.html
- [21]
- http://www.teslamotors.com/blog/most-peculiar-test-drive
- [22]
- http://wheels.blogs.nytimes.com/2013/02/14/that-tesla-data-what-it-says-and-what-it-doesnt/
- [23]
- http://publiceditor.blogs.nytimes.com/2013/02/18/problems-with-precision-and-judgment-but-not-integrity-in-tesla-test/
最終更新: 2014年1月17日