東京都議会議員選挙の党派マニフェストを自動分類したよ

これはなに?

2009年7月12日投開票の東京都議会議員選挙において、主要6党(自民党民主党公明党共産党幸福実現党生活者ネットワーク)の会派マニフェストに書いてある内容を品田方式と呼ばれる選挙研究で使う分類カテゴリに従い、分類したものです。
各党のマニフェストで、政策カテゴリ別に言及割合を出すことにより、どの政策に、政党がどれだけ興味があるかを割り出して、政党の政策位置を推定できるということが期待出来ます。
分類作業は、stiqが研究している自然言語処理機械学習*1の方法を用いて自動分類コーディングシステムを構築し、それを使っています。
自動分類コーディングシステムを構築することによって、人手による分類によって数ヶ月掛かっていた作業が、1日で終わり、公示日ごろに発表されるマニフェストをすぐに分類処理して、投票日までに分類データを作ることが出来ます。
次期衆院選についても、同様の分類を行う予定です。

学術論文

具体的に、このシステムについては、これらの論文に仕組みが書かれています。
出典:日本版ボートマッチ ワーキング・グループより

  • 「政党や政治家の政策的な立場を 推定する―コンピュータによる自動コーディングの試み―」 上神貴佳・佐藤哲也.2009(掲載予定).『選挙研究』25巻1号.
  • 「投票支援のためのインターネット・ツール―日本 版ボートマッチの作成プロセスについて―」 上神貴佳・堤 英敬.2008.『選挙学会紀要』10号,27‐48頁.
  • 「投票支援ツールと『政策中心の選挙』の実現―オランダの 実践と日本における展望―」 上神貴佳.2006.『選挙学会紀要』6号,43‐64頁.

また、この分類に用いている分類カテゴリについての論文は、

  • 「選挙公約政策データについて」 品田裕. 2006. 『日本政治研究3(2)』, 63-91頁.

に基づいています。

おことわり

今日公開するデータは、東京都議選に合わせて、システムのテスト運用をこめて分類した結果であり、それの速報版です。
細かいところまでのデータの検証はできていませんので、ご了承ください。
研究目的でご利用の場合やマニフェスト分類について、詳しく知りたい方はお知らせください。
mail : stiq2e atmark gmail.com
または、http://tai.ia.inf.shizuoka.ac.jp/にある連絡先へ

各党政策言及割合

政策対象

政党が誰に向けた政策なのかを分類したものです。


政策分野(大分類)

政党がどのような政策をマニフェストに書いているのかを、大きな分野別にまとめたのものです。


政策内容(小分類)

政策分野(大分類)をさらに細かいカテゴリで分けたもの
こんな感じのデータです。

くわしくは、ダウンロード先にある資料をご覧下さい。

言及数と候補者数

都議選における各政党のマニフェストの分量と候補者数

自民党マニフェストの分量が突出して多いです。

上記結果のダウンロード

http://stiq.info/labs/tokyo_manifesto2009_3rd_edtion.zip
繰り返しになりますが、このデータを研究目的で使いたい場合は、必ず上記連絡先へお知らせください。

追記 (7月11日土曜日21時40分)

この記事を紹介していただきました。そのトラックバック先より、

私はグラフよりも[カラースケール]機能のほうが、より見やすいと感じました。
投票支援ツール−東京都議会議員選挙の党派マニフェストの政策分類結果 - インストラクターのネタ帳

とありましたので、参考にさせていただきました。言及割合が高いものに色をつけました。
また、他にも候補者数のデータもあると良いという助言いただいたので、調査して、参考の為に数値を載せました。
ダウンロード先のデータも入れ替えました。
よろしくお願いします。

*1:自然言語処理に、GoSenとY!形態素解析API機械学習のwekaライブラリ