LASDECが、自治体の情報発信をPDFやOffice形式ではなく、HTMLやCSVで行うよう呼びかけている。
自治体の情報発信、PDF/ExcelよりHTML/CSVで 地方自治情報センターが呼びかけ – ITmedia News
これは非常に良い方針だ。PDFやOfficeはPCでは作業しやすいが、複数ファイル間の集計や分析などでは、とてもじゃないが使えない。しかし、CSVなら規則的にカンマで区切られているだけなので、ルールさえわかれば、システムで自動収集などが可能になる。
例えば、各自治体で人口統計などを定期的に公表しているが、このフォーマットや項目などはバラバラであり、大抵はExcel形式である。複数の自治体の人口統計を分析しようと思うと、ある年度のファイルをダウンロードして、ファイル開いて、データ項目をそろえて、みたいなことを必要な分だけ繰り返す。そして、違う自治体でも同じことをやろうと思うと、データ項目が違う・・・・。
CSVなら、各自治体でもしルールが違っても、まず機械が自動で読み込むことが可能になる。そして、ルールに従ってデータをそろえ、分析することも可能になるだろう。
図書館情報学では、「機械可読目録(MARC)」というものがある。書誌情報や関連情報を機械で読める形式で表現し通信するための規格だ。
こういうコンピュータ同士で通信し、コンピュータで処理されることを前提とすることで、情報は飛躍的に流通する。各ソーシャルサービスがAPIを提供しているのも同じ原理だ。そういう意味で、行政機関ももっと情報流通されることを前提とした提供をして欲しい。
アメリカなどはオープンガバメント政策で、行政情報をXML・CSV・XLSなど二次加工しやすいような情報提供が行われているのだし、日本でももっと推進することはできるはずだ。