データスコア解説
目次
- 1. データスコア開発の背景
- 2. データスコアの概要
- 3. データスコアの構成
- 4. データスコアのウエイト算定方法
- 5. データスコアの計算方法
- 6. 参考資料
1. データスコア開発の背景
リサーチに携わる者にとって、「適切な」データを収集することは基礎的な作業であるとともに、リサーチの質、ひいてはそのリサーチに基づいた意思決定に最も影響を及ぼす重要な作業といえます。しかし、現在、多くのマーケターやリサーチャーにとって「適切な」データを収集することは、容易なことではありません。
なぜなら、インターネットの普及とともに、だれもが容易に様々なデータにアクセスし入手できるようになった反面、インターネット上には、調査方法などの開示がないまま、結果の数字が一人歩きしているデータが多くあるからです。
こうした現状を踏まえ、データが正しいプロセスで調査されたものなのか、また調査手法に関する情報が開示されているのかといった、データの「適切さ」、言い換えればデータの「品質」を判断する指標を提供することで、リサーチャーやマーケターが「適切な」データを選択する一助としたいという思いからデータスコアを開発しました。
2. データスコアの概要
データスコアでは、統計および調査の「品質」を評価しています。
そして、「品質」を評価する際、以下の6つの要素から評価しています。
● 妥当性
ユーザーのニーズを満たす統計・調査であるか
● 正確性
統計・調査が社会経済の実態を正しく表しているか
● 即時性(適時性)
統計・調査がユーザーのニーズや目的に応じて適切な時に提供されているか
● 信頼性
統計・調査を作成または公表している機関が、専門的な見解を踏まえた作成方法を採用している機関であるか、秘密保持において適切な措置を講じているか、ユーザーの疑問に対して情報を提供しているか、また統計・調査が官民・内外の観点から特に重要な統計かなど、ユーザーからの信頼を得うる要素を兼ね備えているか※1
● アクセス性
統計・調査が、ユーザーが容易に入手し利用できるように提供されているか
● 比較可能性・一貫性
統計・調査が関連する他の統計と比較して分析を行うことが可能となるよう分類や調査方法の整合が図られているか
※1 このほか、統計・調査にかかる費用と便益の観点から品質を評価する「効率性」という要素も考えられる。しかし、報告者負担や調査機関の費用を明らかにすることは難しいため、現時点ではデータスコアの要素に含めていない。
3. データスコアの構成
データスコアでは、前述2の6つの要素の「大分類」とし、下記のような分類で構成されています(カッコ内は数)。
「総平均」-「大分類」(6)-「中分類」(20)-「小分類」(21)
-「細分類」(26)-「調査項目」(35)
以下では、「大分類」ごとに内容を解説していきます2。
● 大分類「妥当性」
大分類「妥当性」は中分類「調査の目的」「結果の概要」から構成されます。小分類・細分類・調査項目については、中分類と同様の分類となっています。解説は以下のとおり。
● 「調査の目的」
小分類・細分類・調査項目「調査の目的」:調査を実施した目的について記載があるか
● 「結果の概要」
小分類・細分類・調査項目「調査の概要」:調査結果の概要について記載があるか
● 大分類「正確性」
大分類「正確性」は6つの中分類「調査対象」「標本設計」「調査時期」「調査方法」「調査事項・調査票」「回答・集計情報」から構成されます。以下では、中分類ごとに解説していきます。
● 「調査対象」
小分類・細分類「調査対象」-調査項目「調査対象・カバレッジの記載」 :「だれ」「なに」を対象に調査を実施したか、母集団のどの程度を調査対象としているか
● 「標本設計」
小分類「全数・標本調査」-細分類・調査項目「全数調査」「標本調査・サンプルサイズ」「標本調査・抽出方法」各調査項目の解説は以下のとおり。
「全数調査」:全数調査であるか、標本調査であるか※3。
「標本調査・サンプルサイズ」:標本調査の場合、サンプルサイズはどのくらいか
「標本調査・抽出方法」:標本調査の場合、調査対象をどのように選定しているか(母集団からどのように標本を抽出しているか)。
● 「調査時期」
小分類・細分類・調査項目「調査時期」:調査を実施した時期について記載があるか。
● 「調査方法」
小分類・細分類・調査項目「調査方法」:どのように調査したか調査手法を記載しているか※4
● 「調査事項・調査票」
小分類・細分類・調査項目「調査事項・調査票」:調査した内容について記載があるか。
● 「回答・集計情報」
小分類「回答に関する情報」「集計・推計に関する情報」から構成されます。
小分類「回答に関する情報」は細分類・調査項目「回答に関する情報」「有効回答数・回収率」「欠損値・無回答の扱い」「回答(択一・複数選択)方法の明記」から構成されます。
各調査項目の解説は以下のとおり。
「回答に関する情報」:有意抽出による調査かつアンケート調査でない場合かどうか※5。
「有効回答数・回収率」
:調査への回答を依頼した調査対象数のうち、実際に回答を集めることができた回答数の割合(回収率)はどのくらいか、また回収できた回答から、集計に不適正な無効回答を除いた割合(有効回答数)はどのくらいか
「欠損値・無回答の扱い」
:調査によって得た回答が集計には使うことができないようなデータであった場合や無回答の場合の扱いをどうしているか。
「回答(択一・複数選択)方法の明記」
:調査対象者が調査事項についてどのように回答したか回答方法について記載があるか。
小分類「集計・推計に関する情報」は細分類「集計・推計方法」「検定・誤差の表示」から構成されます。細分類「集計・推計方法」の調査項目は細分類と同じ、細分類「検定・誤差の表示」については、調査項目「全数調査」「検定・誤差の表示」から構成されます。
各調査項目については以下のとおり。
「全数調査」:全数調査かどうか※6。
「検定・誤差の表示」:調査結果について統計的な検定を実施したり、推計の場合は誤差を表記しているか。
● 大分類「即時性(適時性)」
大分類「即時性(適時性)」は中分類「公表頻度」「公表時期」「最新データ格納時期」から構成されます。中分類「公表頻度」「最新データ格納時期」では、小分類・細分類は中分類と同様の分類となっています。中分類「公表頻度」は、小分類・細分類は「調査と公表時期の差」からなっています。各中分類における調査項目については以下のとおりです。
● 「公表頻度」
小分類・細分類「公表頻度」調査項目「スポット調査」「不定期調査」「定期調査」:調査結果の公表頻度について記載があるか
● 「公表時期」
小分類・細分類・調査項目「調査と公表時期の差」:調査実施時期と公表時期にどのくらいの差があるか。
● 「最新データ格納時期」
小分類・細分類・調査項目「最新データ格納時期」
:調査の最新データは現時点からどのくらい経過しているか(調査実施時期から現時点の経過年数はどのくらいか)。
● 大分類「信頼性」
大分類「信頼性」は3つの中分類「調査主体」「統計の種類」「調査に関する情報提供」から構成されます。小分類、細分類は中分類と同様の分類となります。
以下では、中分類ごとに解説していきます。
● 「調査主体」
小分類・細分類「調査主体」
調査項目「調査主体明記なし」「組織別」:調査主体について記載があるか
また、調査主体については「公的機関」「民間機関」に大別し、「民間機関」についてはさらに「民間調査機関・研究所」と「その他民間」に分類した上で「調査経験」と「民間・個人情報保護」(個人情報に関する取扱い※7)によって評価。
● 「統計の種類」
小分類・細分類「統計の種類」
調査項目「公的統計」「その他の統計」:調査が国の統計法上どのような種類に属するか。
● 「調査に関する情報提供」
小分類・細分類「調査に関する情報提供」調査項目「Q&A・解説」:Q&Aや解説を提供しているか
● 大分類「アクセス性」
大分類「アクセス性」は3つの中分類「公表形式」「アクセス費用」「問い合わせ先情報」から構成されます。小分類、細分類は中分類と同様の分類となります。
以下では、中分類ごとに解説していきます。
● 「公表形式」
小分類・細分類・調査項目「公表形式」:調査結果についてどのような形式で公表しているか※8
● 「アクセス費用」
小分類・細分類・調査項目「アクセス費用」:調査結果の閲覧に際し、費用がかかるか
● 「問い合わせ先情報」
小分類・細分類・調査項目「問い合わせ先情報」:調査に関する問い合わせ先情報※9が提示されているか
● 大分類「比較可能性・一貫性」
大分類「比較可能性・一貫性」は2つの中分類「分類方法」「時系列データ」から構成されます。以下では、中分類ごとに解説していきます。
● 「分類方法」
小分類・細分類・調査項目「分類方法」
:他統計や他調査結果と比較可能となるよう属性※10や名称の表示があるか
● 「時系列データ※11」
小分類「時系列データ」細分類「調査対象の構成(属性)の変化」「調査方法の変化」調査項目は細分類と同様の分類。調査項目については以下のとおり。
「調査対象の構成(属性)の変化」
:時系列データが提供されている場合、時系列データ提供期間において調査対象構成の変化があるかについて言及されているか。
「調査方法の変化」
:時系列データが提供されている場合、時系列データ提供期間において調査方法の変化があるかについて言及されているか。
※2 以下3.データスコアの構成では、統計と調査を含め、調査と記載。
※3 全数調査の場合は標本設計に関する項目(サンプル数、抽出法、抽出データ元表示)に対する評価は不要のため、確認項目としている。
※4 複数の調査方法を使用している場合は、ウエイトが高い調査方法で評価。
※5 調査主体が調査対象を独自に(有意抽出により)選出しランキングや合計値などを公表している場合は、有効回答率・回収率、欠損値・無回答の扱い、回答方法の明記が不要のため、確認項目としている。小分類「回答に関する情報」のウエイトは大分類「正確性」の他項目へ割り振られることとなる。
※6 全数調査の場合は調査結果について統計的な検定を実施したり推計誤差の表記が不要のため確認項目としている。
※7 プライバシーマーク、日本工業規格 「JIS Q 15001 個人情報保護マネジメントシステム 」ISO27701「個人情報の保護に関する法律」に定める個人情報取扱事業者を取得しているかで評価。
※8 有料を含め公表されている形式で評価。
※9 問い合わせ先情報とは、調査主体・調査担当部署・調査担当者・電話番号・メールアドレスなど。
※10 属性とは、年齢、性別、居住地、家族構成、職業、収入など、調査対象者の特性データのことを、名称とは属性以外の分類区分(産業分類など)を表す。
※11 時系列データとは公表頻度でスポット調査以外のものが該当。
4. データスコアのウエイト算定方法
データスコアの総ウエイトは10.000です。各項目の計算方法は、次のとおりです。
a. 総ウエイト10.000を「細分類」」の項目数で除し「細分類」の各ウエイトを算出(均等ウエイト)。
b. 「細分類」の上位分類である「大分類」「中分類」「小分類」のウエイトは下位分類のウエイトを合計して算出。
c. 「細分類」の下位分類である「調査項目」のウエイトについては、選択肢の数に応じてウエイトを付与。選択肢の数が複数ある場合は、原則、最も望ましい選択肢に「細分類」のウエイトを付与し、最も望ましくない選択肢にはウエイトを付与せず、残りの選択肢は、望ましさの順に等分位でウエイトを付与している。
5. データスコアの計算方法
まず、調査項目の選択肢のうち、該当するものを1つ選択し、該当する調査項目のウエイトの積み上げによって、ウエイト総和を算出する。この場合、すべての調査項目において、望ましい選択肢に該当した場合、ウエイト総和は、総ウエイト10.000となる。
次に、ウエイト総和を2で除することによって、5段階評価に変換している。