データクレンジングの必要性と対策

今回は、名寄せやデータクレンジングに苦しむB2B企業向けに、海外の情報も取り入れながら、なぜデータクレンジングが必要なのか、また今できる対策は何かについて、当社の見解をお話しいたします。

本題に入る前に、マーケターの皆さんは、リードの健康状態を把握できていますでしょうか?

そもそも「リードの質の定義さえできていないので健康状態がわからない」という企業が多いかもしれません。リードの健康状態を把握していないと、例えば、セグメントやターゲティングが正しく行えなかったり、評価やレポートの信憑性を損ねたり、営業にリードを渡しても動いてくれなかったり、ROIを引き下げる要因となるなど、大きな問題に繋がる可能性があります。

リードの質の定義は、業種や部門などその情報を使う目的に応じ異なります。目的に応じGoodまたはBad Leadの定義を行い、該当するリードが現在どれほど存在しているのか、またその創出元はどこなのかを把握しておく必要があります。マーケターは、まずこのベースがあって日々の活動に取り組むことで、マーケティング活動を最適化できるようになります。

早い段階で対策を打て!

皆さんは、「1-10-100 ルール」をご存知でしょうか?これは一般的に、品質ロスコストを表すルールで、例えば、製造業の品質管理において、設計時にミスを発見し修正するコストを1とした場合、検証でミスを発見し修正するコストが10、市場に出てから修正するコストが100かかるという法則です。

米SiriusDecisions社は、”The Impact of Bad Data on Demand Creation”の中でこのルールを用い以下のように述べています。

“The longer incorrect records remain in the database, the more expensive it becomes to deal with them. In data management circles, this point is illustrated by the 1-10-100 rule: It takes $1 to verify a record as it is entered, $10 to cleanse and de-dupe it and $100 if nothing is done, as the ramifications of the mistakes are felt over and over again.”
Reference:SiriusDecisions The Impact of Bad Data on Demand Creation

長期間、データベースに不正確なレコードが残っていると、その対処コストは、早い段階で対処するよりも高額になります。データマネジメントサークルでは、これを「1-10-100ルール」で示し、データの入力段階での確認に$1、登録後にクレンジングや重複排除するのに$10、何も対処しなければ間違いは波及し繰り返されることでロスコストは$100かかります。(意訳:B-Story, Inc.)

つまり、データの質の管理を早い段階で行わないと、時間の経過とともに対処コストが高くなるという事です。しかしながら、多くの企業は、データの入口を整備できていないため、社内のデータは日々ロスコストを積み上げているのです。

では、実際の業務で考えてみましょう。例えば、イベントを開催する場合、外部メディアからリードを集め、自社サイトのフォームからリードを集め、イベント会場でバーコードスキャンからリードを集めた場合、それぞれのデータの質は統一できていますでしょうか?

これらのデータの入口となる場面で、データの項目や形式(正規化)を整備しておかないと、名寄せやデータクレンジング、投入するDBに形式を合わせるなど、時間とコストがかかり、直ぐにマーケティングや営業活動に移れなくなります。お客様へのアプローチが遅れることは致命的で、更にここでかかる時間とコストは、マーケティング予算から捻出する場合、確実にROIを引き下げる要因の一つとなります。

米Informatica社のレポートでは、
A clear majority of marketing decision-makers (62%) point to improving the quality of marketing data as a most important objective of a successful marketing data strategy.
Reference:Informatica, Leadership Benchmark Report on Marketing Data Quality Trends, 2017.

マーケティングの決裁者の62%が、マーケティングデータ戦略の成功にとってマーケティングデータの質を改善することが最重要事項であると指摘している。(意訳:B-Story, Inc.)

データ品質と収益の関係性
In fact, only 53.6% of organizations with low confidence in MA and CRM data quality report hitting revenue goals, while 78.6% of companies with higher confidence in their data quality report meeting revenue goals.
Reference:Integrate, Inc.

マーケティングオートメーション(以下MAという)とCRMのデータの質において、信頼性が低い企業の53.6%だけが収益目標を達成していると報告し、信頼度が高い企業の78.6%が収益目標を達成していると報告している。(意訳:B-Story, Inc.)

このレポートから、米国において信頼性の高いデータは、信頼性の低いデータと比べ25%以上の成果をもたらす可能性がうかがえます。

データの質とマーケティング効果
Only 43.2% of organizations with low confidence in MA and CRM data quality report being effective at marketing performance measurement, while 75% of companies with higher confidence in their data quality report their marketing is effective.
Reference:Bizable, Heinz, Uberflip, Radius, LinkedIn; State of Pipeline Marketing Report, 2017.

MAやCRMのデータの質の信頼性が低い組織の43.2%は効果的と回答し、データの質の信頼性が高い組織の75%はマーケティングが効果的と回答している。(意訳:B-Story, Inc.)

つまり、MAやCRMのデータの質が低いとマーケティングの効果に繋がり難いことが分かります。

デジタルマーケティングが進んでいる米国でも、2017年のレポートでこのようにデータの質について述べています。日本もデジタルマーケティングが浸透するにつれ、データの質に対する問題意識を抱く企業は増えてはいますが、対応方針が見えぬまま外部ベンダーに依頼して時間とお金で解決したり、何もできずに日々ロスコストを積み上げる状況に陥っている可能性があります。

このように、日々の活動からBad Leadは増え続け、データクレンジングや重複排除にコストを費やすことで、マーケティング部門が持つ予算を食い潰すしROIを下げていくのです。また、いくらお金をかけても、マーケティング部門が必要とするデータ項目と質を定義していなければ、リードを営業に渡しても、営業側で情報を精査するのに余計な時間をかけさせたり、使えない情報が多いとわかると部門間の関係が悪くなったりしかねません。このような悪循環でビジネスを継続していくことは、無数の穴が開いた水路に水を送り続けているのと同じことです。

ビジネスを圧迫するBad Lead

Between 10% and 25% of b-to-b marketing database contacts contain critical errors.
Reference:SiriusDecisions:The Impact of Bad Data on Demand Creation

米SiriusDecisions社の調査レポートによると、平均的なB2B組織が保有する顧客と見込顧客レコードの10-25%は、不正確(致命的なエラー)である。(意訳:B-Story, Inc.)

And as Integrate analysis of B2B leads processed through the Integrate platform illustrates, 45% of leads injected into ungoverned databases don’t meet quality standards.
Reference:Integrate, Inc. The Cost of Bad Leads

プラットフォームで処理されたB2Bリードの分析では、非制御データベースに登録されたリードの45%が品質基準を満たしていませんでした。(意訳:B-Story, Inc.)

米INTEGRATE, Inc. は、(彼らのIntegrateプラットフォームを通しDemand Marketingを支援している会社です。)2016年9月1日から2017年8月31日までの間で、彼らが創出したB2Bリード364万件のデータを分析したところ、45%がBad Leadであったと同レポートで公表しています。(45%のうち、33%が重複リードであった)

更に、Justin Gray(LeadMD社のCEOかつMarketoの専門家)、によれば、
“We commonly use the 50% rule – i.e., 50% of your data is old or useless and data degrades at 22% YOY without some sort of augmentation.”

「一般的に50%ルール使用:つまりデータの50%が古いか役に立たず、手を打たないとデータの質は年々22%劣化していく。」と述べています。また彼は、この50%ルールをMAツールの年間コストに適用すると、それは最大50%が無駄になると述べています。例えば、年間500万かかっている場合、最大で250万が無駄なリードに費やされている。(意訳:B-Story, Inc.)Reference:Integrate, Inc. The Cost of Bad Leads

これは、MAの課金モデルが一般的にメールアドレスを取得したリード/プロスペクトリード(見込顧客)のボリュームで決まるため、MAに登録されたリードの質によっては最大50%がBad Leadとなるためです。これは、ツールの課金の仕組みの問題ではなく、正に「データの質の問題」です。

Bad Leadとは

では、Bad Leadとはいったい何でしょうか?

一般的なBad Leadの5つの特徴
  1. 不完全(Incomplete) :データ不足
  2. 不正確(Invalid) :間違い、無効なデータ
  3. 重複(Duplicates) :同一個人(連絡先)の重複データ
  4. 正規化(Normalization): データフィールドの規則
  5. 非準拠/違反(Non-compliant): 地域(国)の法律や規制に反するデータ
1. 不完全(Incomplete)

マーケティングにおいて、データ不足は、セグメンテーションやターゲティング、ナーチャリングにおいて、コンテンツの訴求や絞り込みを適切に行えない可能性があります。また、セールスにおいても最適なフォローアップができない可能性があります。

2. 不正確(Invalid)

間違いや無効と判断されたデータは、状況によってもう使えない可能性が高いです。特にメールアドレスや電話番号などの連絡先情報に誤りがある場合、コミュニケーションを取る術がなければ、削除候補となります。

3. 重複(Duplicates)

重複したリード情報は、特に次の2点で問題となります。
1. データベースの使用コストを圧迫する
2. 顧客体験(Customer Experience)の障害に繋がる可能性

例えば、MAに同一人物の異なるメールアドレスがあれば、2リードとカウントされ、その積み上がりで課金されることになります。また、顧客体験としては、一人に同一メールが複数届く可能性があります。これはユーザーがメールを拒絶(オプトアウト)したり、迷惑メールとして登録したりする可能性を高めます。

4. 正規化(Normalization)

データフィールドの規則は、データ活用の要件を洗い出した上で整理していく必要があります。つまり、データ活用の目的からデータベースの設計が必要です。例えば、マーケティング業務や活動の目的、分析の目的、他のツールと連携する目的などを洗い出し、それを実現するためのデータ構造設計が必要となります。

5. 非準拠/違反(Non-compliant)

地域(国)の法律や規制に反するデータは、特にグローバル企業において、今後より一層重視しないといけないポイントです。ご存知の通り、2018年5月に発効されるGDPRは、すべてのEU諸国を対象とした規制であり、例えば、マーケティング部門がリードを集める際に、自社および第三者ベンダーがその規制に従った運用が必要となります。もしこれに違反した場合、その法的手数料と罰金は企業に大きな負担となる可能性があります。

おしまいに

ここまで米国の情報などを取り入れながら、デジタルがもたらすビジネスへの影響をみてきました。働き方がデジタル化する一方、今企業はデータの質にこだわり、なるべく早い段階でその質を確保する対策を迫られています。最後にどのような対策が必要であるかご紹介いたします。

対策とプロセス例

現状把握
・業務要件からデータを含めたゴール設定
・Good Lead/Bad Leadの定義
・データINとOUT(連携先)のフォーマット整理
・部門で取得すべきデータの整理(プロセス別に取得すべきデータ)
・ツールごとのデータ整備

対策

やって損はない、いややっておくべきことは、データの入り口からキレイなデータを取得することです。自由に入力されたデータは「揺らぎ」「不備」「誤記」問題が含まれます。これをキレイにすることは極めて困難なことなのでなるべく未然に防ぐ必要があります。ガーベージ・イン・ガーベージ・アウトという言葉があります。せっかくコストをかけてリードを獲得しても、元データが正しくなかったり、情報が足りていないと、後でデータクレンジングしてもキレイにできないということです。当社実績では、保有する企業データの約3割が特定するのが難しい傾向にあります。データクレンジングにかかるコストも大幅に削減できます。

・データ入力の時点でキレイなデータを取得すること
ソリューション:ST&E(スタンディ)データの揺らぎを未然に防ぐ

・蓄積されたデータを定期的にキレイにする
ソリューション:データクレンジングST&E(スタンディ)

日々のマーケティング活動に追われる皆さんが、早期に対応すべき問題を見失わず行動に移せるきっかけとなれば幸いです。

REFERENCES

SiriusDecisions, “The Impact of Bad Data on Demand Creation”
Informatica, “Leadership Benchmark Report on Marketing Data Quality Trends, 2017.”
Bizable, Heinz, Uberflip, Radius, LinkedIn; “State of Pipeline Marketing Report, 2017.”
Integrate, “The Cost of Bad Leads”
Justin Gray, CEO of LeadMD

会社/製品

株式会社B-Storyは、デジタルマーケティングに取り組む企業を支援します。「実効性」と「実行性」をコンセプトに、戦略戦術ストーリーをデータ「蓄積、計測、可視化」の視点で一緒に作り上げていきます。

※当サイトの内容、テキスト、画像等の無断転載・無断使用を固く禁じます。
※当サイトを引用される際は、出典元(株式会社B-Story)を明記をお願いいたします。
※Unauthorized copying and replication of the contents of this site, text and images are strictly prohibited.
※In the case of quoting this site, please specify the source of origin (B-Story,Inc.).

関連記事

  1. 会社情報管理の3つのポイント(名寄せ・データクレンジング)

  2. マーケター必見!コンバージョンアシストツール

  3. マーケティングオートメーションを上手に使う3つのポイント

  4. All roads leads to ABM(すべての道はABMに通ず…

  5. ABMからAIへデータマネジメントが握るカギ

  6. マーケティング用語ピックアップ5