マーケティングの役割を180度変えた「ブランド資産」という概念

ブランドとは何ですか?と聞かれて、躊躇せずに答えられるマーケターは実はそんな多くないように思います。

実務では、レギュレーションが用意されていて、ロゴの使い方や色、フォントまで定められているので、レギュレーションに従って制作物の確認作業を行います。ブランド統一に関しては、ある程度の規模のある企業では、役員や上司、もしくはデザイン会社クリエイティブディレクターから厳しくチェックされます。このような作業を行うことで、ブランドイメージの統一をはかることはもちろん大切なことですが、そもそもブランドとは何なのでしょうか。

ブランドに対しての概念は、1980年代後半に大きく変わり、ブランド・マネジメントの役割も変化していきました。そして、デジタル化、グローバル化の波を受けて、ブランド・マネジメントを行うマーケティングの業務はより高度化しています。

それではブランドとは何か、ブランド・マネジメントとは何か、企業において中長期的なブランド育成が根付かない理由は何か、考えていきましょう。

ブランドとは何か

ブランドとは、企業や商品・サービスが持つ独自の「らしさ」、ユーザーが抱く共通のイメージです。他社と区別するための要素でもあります。

しかし、ブランドという概念が注目され、ブランドの持つ無形の価値が評価されたのは、最近のことです。デービット・アーカーによって「ブランドとは資産である」と提唱され、1980年後半にアメリカで登場した比較的新しい概念です。つまり、「ブランドとは資産である」――ブランドが企業の事業戦略や業績に関わるという考えです。

ブランドが資産という概念が生まれた背景

1980年代の初頭にPOSシステムの導入が進み、リアルタイムにデータを確認することができるようになり、様々な実験が可能になりました。様々な実験とは、例えば、20%OFF、タイムセール、まとめ買いでお得などのディスカウントです。

今ではマーケティングは中長期の視点を持って活動すべきというのは広く知れ渡っている認識です。しかし、このPOSシステムの普及とリアルタイム・データの台頭で、マーケティングは短期的な戦術を連発することになり、価格が購入決定要因になりました。短期的な戦術を連発したブランドは、ブランドによる差別化を図ることもできない状態となり、ブランド・エクイティとロイヤリティーを回復することに時間をかけることになりました

さらに、企業は売上増加のためのコスト削減のインパクトも限度が知れていたので、新ブランドに開発やブランドの拡張を模索していました。当時、新ブランドの立ち上げをするにも、拡張するにも、ブランドを資産として活用していくブランド戦略を必要としていました。

また、定量的なデータでも、ブランドが資産価値を持つということが示され始めた時期でもありました。そうしたタイミングが重なり、ブランドを資産とした見方を採り入れる企業が少しずつ増えていきました。

ブランド構築の目標はブランド・エクイティを高めること

ブランド・エクイティ(Brand Equity)という言葉を、マーケティングやブランディングに関わった人が一度は耳にしたこともあるのではないでしょうか。エクイティ(Equity)は、株式や自己資本という意味をします。つまり、ブランド・エクイティはブランドが持つ資産、ブランド資産という意味で、「ブランドの名前やシンボルと結びついた資産(負債も含む)の集合」と考えられています。ブランド・エクイティの向上よって、製品やサービスの価値や魅力は増大させることができます。

ブランド・エクイティを築き、向上し、活用するためには、ブランド認知、ブランド連想、ブランドロイヤルティの主な3つの構成要素を育てる必要があります。

  • ブランド認知
  • ブランド連想
  • ブランドロイヤルティ
  • 知覚品質
  • その他ブランド資産

さらに、D.A.アーカーによると、知覚品質、その他ブランド資産を含めて、5つがブランド・エクイティの構成要素と提唱され、多く企業でモデルとして役に立つものでしょう。

ブランド認知に関して

ブランド認知に関しては、認知度とよく表現されているのではないでしょうか。認知度想起率が高いほど、顧客の購入プロセスの決定的な場面でブランドを思い出してもらえる可能性が高くなります。

  • ブランド認知度とは

ブランド認知度は、100人に「FLOURISHって知っていますか?」と質問したとします。その時「知っている」と答えた人が、100人中90人いたとします。この場合のブランド認知度は、90%という事になります。

  • 想起率とは

最初に想起されるブランドをトップ・オブ・マインドと言われています。例えば、「大学受験の予備校は?」という質問をされたら、みなさんはどのようなブランド(予備校や学習塾)を思い浮かべますか?

商品・製品のカテゴリーを聞いて思い出すか、これを純粋想起(ブランド再生)といいます。純粋想起率が低いと購入の際の選択肢に入ってこないので、想起率を上げることは重要です。

さらに、特定のブランドの名前やロゴ、画像を見て思い出すことを助成想起(ブランド再認)と言います。助成想起率が高いと、購買の動機につながりやすい状態と考えられています。

ブランド連想に関して

ブランド連想とは、そのブランドを連想させるもの。

例えば、Tiffany & Coといえば、青い箱を連想するのではないでしょうか。

これがブランド連想です。古くから青は、真実や高潔さのシンボルでもあり、「ティファニーの品々はどれも気高くあらねばならない」という信念を表すものになっています。

どのような連想を持たせたいのかを決め、その連想を強化するような計画を練り、実施していくことで、その連想とブランドを結びつけます。ブランドを資産としてマネジメントする際にとても重要なことです。

ブランドロイヤリティーに関して

ロイヤリティは英語ではLoyaltyと書き、Loyaltyは忠実、忠誠の意で、会社、ショップなどに対する顧客から店に対する親密性や信頼性を指します。

顧客のロイヤルティ(顧客が特定の企業やブランドのサービス・商品に対して持つ信頼や愛着心)で、ブランドロイヤリティは成り立っています。

高いロイヤリティーを持つ顧客は売上に貢献し、新規顧客を獲得することよりも、既存顧客のリピートを作り、維持する方が費用や労力が安くすむ場合も多いでしょう。「20%の優良な顧客が企業の売上全体の80%を担う」というパレートの法則があります。

このブランドロイヤリティーを高めることで、「他のブランドを試してみたい」という気持ちを無くします。比較検討を必要とせずに、「そのブランドを購入したい」という顧客の気持ちを高めることができ、リピートや顧客単価の向上に繋がり、安定した売上の確保につながります。

ブランドロイヤリティは「Net Promoter Score(ネット・プロモーター・スコア:NPS®)」という指標を用いて計測するのが一般的です。

Net score nps promoter marketing illustration management organization isolated vector concept

該当する商品やサービスを周囲に勧めたいかどうかの評価をアンケートで調査します。

知覚品質に関して

知覚品質が改善すればROIも向上すると考えられています。顧客が感じているブランドイメージ、品質のことを指します。品質だけでなく、信頼性や雰囲気といった側面も、知覚品質に含まれるものとされています。

その他のブランド資産に関して

特許のような資産など所有権のある他の資産が含まれています。

ブランドが資産という見方をするとマーケティングの役割も変わる

短期的な売上を上げるような戦術的な評価基準から、ブランド・エクイティを向上させるような戦略的な評価基準へと重点を変化させることは大きな変化であり、挑戦になります。

評価基準の重点を変化させることで、マーケティングの役割も変わります。それまではマーケティングの役割が販売促進であると考えられていました。マーケティング・マネージャーは、広告宣伝の出稿、広報やプロモーションの計画を立案し、スケジュールの進行管理をしていて、戦術を実施する業務を回すタスクマンです。

しかし、ブランド・エクイティの向上に重点が置かれると、マーケティングの業務は戦術的で受け身の立場から戦略的でビジョンを描く立場に変わっていきました。(つまり、ブランド・ビジョンのない会社では、マーケティングは残念ながらタスクマンとなってしまうという現象は致し方ないことです。)

今日ではデジタル化が進み、集客チャネル(集客する媒体・経路)も増え、コミュニケーションのあり方が複雑になりました。例えば、下記のようなチャネルが存在します。

コミュニケーション・チャネル

  • ウェブサイト
  • ソーシャルメディア
  • パンフレット
  • チラシ、ポスター
  • テレビ、ラジオ
  • 屋外広告
  • DM
  • 新聞、雑誌広告
  • オンライン広告
  • イベント

これに加えて、流通チャネル、販売チャネルも。販売チャネルには、店舗やECサイトなどが当たります。マーケティングがブランド・マネジメントに関わる範囲としては、販売チャネルとコミュニケーション・チャネルになります。

販売チャネルと複数のコミュニケーション・チャネルを統合的に管理し、統一されたメッセージの発信を企業はしく必要があります。コミュニケーション・チャネルを総合的に管理する戦略は、IMC(Integrated Marketing Communication)と言われ、日本語では総合型マーケティング・コミュニケーションと呼ばれています。

経営層と話し合いを重ねてブランド・ビジョンを策定し、明確なブランド・ビジョンに従って、ブランド資産を構築していく。どんな風にブランドを連想してもらいたいか考え、ブランド連想を強化する計画を練り…、複数のチャネルを管理する。売上増大というシンプルな課題よりも難しいことです。

さらにグローバル展開するようなサービスであれば、製品の数が増え、提供する国が増えていけば、管理することが増えていくでしょう。

今日でもブランド資産という概念が浸透しない理由は

「ブランドは資産である」だから、中長期的な戦略として重要な指標として扱いましょうというスタンスに企業はなかなか切り替えられないでいる現状は今日でもあります。

特に、BtoB企業やハイテク業界、製造と販売に注力している企業では、今もなお、ブランド戦略は受け入れにくいのが現状ではないでしょうか。

それには、短期的な財務業績の力が圧倒的に強く、経営者からも短期的な数字が満足感を得られやすくなっていることが一つ理由としては挙げられるでしょう。企業は株式の利益の最大化を目指しているため、株の利益に影響を与える短期的な収益を優先します。そのため、短期的な業績を改善した人を評価し、昇進させやすいシステムになっていて、評価される側も短期的な改善を優先して取り組んでしまう傾向があります。前述のように、短期的な戦術だけを繰り返していくことで、ブランド資産が損なわれた歴史もあるので、短期的な戦術と中長期的な戦略の比重でバランスをとることはとても大事なことです。

さらにブランド戦略などの無形な資産を重視していないカルチャーでは、マーケティングと営業の力関係で言えば圧倒的に営業が強くなりがちとも言えるでしょう。営業の力が強くなるほど、明日にでもできる短期的な戦術を重視します。その結果、ブランド資産だけでなく、優秀なマーケターの疲弊と離脱が起きやすくなります。

短期的な施策に対して手を動かせる優秀なマーケターもまた限られていて、優秀でやる気のある中堅から若手のマーケターに仕事は偏り、疲弊するという構造は多くの企業で見られることです。

中長期的な戦略を考えること、短期的な戦術を実施することのバランスをみることから始めてみるとよいのかもしれません。

CMPとは何?データ収集に同意機能は必須なのか?

CMP(Consent Management Platform)とは何か

同意管理(Consent Management)とは、簡単に説明すると、顧客がどのような個人データを企業と共有してもよいかを決定できるようにする仕組みのことです。同意管理プラットフォームはCMPと省略されて呼ばれます。

また、より本質的に同意管理(Consent Management)を説明すると、個人情報が組織によってどのように収集、使用、共有されるかを監督する権利を個人に与えるため、データプライバシーとコンプライアンスの軸となる原則とも言えます。

このCMP(同意管理プラットフォーム)は、ユーザーがアプリや Web サイトにアクセスするときに同意設定を収集するのに非常に役立ちます。

同意設定を収集する場合は、同意管理プラットフォーム、または同意管理機能を組み込んだマーケティング プラットフォームが活用されています。

Google 同意モードV2でも事が足りる場合もあります。Google 同意モードV2は Google エコシステム内で機能し、同意設定をしますが、設定を収集しません。Google 同意モードV2も同意管理機能の一つになります。

なぜCMP(Consent Management Platform)が必要なのか?絶対に導入しないといけないのか?

カリフォルニア州消費者プライバシー法 (CCPA) とヨーロッパの一般データ保護規則 (GDPR) の施行により、企業はデータ主体の同意なしに個人データを収集できなくなりました。これらの規則では、Web サイトが閲覧中に Cookie を使用してデータを収集することについてユーザーの同意を得ることが法的に義務付けられているため、これは世界中で非常に重要になっています

EU 内かどうかに関係なく、その Web サイトは EU/EEAのデータを処理する際に規制上の義務を満たさなければなりません。そうしないと、企業は金銭的な罰金を受けることになります。

そのため、GDPR などの世界的なプライバシー規制に準拠しているCMPを活用する企業が増えています。

もっと具体的に同意管理プラットフォームや同意管理機能が必要な場合とは?

現状、「GDPRを守らなければいけないからCMPが必要」みたいな雰囲気を感じ取っていらっしゃる方も多いと思います。

具体的には、下記のいずれかのアクティビティが行われる場合、Web サイトには同意管理プラットフォームや同意管理機能が必要だと考えられています。

  • 個人データの処理: 検索連動型広告やコンテンツ連動型広告、リマーケティング、分析、コンテンツのパーソナライゼーション、メールマーケティングなどの目的での個人データの使用。
  • プロファイリングなどの自動処理および自動化された意思決定
  • データの海外移転: 企業が EU 域外で処理するために EU 国民のデータを収集する場合。

つまり、ほとんどの消費者向け企業は、データ処理の基礎としてユーザーの同意を収集する必要があります。

一般的には、電子メール マーケティング、リマーケティング、プロファイリング、パーソナライゼーションなど、すべてデータ処理を伴う広告およびマーケティング活動の大部分を実施するために同意が必要になってきます。

日本では、個人情報の取り扱いに対する同意がメインになっていています。

Cookieやトラッキング技術を使用に対する同意に関しては、ユーザーに対して透明性を提供し、同意を得ることが望ましい風潮がGDPRの施行により強まっています。

同意管理機能を追加することで、さまざまなCookieも統合して管理が可能になるでしょう。

同意管理プラットフォームの主な機能

同意管理プラットフォームの主な機能は次のとおりです。

  • 明示:ユーザーへのCookie バナー設置と同意の詳細や同意の取り消しなど管理するウィジェットの表示
  • 同意の収集:訪問者の同意決定に関する情報を収集および保存し、その変更を記録する。
  • 同意管理:同意が与えられる前に、受け入れられたタグのみを発行して事前承認されたデータのみを収集。サイトの Cookie リストを継続的にスキャンして最新のコンプライアンスに更新します。
  • 同意共有: CMP は同意設定を取得し、データ処理に関与するサードパーティやベンダー (Google Analytics、広告ベンダーなど) と共有します。
  • データ収集と管理:データへのアクセス、修正、移動、消去を求める訪問者のリクエストに対処します。
  • 同意の証明: 同意が収集されると、CMP はそれをリポジトリに安全に保管し、規制監査の際にコンプライアンスの証拠として機能します。

まだ日本ではCookie同意に対応していないサイトもあるけどなぜ?

まだ全ての企業が対応しているわけでもないし、本当にCMPは対応しなければいけないの?と疑問に感じている方もいるのではないでしょうか。2つの視点からCMPが必要であるのか考えてみましょう。

日本の個人情報保護法ではCookieは個人情報なのか?Cookieに関する同意機能は必須なのか?

日本の個人情報保護法では、「個人情報」とは、「氏名、生年月日、住所、電話番号、連絡先その他の記述等により特定の個人を識別できる情報」とされています。基本的には、Cookieは個人情報に含まれていません

しかし、トラッキングクッキーや広告用のクッキーなど、ユーザーの行動を追跡するためのクッキーが、個人情報と結びついた場合は個人情報に該当します。

日本でも個人情報の取得には同意が必要です。Cookieに関しては、第三者提供を行い、突合により個人を特定できる場合は、提供する同意がなければ提供できません。

日本企業はGDPRを遵守しなければいけないのか?

GDPRは主にEUの市民のデータを処理する企業や組織に対して適用されます。GDPRの対象とされる可能性が高いものは以下です。

EU市民のデータを処理する場合

日本に拠点を持つ企業であっても、そのサービスや商品を提供する過程でEUの市民の個人データを処理する場合、GDPRは適用される可能性があります。

EU内での活動がある場合

日本企業がEU内で事業を展開し、現地で個人データを処理する場合、GDPRの要件を順守する必要があります。

EUの市場をターゲットにしている場合

日本企業がEUの市場をターゲットにし、EUの市民にサービスを提供する場合、GDPRの対象となります。

EU企業との取引がある場合

日本企業がEUの企業とデータ取引を行う場合、GDPRの要件が適用されることがあります。

EU域内に個人データを扱うデータベースやサーバーが設置されている場合

EU域内にデータベースやサーバーがある場合、そのデータ処理がGDPRの対象となります。

一般的にはCookieによる情報の収集や追跡をEUに対して行わない場合、EUの一般データ保護規則(GDPR)に基づく同意の取得は必要ありません。設定が誤っていると、CookieがEUのユーザーに対して送信される可能性があるので、注意が必要です。GDPR以外にも地域や国によって、Cookieや個人情報の取り扱いは異なるので、確認もしましょう。

最後に一般論となりますが、Cookieの使用に関する透明性を提供し、プライバシーポリシーに明示的に記載しておくことがベストプラクティスと言われています。

しかし、Cookieによるトラッキングをオプトアウトに設定された場合、Webサイトの分析の母数が減るというリスクもあります。(一般的にはEU圏ではオプトインの原則が採用されています。)倫理的な取り組み、分析の精度、母数の確保、何を優先すべきか費用対効果の上に検討する必要があります。

透明性と選択権を提供する一方で、必要なデータを収集し、ユーザーにとって価値のあるエクスペリエンスを提供できるようにするーーバランスをとることが重要です。同意機能を実装するタイミングやユーザーとのコミュニケーションの取り方、コストを鑑みる必要があるでしょう。

CMPに求められる使い勝手の良さ

企業が CMP を選択する際に評価すべきいくつか挙げてみました。

  • ユーザー インターフェイスとダッシュボードの直観性
  • コスト
  • 分析とスキャン機能
  • データプライバシー機能
  • 多言語オプション
  • パフォーマンス
  • シームレスな統合

これらの要素を考慮することで、企業はより使い勝手が良く、ビジネスに適したCMPを選択できるでしょう。

インタラクティブ動画の知られていないメリットと、効果を最大化する活用

インタラクティブ動画は、2020年前後に、マーケティングで活用されたことで話題となりました。当時のインタラクティブ動画への期待は大きく、見逃されていたメリットがあります。「実はインタラクティブ動画はこんなところで役に立つ!」という盲点を、UXやエンゲージメントの面だけでなく、業務効率化の面からも紹介します。

IKEAでの活用で注目を集めたインタラクティブ動画の今

インタラクティブ動画プラットフォーム「Wirewax」を活用したIKEAやNIKEのプロモーションで注目されました。当時のショッピングのインタラクティブ動画は、話題性あり、ストーリーとしてもとても優れたものでした。

次第に世界ではインタラクティブ ビデオ ソフトウェアの業界の統合が加速しました。Vimeo がインタラクティブビデオプラットフォーム Wirewaxを買収したことは話題になりました。日本ではそこまでの注目されたインタラクティブ動画は出現せず、流行りきらなかった印象が残りますが、リーディングカンパニーのVimeo が Wirewax のようなインタラクティブ ビデオ プラットフォームに投資していることからも、インタラクティブ動画の力を感じます。

インタラクティブ動画の拡大傾向

インタラクティブ動画をはじめとしたオンラインビデオソフトウェア業界は、電子商取引、教育、広告、マーケティングなどのさまざまな業界で、インタラクティブなコンテンツに対する需要が高まっていて、今後数年間で拡大し続けると予想されています。

新しいソリューションの導入へのスタンス

日本では、どんなソリューションの導入にも当てはまりますが、事例があるから導入する、大手や競合と同じことをするという傾向があります。しかし、重要なことは、他社の事例ではなく、自ら創造的に導入することです。創造的に導入することで、その企業に合った使い方や仕組みを構築できるしょう。

改めて、効果を最大化するインタラクティブ動画の活用シーン

マーケティング活動でよく使われる用語である「ファネル」。

1898 年に考案されたファネルは、消費者が商品やサービスを知ってから、購入するまでの一連の行動を、認識、関心、欲求、行動 (AIDA) という 4 段階のプロセスで構成したもの。

ファネルによって打ち手は変わってくるので、ファネルのどこでインタラクティブ動画が効果的か考えてみましょう。

下記は人事部門の採用活動におけるファネルごとの打ち手を書き出してみました。

drag embedded asset

published

インタラクティブ 動画のファネル

インタラクティブ 動画のファネル

動機形成のフェーズでインタラクティブ動画を使い、会社への理解を深めてもらうことが最も効果的な活用方法になるでしょう。

既存の動画では、ただ観ているだけで、一方通行に成りがちです。そんな課題に対して、インタラクティブ動画を活用してみると、双方向のアクションが追加されることで応募者の記憶に残るようになります。

人事を例に出しましたが、より理解を深めるフェーズや、内容が複雑で理解をしなければいけない領域に適していると考えられます。

活用が進んでいる業界や分野

リーディングカンパニーのWirewax が頻繁に宣伝していたのは、「ショッピング可能な」動画でした。インタラクティブを追加し、購入までシームレスを行えることを強みとして訴求していました。

現在は、eコマース(ショッピング)、教育、広告、マーケティング、人事、医薬などのさまざまな業界で魅力的でインタラクティブなコンテンツに対する需要が高まっています。

医療

医療関連で扱うテーマは説明が複雑です。インタラクティブなビデオを使用することで、メッセージをより効果的に配信するのに役立つだけでなく、見込顧客などの試聴者が内容をよりよく覚えておくことに役立ちます。

教育

インタラクティブビデオは、学生がビデオ学習教材とやりとりをできるようにしながら、理解力と記憶力を向上させます。

eコマース(ショッピング)

クリック可能なボタンやホットスポットなどのインタラクションを追加できます。動画を終了することなく、シームレスな購入体験を提供できます。また、個人的な興味について質問したり、電子メール アドレスを尋ねたりします。従来のオンラインビデオでは収集できなかったデータと洞察を収集します。

マーケティング

マーケティングにおいて、動画はさまざまな使い方ができます。広く浅く認知を広げるというより、エンゲージメントを高め、視聴者が 視聴中にアクションを起こすように促し、インパクトを残すことが期待されます。

また、インタラクティブ動画では企業と顧客の間の双方向のやり取りとなり、顧客に関する個人情報を収集することができます。

人事

会社に良い印象を与え、なぜその仕事に応募すべきなのかを人々に示すことができます。質の高い候補者を見つけることに、インタラクティブ動画は役に立ちます。Web サイトや採用ページにボタンを追加したり、ビデオ中に質問して、候補者が最適かどうかを早い段階で確認したりできます。

どのような活用シーンでも母集団が形成された段階での活用が相性は良いと考えられます。

最後に、盲点となっていたインタラクティブ動画のメリット

インタラクティブ動画のメリットは、下記が挙げられます。

  • エンゲージメントの強化
  • パーソナライズされたエクスペリエンス
  • 内容の理解と記憶など

忘れてはいけないのは運用面での利点です。

  • クラウド管理
  • リアルタイム更新

クラウドでの動画編集と管理を可能にしているインタラクティブ動画プラットフォームは、リアルタイム更新ができます。

クラウドの運用はとても共有ができて、リアルタイムでの更新ができるため、効率的です。

クラウドだからこそ著作権を考え直そう

しかし、クラウドだからこそ、より著作権には注意して、改めて考えてみなければいけません。

クラウドの開設されたアカウントにある動画や素材は誰のものなのでしょうか?

楽曲や文章、写真、プログラムなどの創作的な表現は、著作権によって保護されています。

例えば、大型案件の動画などは広告会社と制作会社が共同して創作することが多く、その場合は2社に著作権は帰属します。動画の素材の利用契約の制限を受けますから、実際には、案件によりますが、著作権が帰属しているからといって、完全に自由に利用できないこともあります。

著作権を守ることはクリエイティブを維持することにつながります。大袈裟かもしれませんが、クリエイターを守り、創造的な文化を守ることにもつながります。

現実的には求めるクリエイティブのレベルで著作権の扱いは変わってくることが多く、本質的な意味で著作権を保護できるレベルはクリエイティブ的にも非常に高い段階と言えます。

もちろん著作権は守るべき法律なので守るのですが、運用の効率性とコスト、クリエイティブのバランス、求められているレベル感などを考慮しながら守ることになるのではないでしょうか。

インタラクティブ動画の制作を検討されている方へ

FLOURISHでは、機能面とコストのバランスが優れたプラットフォームを使うことで、よりコストメリットのあるインタラクティブ動画サービスを提供したいと考え、インタラクティブ動画プラットフォーム「hihaho」とのContent Business Partnersになりました。

インタラクディブ動画の導入に関するご相談など、お気軽にご連絡ください。

Core Web Vitalsの指標が悪いと、どんなデメリットがありますか?

SEO(Search Engine Optimization:検索エンジン最適化)は、特定のキーワードの検索をした際に検索結果の上位に表示されるようにサイトを改善するプロセスのことで、マーケティング施策において重要となっている施策の一つではないでしょうか。

いまだにSEOに対して誤解や偏った考えへ傾倒がされやすく、とにかくPV数を稼ぐためにだけSEO対策が行われてしまうことも。

この記事では、Google のコア ランキング システムがランキングを決定する際に考慮する要素であるCore Web Vitalsについて深掘りし、Core Web Vitalsを改善するメリットをビジネス的な視点から紹介します。

Core Web Vitalsとは何ですか?

Core Web Vitals は、ページの読み込みパフォーマンスインタラクティブ性視覚的安定性に関する実際のユーザー エクスペリエンスを測定する指標です。

下記はCore Web Vitals の 指標です。

Core Web Vitals3つの指標
  • Largest Contentful Paint (最大視覚コンテンツの表示時間、LCP)
  • First Input Delay (初回入力までの遅延時間、FID) ※
  • Cumulative Layout Shift (累積レイアウト シフト数、CLS):

※2024 年 3 月以降、Interaction to Next Paint(INP)が FID に代わって Core Web Vitals の一つになります。

Google では、Core Web Vitals をあらゆる Web エクスペリエンスにおける重要な指標として捉えています。

検索結果でのランキングを上げ、全般的に優れたユーザー エクスペリエンスを提供できるよう、サイト所有者の皆様には、Core Web Vitals を改善することを強くおすすめします。

引用:Core Web Vitals と Google 検索の検索結果について|Google 検索セントラル

Core Web Vitals は、その他のページ エクスペリエンス要素とともに、Google のコア ランキング システムがランキングを決定する際に考慮する要素です。

Core Web Vitalsの指標が悪いとどんなデメリットがありますか?

(1)LCPがサイトパフォーマンスに与える影響

LCP (最大視覚コンテンツの表示時間:Largest Contentful Paint)は、スクロールせずに見える範囲で最もサイズが大きいコンテンツ要素の表示タイミングを測定します。ページのメイン コンテンツの画面へのレンダリングが完了したタイミングを判断するために使用されます。考慮されるコンテンツ要素は、画像、画像タグ、ビデオのサムネイル、CSSを使用した背景画像、段落、見出し、リストなどになります。

サイトが提供する内容を表示するのに時間がかかる場合、訪問者がページを離れる可能性が高くなります。Google にとって、これはエクスペリエンスが最適ではなかったことを意味します。

さらに、読み込みに時間がかかると、ユーザーはイライラし、ユーザーが目的のアクションを完了するために十分な時間の滞在ができない可能性があるため、コンバージョン率に悪影響を与える可能性があります。

ユーザー エクスペリエンスを低下させる要因の1つに、画面にレンダリングされたコンテンツをユーザーが視認するまでの時間が挙げられることをGoogleは認識していて、LCP はPageSpeed Insights スコア全体の 25%を占めています。LCPの速度が優れているWeb サイトは検索結果で上位にランクされる可能性が高く、結果として自然検索(オーガニックサーチ)からのトラフィックとGoogle検索結果ページの可視性(インプレッション)が増加します。

(2)FIDがサイトパフォーマンスに与える影響

FID (初回入力までの遅延時間:First Input Delay )は、ユーザーが最初にページを操作してから、その操作に応じてブラウザーが実際にイベント ハンドラーの処理を開始するまでの時間を測定します。操作(インタラクション)とは、ボタン、リンク、またはキーのタップです。サイト自体からの応答が期待されていないため、スクロールやズームはインタラクションとしてカウントされません。

サイトが長時間応答せず、インタラクションを許可しない場合、ユーザーはサイトから離れてしまいます。ユーザーが「会議の予約」ボタンをクリックしたものの、想定した時間で反応がない場合、どうなるでしょう。

※2024 年 3 月以降、Interaction to Next Paint(INP)が FID に代わって Core Web Vitals の一つになります。First Input Delay (FID)は最初のインタラクションのみを測定していましたが、Interaction to Next Paint(INP)はページの全体的な応答性を評価します。そのため、すべてのページ インタラクションを測定し、遅延が最も大きいものを報告します。

(3)CLS がサイトパフォーマンスに与える影響

CLS(累積レイアウト シフト:Cumulative Layout Shift )は、視覚的な安定性を測定する重要な指標です。ユーザーが予想外のレイアウト変更を経験した回数を数値化します。シフトを引き起こしやすい要素の種類は、フォント、画像、ビデオ、問い合わせフォーム、ボタン、その他の種類のコンテンツです。

ページが移動するとユーザー エクスペリエンスが低下する可能性があるため、CLS を最小限に抑えることが重要です。意図せずレイアウトが変わってしまい、間違ったボタンをクリックしてしまうこともあります。

Core Web Vitalsの指標が悪いと…

つまり、Core Web Vitalsの指標が悪いと、訪問者がイライラしたり、スムーズに目的を達成したりすることができなくなります。GoogleはCore Web Vitalsの指標をアルゴリズムに加えているので、優れたユーザーエクスペリエンスを提供できないサイトはGoogle検索結果ページの可視性(インプレッション)を低下させることにつながります。

  • 訪問者のエンゲージメントが低下する
  • 訪問者がページから離脱する
  • コンバージョン率が悪化する
  • 検索結果のランキングに影響する

忘れがちなテクニカルなSEOを対策こともUXの向上では重要な施策な一つです。

大事なことはとてもシンプルで、「ユーザーが使いやすいサイトを作り、ユーザーにとって有益な情報を掲載する」という心がけを持つこと。これが成功するための近道です。それを実現するために考慮すべき要素はたくさんありますが、ユーザーにとってどうなのか?という視点はとても重要です。Core Web Vitalsは訪問者のページ エクスペリエンス要素を数字に表しているので、ぜひ参考にしてみましょう。

「健康食品」広告の薬事ライティングの注意点とは?~「薬機法」編

健康食品の広告作成では、「この表現は可能?」「この用語は使っても大丈夫?」といった点に気を取られがちです。しかし、表現・用語だけに注意を払って薬事ライティングを行うと、必ずと言ってよいほど失敗します。適切な薬事ライティングのためには、関連法規の目的、取り締まりの考え方を理解した上で、違反事例を研究することが大切です。主な関連法規に医薬品医療機器等法(薬機法)、景品表示法、健康増進法がありますが、今回は薬機法について解説します。

薬機法による広告規制…その目的とは?

薬機法は厚生労働省が所管しています。同法は保健衛生の向上を目的に、健康食品などの広告を規制しています。国が承認した医薬品以外で、疾病に対する効果などをうたうことを禁じています。

これは、疾病への予防・治療効果があるかのような表示を行うと、それを信じた一般消費者が医療を受ける機会を失い、病状を悪化させてしまうからです。加えて、医薬品と食品の概念が崩壊し、医薬品に対する不信感が生じてしまいます。

薬事ライティングは、そうした法の目的に照らして行うことが基本となります。

薬機法は「何人も」規制…広告代理店やライターも対象

薬機法による健康食品の広告規制は、主に法の第68条「承認前の医薬品、医療機器及び再生医療等製品の広告の禁止」に基づきます。

第68条では、「何人も…(略)…認証を受けていないものについて、その名称、製造方法、効能、効果又は性能に関する広告をしてはならない」と規定しています。

(承認前の医薬品、医療機器及び再生医療等製品の広告の禁止)

第六十八条 何人も、第十四条第一項、第二十三条の二の五第一項若しくは第二十三条の二の二十三第一項に規定する医薬品若しくは医療機器又は再生医療等製品であつて、まだ第十四条第一項、第十九条の二第一項、第二十三条の二の五第一項、第二十三条の二の十七第一項、第二十三条の二十五第一項若しくは第二十三条の三十七第一項の承認又は第二十三条の二の二十三第一項の認証を受けていないものについて、その名称、製造方法、効能、効果又は性能に関する広告をしてはならない。

引用:e-Gov法令検索|デジタル庁

重要なのは、「何人も」とされていること。広告主の販売会社だけでなく、マスコミ、広告代理店、原料メーカー、ライターなども規制を受けます。この点は、景品表示法と大きく異なります。

効能効果をうたう健康食品は「無承認の医薬品」

薬機法では、医薬品のような効能効果をうたう健康食品を「無承認の医薬品」とみなし、承認前の医薬品の広告を禁止する第68条に違反すると判断します。

例えば、健康食品の広告で「風邪を予防する」と宣伝し、それが事実であり、十分な根拠があったとしても、薬機法では「無承認の医薬品」とみなされ、法違反となります。

薬機法に基づく取り締まりのプロセス

薬機法に基づく取り締まりは、下記の2段階に分けて判断していきます。

  • 第1段階で、「広告の3要件」を満たすかどうかを判断。
  • 第2段階では、広告内容に「医薬品的な要素」があるかどうかを判断。
  • 両方を満たすと、薬機法の規制対象。

第1段階「広告の3要件」とは?

ここで注意しなければならないのが、「広告の3要件」の捉え方。

健康食品業界では、勝手な解釈によって「広告の3要件」を曲解し、違法な広告を展開するケースが少なくありません。「広告の3要件」を正しく理解することが、適切な薬事ライティングにつながります。

「広告の3要件」とは次の3点であり、全てを満たした場合に薬機法の規制対象の「広告」と判断されます。

  1. 顧客を誘引する意図が明確
  2. 商品名が明らかにされている
  3. 一般人が認知できる状態である

1点目の要件の「顧客」とは、一般消費者に限らず、すべての取引先を含みます。

2点目の要件の「商品名」については、販売する物(商品)だけでなく、使用する原材料も含み、原材料名も商品名に該当するケースがあります。

3点目の要件の「一般人」とは、世の中のすべての人を意味します。

このように「広告の3要件」については、広く捉える必要があります。これを満たさないケースは、学術会議で発表される論文やマスコミ報道などに限られます。

第2段階では、配合成分にも注意を!

薬機法に基づく取り締まりの第2段階では、広告内容に「医薬品的な要素」があるかどうかを判断しますが、「医薬品的な要素」とは何でしょうか?

最初に、商品に使用する原材料が、食品に使用できるものかどうかが問われます。医薬品にしか使用できない原材料を配合している場合は、食品ではなく医薬品と判断されます。

原材料のチェックには、食薬区分制度の「専ら医薬品として使用される成分本質(原材料)リスト」を用いるとよいでしょう。このリストに掲載されている原材料は、健康食品に使用できません。薬事ライティングを行う場合は、食薬区分制度を十分に理解することも必須となります。

第2段階では「医薬品的な効能効果」はNG

使用する原材料に問題がない場合であっても、以下の3点のうち、どれか1つでも該当すると「無承認の医薬品」と判断されます。

  1. 医薬品的な効能効果を標ぼう
  2. アンプル形状など専ら医薬品的な形状
  3. 用法用量が医薬品的

医薬品的な効能効果を標ぼう

1点目の「医薬品的な効能効果を標ぼう」とは、どのようなものでしょうか?

薬機法では、容器・包装、添付文書、チラシ、パンフレット、刊行物、インターネットなどの広告、演述(口頭)によって、「医薬品的な効能効果」をうたうことを禁じています。はっきりと表示していなくても、暗示している場合も同様です。

「医薬品的な効能効果」の事例として、次のようなものがあります。

疾病の予防・治療に関する表現

まず、「血圧が下がる」「糖尿病が治る」「動脈硬化を防ぐ」「近視が改善する」といった疾病の予防・治療に関する表現は、もっとも分かりやすいと言えます。

身体の組織機能の増強・増進を目的とする効能効果に関する表現

疾病名でなくても、「疲労回復」「強壮」「体力増強」「食欲増進」「老化防止」「アンチエイジング」「学力を高める」など、身体の組織機能の増強・増進を目的とする効能効果も規制の対象です。ただし、「栄養補給」「健康維持」といった程度の表現については、基本的に問題となりません。

間接的・暗示的な表現もNG

さらに、間接的・暗示的な表現もNGです。例えば、「延命〇〇」「〇〇の精」「不老長寿」「漢方秘法」などが挙げられます。健康食品の広告でよく見かけるのですが、「血圧を下げる作用が知られている〇〇を原材料に使用」といった間接的な説明も、薬機法の規制を受けます。

新聞・雑誌・書籍の記事や、医師・学者の談話などの引用も規制の対象

このほか、「○○という自然科学書に、消化を助けるとあります」や「医学博士△△の談『昔からご飯に〇〇をかけて食べるとガンにかからないと言われています』」など、新聞・雑誌・書籍の記事や、医師・学者の談話などの引用も規制の対象です。

アンプルや舌下錠などの形状はNG

次に、2点目の「アンプル形状など専ら医薬品的な形状」について見ていきます。

薬機法では、「食品」である旨が明示されている場合、原則として形状のみによって医薬品に該当するかどうかを判断しません。このため、カプセルや錠剤であっても、それだけでは問題になりません。

ただし、アンプル形状、舌下錠、液体を噴射するスプレー管などの食品については、一般消費者に医薬品であると誤認させることから、医薬品と判断されます。

「食前・食後」「お休み前に」といった表現はNG

3点目の「用法用量が医薬品的」については、薬事ライティングの際に細心の注意が必要です。

服用時期、服用間隔、服用量を健康食品の広告で記載した場合は、原則として「医薬品的な用法用量」とみなされます。例を挙げると、「1日2~3回」「食前・食後」「お休み前に1~2粒」などがあります。健康食品で表示できるのは、基本的に「1日あたり摂取目安量」となります。

一方、食品であっても過剰摂取や連用による健康被害の恐れがあるなど、むしろ摂取の時期・間隔・量の目安を表示すべきケースも考えられます。このため、ビタミン・ミネラルを対象とする栄養機能食品については、時期・間隔・量などの摂取方法を表示しても、「医薬品的な用法用量」には該当しないとされています。ただし、この場合も「食前」「食後」「食間」といった表示はNGです。

後を絶たない「明らか食品」をめぐる誤解

厚労省は通知「無承認無許可医薬品の指導取締りについて」(いわゆる「46通知」)で、一般消費者が医薬品と間違うことがないと考えられる食品として、次の3つを定めています。

  1. 野菜・果物・調理品など外観や形状から明らかに食品と分かる物
  2. 特別用途食品(トクホを含む)
  3. 機能性表示食品

これらについては、ある程度の効能効果をうたったとしても、直ちに薬機法の規制を受けることはないと考えられています。トクホは許可文言、機能性表示食品は届出表示の範囲内ならば、効能効果をうたうことが可能です。

一方、業界関係者の間で誤解が多いのが、「明らか食品」について。通知で規定されていることから、「何を表示しても問題ない」という誤解です。

しかし、野菜・果物といった「明らか食品」であっても、「糖尿病を改善」「血圧が下がる」「花粉症が治る」などと表示すると、「無承認の医薬品」とみなされます。何をうたっても大丈夫ということはあり得ませんので、薬事ライティングではこの点にも注意する必要があります。

健康食品の広告で薬機法に違反するとどうなる?

健康食品の広告で薬機法に違反すると、2年以下の懲役または200万円以下の罰金が科せられます。

このほか、2021年8月1日から「措置命令」と「課徴金制度」が加わりました(課徴金については、法第68条は適用外)。

措置命令が出ると、違反者には次のような対応が命じられます。

  • 違反広告の中止
  • 違反したことを医療関係者や消費者へ周知
  • 再発防止策を講じる
  • 違反行為を繰り返さない

行政処分であっても、刑事事件であっても、企業名や商品名などが広く報道され、事業者の社会的な信頼が大きく低下します。このため、薬事ライティングには細心の注意を払う必要があります。

薬事ライティングのポイント、「疾病」と「部位」が最重要

薬事ライティングで薬事法の観点から注意すべき点として、真っ先に挙げられるのが、疾病の予防・治療効果をうたわないこと。間接的・暗示的な表現も含め、疾病に対する効能効果をうたって、逮捕・起訴となるケースは珍しくありません。

次に、身体の部位の表示も避けなければなりません。脳や腸、肝臓、目、骨、血管など身体の部位を表示し、それに対する影響を明示・暗示することも薬機法違反に問われます。また、言葉だけでなく、写真やイラスト、グラフなども判断材料となります。

つまり、健康食品の広告で、医薬品の世界に一歩でも足を踏み込むと、薬機法による取り締まりが待ち受けているわけです。薬機法の目的を踏まえると、特に「疾病」「部位」は、薬事ライティングで最も注意すべきポイントとなります。

脱法行為は失敗への近道

近年、薬機法の規制を逃れようと、さまざまな悪質な広告手法が登場しています。

例えば、「驚異の〇〇(成分名)!ガンが消えた」と題した書籍を発刊したり、健康雑誌で「糖尿病に効く〇〇(成分)」を特集したりしつつ、当該成分を配合した健康食品の宣伝に利用する手法もその1つ。これは、薬機法の「広告の3要件」の盲点を突いた(つもりの)手法ですが、薬機法違反に問われた事件が発生しています。

このほか、折り込みチラシで特定成分の効能効果を説明し、別の折り込みチラシで同成分を配合した商品を宣伝するという手法も見られますが、この場合も、基本的に薬機法の規制から逃れることはできません。

薬機法の理解が進むと、抜け道を探ろうとする事業者も出てきます。しかし、そうした脱法行為は、取り返しのつかない事態を招きがちです。脱法行為は失敗への近道であると理解しましょう。

用語・表現だけにこだわるのは危険

薬事ライティングの際に、「この用語(表現)は使用可能か?」という点にばかり気を取られることも危険です。

違法かどうかは、一部の用語や表現だけを見て判断されるわけではありません。広告全体を通して吟味されるため、用語や表現だけにこだわるのは不十分と言えます。

また、用語・表現について、「他社のサイトでも使用しているから大丈夫」という考え方を持つとリスクが増大します。というのも、これまでの取り締まりで、“たまたま”後回しにされたり、見落とされてきたりしただけの可能性があるためです。

今回見てきたように、薬事ライティングを行う場合には、法の目的や取り締まりの考え方に基づいて、広告を総合的に判断しなければなりません。近視眼的な小手先のチェックは危険だということを肝に銘じ、適切なライティングを目指しましょう。

人事部門でのデータ活用:従業員の離職に関する分析~事前準備と基本的な分析~

データ分析は、収集されたデータから私達にとって重要で価値のある情報を引き出すための強力な手法です。収集されたデータの質や量が十分であればあるほど、より多くの有益な情報を引き出すことができる傾向がありますが、実際にそのような良いデータを入手することは簡単ではありません。手元にデータが揃わず、データ分析の価値を実感できていない方も多いのではないでしょうか?

ここでは、誰でも入手、利用可能なデータセットを使って、データ分析の大まかな雰囲気を体験できる記事を提供します。まずは、厳密さや精密さにはこだわらず、元のデータから情報を引き出していく流れの例をご紹介します

データ分析の概要

データ入手元

この記事では、データ分析に利用できる多くのデータセットが公開されている「kaggle」から入手したデータに対する分析例を紹介します。kaggle にはビジネス、気象や交通などの幅広いジャンルのデータが用意されています。

リンク先:kaggle Datasets

分析方法

Pythonを使用したデータ分析を行います。Pythonを使うと一般的な表計算ソフトでは難しい処理やAIなどへの展開が容易になります。

分析するデータ

従業員の離職原因について分析することを目的とした人事データを分析します。 データ(csvファイル)はこちらからダウンロードできます。

このデータセットは、IBMのデータサイエンティストが作成した架空のデータであり実在の人物に関わるデータや、ビジネス上の機密に該当するものではありません。実際に事業上収集されたデータを取り扱う場合には、セキュリティ対策や倫理的な配慮が必要となることにご注意ください。

例えば、この記事で紹介するような基本的な分析は、ChatGPTを使って簡単に行うことができます。しかし、ChatGPTに対して提示したデータのその後の取り扱いについては様々な懸念が存在するため、実際のデータを使うことは控えるべきです。

データ分析の流れ

1.データの理解

今回は、外部から入手したデータを使うため、まずはデータの理解が重要なステップとなります。データにどのような情報が、どのような形式で含まれているのかを確認することから始めましょう。

2.分析の目標設定

データを元に、どのような情報を引き出したいか、引き出せそうかを検討して分析の目標を設定します。

3.データの調整

データに欠損が存在する場合や、そのままでは扱いにくい形式になっている場合には、分析に適した形に変換する必要があります。また、分析の目標に対して関係がないデータ等があれば分析対象から外します。

4.データの分析

人事に関する一般的な知見や、データ内に現れている傾向を端緒に分析を進めます。さらに、統計的なアプローチを使って、目標達成に重要なデータを探索します。

5.分析結果に対する考察

得られた分析結果が何を意味しているのか、分析の目標は達成できているか、今後達成できそうかを検討します。

データ分析の流れ

より詳細な流れとしては、分析は複数繰り返されます。データの分析(1)により、本格的な分析を始める前に必要な分析を行い、考察を行い、次の分析に何がするのか?を方向づけることができます。

実際のデータ分析

1.データの理解

ダウンロードしたcsvファイルを開くと、1行目にデータのラベルと思われる情報が入力されており、年齢やジェンダーのような基本的な情報や勤続年数や収入に関する合計35項目のデータが確認できます。行数を見ると1470件分のデータが含まれています。 この1470件には重複(各行の値が完全に一致する組)はありませんでした。また、データに欠損している部分は無く、分析しやすい状態になっています。

1Age年齢
2Attrition離職の有無
3BusinessTravel出張の頻度
4DailyRate日給レート
5Department所属部署
6DistanceFromHome自宅ー職場間の距離 (マイル)
7Education教育レベル(学歴)
8EducationField学生時代の専門分野
9EmployeeCountグループを構成する従業員の数
10EmployeeNumber従業員番号(各従業員に割り振られている?)
11EnvironmentSatisfaction環境への満足度(4段階)
12Genderジェンダー
13HourlyRate時給レート
14JobInvolvement仕事への関与のレベル(4段階)
15JobLevel仕事のレベル(5段階)
16JobRole仕事上の役割(職種、役職)
17JobSatisfaction仕事への満足度(4段階)
18MaritalStatus婚姻の状況
19MonthlyIncome月収
20MonthlyRate月収レート
21NumCompaniesWorkedこれまでに勤務した企業数
22Over1818歳以上か?
23OverTime残業の有無
24PercentSalaryHike昇給率
25PerformanceRatingパフォーマンスレート(4段階)
26RelationshipSatisfaction人間関係への満足度(4段階)
27StandardHours標準労働時間
28StockOptionLevelストックオプションレベル
29TotalWorkingYearsトータルの勤続年数
30TrainingTimesLastYear過去1年間のトレーニング受講時間
31WorkLifeBalanceワークライフバランス(従業員の実感、4段階)
32YearsAtCompanyこの会社での勤続年数
33YearsInCurrentRole現在の役職についてからの年数
34YearsSinceLastPromotion最後の昇進からの年数
35YearsWithCurrManager現在のマネージャーになってからの年数

データ形式に着目すると、年齢や収入などは数値で入力されていますが、ジェンダーや担当職務は文字列で入力されています。以降、異なる形式のデータが混在していることを前提に分析を進めていきます。

2.分析の目標設定

今回使うデータには「Attrition」という項目があり、解雇のような会社側の意図したものではない離職に関する情報が含まれています。そこで、今回は年齢、性別、収入などの情報を使って、離職する従業員と離職しない従業員の違いに関する分析を行います。

分析の具体的なゴールは様々に設定可能ですが、例えば、従業員の離職にとって重要な意味を持つ要素(離職を防ぐ意味で対応すべきポイント)の発見や、離職可能性の高い従業員の事前察知(予測)が考えられます。

3.データの調整

全ての情報が今回の分析目的のために有効であるとは限りません。不要な情報によって分析の精度が落ちる可能性もあるので、情報の取捨選択を行います。

Pythonの場合、各項目の最小、最大、平均などの値や標準偏差を簡単に調べることができるため、活用してみましょう。

全ての例で同じ値のデータ

まずは、データの中に一見して分析の対象にならないものがあれば、分析から除外します。ここでは、すべての例で同じ値を示すものを除外します。

  • 9. EmployeeCount
  • 22. Over18
  • 27. StandardHours

の3つが該当します。

分析目的に合致しないデータ

  • 10. EmployeeNumber

各従業員に割り振られたユニークな数字だと思われます。今回は個人を特定するような分析は行わないため、使用しません。

欠損値の処理

データに欠損している部分がある場合は、欠損値を平均値、最頻値などで補完する、欠損値がある例を削除するといった対応が考えられます。今回は欠損値が無いデータを使っているため。欠損値の処理は必要ありません。

4.データの分析

基本的な情報の確認

まず、1470例の内、離職者と非離職者の数を確認します。

件数
離職者237
非離職者1233
合計1470

このデータには離職者よりも多数の非離職者の情報が含まれています。

離職者vs非離職者 データ比較

従業員のどのような要素が離職率に関わるかについては、ある程度の多くの場面で共通する知見が広く知られています。例えば、年齢(若年者、入社後数年以内)や収入(あまりに低い賃金)、部署(特に労働負担が大きい部門やハラスメントの存在)などが想定されます。まずはこれらのポイントから、データを分析してみます。

まず、離職者と非離職者の年齢(Age)の分布を見てみましょう(Fig.1)。傾向として、離職者には若い従業員が多くなっていることが分かりますが、40代、50代になってもある程度の離職者が存在しています

Fig.1 離職者と非離職者の年齢分布

次に収入について見てみましょう。この時収入が年齢(年齢と関連する勤続年数や役職を含む)と強く関連している点に注意しましょう。すでに離職者の方が若い傾向があることが分かっている以上、離職者の方が低い収入になる可能性が高いことも予想されます。

そこで、収入(MonthlyIncome)の値と勤続年数(YearsAtCompany)の値の2次元プロットを使って、離職者と非離職者の分布を確認します(Fig.2)。

Fig.2 月収vs 勤続年数2次元プロット(離職者及び非離職者)

Fig.2では赤が離職者、青が非離職者を表しています。事前に予想したように、勤続年数が長いほど収入が高くなる傾向はあるようです。離職者が多いのは、勤続年数が短い層、月収が低い層であることが読み取れます。

次に、部署(Department)による違いを分析してみます。このデータには、Human Resources、Research & Development、Salesの3種の値が含まれていました。

Fig.3 部署ごとの離職者と非離職者

この円グラフでは、離職「Attrition」の値がYesの場合は赤、Noの場合は青で表示しています。Human Resources、Salesに比べてResearch & DevelopmentにおけるYesの割合が少し低くなっています。

離職に関係する要素の探索

ここまでの分析は、おおよそ既存の知見を再確認するものではありますが、離職の予測における決定的な要素を見い出せていないことも事実です。今回のデータに含まれる項目の中に離職者の予想に効果を発揮するものが含まれているかを調べる方法はいろいろ考えられますが、ここでは相関係数を利用してみます。

例えば、離職を1、非離職を0と置き換えると、数値で表される他の要素との相関係数を求めることができます。相関係数は、必ずしも因果関係を表すものではありませんが、離職と関係する要素を探索する目的としては効果的な方法になり得ます。

要素相関係数
DistanceFromHome0.078
NumCompaniesWorked0.043
MonthlyRate0.015
PerformanceRating0.003
HourlyRate-0.007
PercentSalaryHike-0.013
Education-0.031
YearsSinceLastPromotion-0.033
RelationshipSatisfaction-0.046
DailyRate-0.057
TrainingTimesLastYear-0.059
WorkLifeBalance-0.064
EnvironmentSatisfaction-0.103
JobSatisfaction-0.103
JobInvolvement-0.130
YearsAtCompany-0.134
StockOptionLevel-0.137
YearsWithCurrManager-0.156
Age-0.159
MonthlyIncome-0.160
YearsInCurrentRole-0.161
JobLevel-0.169
TotalWorkingYears-0.171

数値で表される要素の相関係数を調べてみると、全ての要素で0.1~-0.2の範囲に収まっており、各要素単体と離職の間にはほとんど相関は見られないことがわかります。 ここでは、要素の中で有望なものを探すことが目的ですので、非常に弱い相関の中でも数値を比較してみます。TotalWorkingYears(これまでに他社を含む会社に在籍したトータルの年数)が-0.171で最も強い相関がみられました。これは、「会社に在籍していたトータルの年数が長い人ほど離職しにくい」という負の相関を表しています。もう少し表を見てみると、相関係数が-0.1を下回る要素は、年齢と強く関係するような時間的なパラメーターがほとんどです。

5.データ分析結果に対する考察

ここまでの分析によって、離職に関わる要素として年齢や勤続年数、それらに伴って増加する収入など、時間的要素を含むパラメーターが挙げられました。しかし、各要素と離職の有無の間の相関は非常に限定的であり、それらの要素単体で当該従業員が離職するかどうかを予測することはできそうにありません。今後は、複数の要素を踏まえた条件判断式の構築や、各要素を組み合わせて新たなパラメーターを作り出すことが有効な手段として想定されます

時間的な要素が重要であると見込まれる場合、データや分析結果の解釈にあたって、データの取得経緯を考慮に入れる必要があります。例えば、過去10年の離職者データと、今年の在籍従業員データがまとめられているような場合、そもそもデータの取得段階で時間的な歪みが含まれる可能性が考えられます。

今後の展開

おそらく、このデータから離職を精度よく予測するためには、複数の要素を総合的に判断する基準を作る必要があります。30を超える要素を組み合わせるパターンは無数に存在するため、人力での探索は効率的ではありません。そのような場合は、いわゆるAIと呼ばれるような手法によって、効果的な判断方法を創出してみることが良さそうです。「事部門でのデータ活用:従業員の離職に関する分析~AI、機械学習による分析~」では、同じデータを使ってAIによる離職者予想方法をご紹介します。

人事部門でのデータ活用:従業員の離職に関する分析~AI、機械学習による分析~

前回の記事「人事部門でのデータ活用:従業員の離職に関する分析~事前準備と基本的な分析~」では、データ概要の理解やデータ分析の目標設定の後、人間的な感覚に基づいて基本的な分析を行いました。 今回は、AI、機械学習の活用によるデータ分析法を取り入れてみます。 この記事では、AI、機械学習を使った手法が、前回紹介したような人間的な知識や経験を使った分析法とどのように異なるのか、その雰囲気を感じてもらいたいと思います。今回も難しい数学的な説明は避け、各手法や分析の流れのイメージを伝えることを優先しています。

データの概要

使用したデータは、「kaggle」から入手できる人事データです。このデータセットは、IBMのデータサイエンティストが作成した架空のデータであり、実在の人物に関わるデータ、ビジネス上の機密に該当するものではありません。

「kaggle」から入手できる人事データ

データ(csvファイル)のダウンロードはこちらから 従業員が離職者か非離職者かを示す情報に加えて、年齢や収入など35の要素について1470例のデータが含まれます。従業員が離職者か非離職者かを示す情報及び離職に関する分析には役立たない要素を除いたところ、以下の表のような構成になりました。

1Age年齢
2BusinessTravel出張の頻度
3DailyRate日給レート
4Department所属部署
5DistanceFromHome自宅ー職場間の距離 (マイル)
6Education教育レベル(学歴)
7EducationField学生時代の専門分野
8EnvironmentSatisfaction環境への満足度(4段階)
9Genderジェンダー
10HourlyRate時給レート
11JobInvolvement仕事への関与のレベル(4段階)
12JobLevel仕事のレベル(5段階)
13JobRole仕事上の役割(職種、役職)
14JobSatisfaction仕事への満足度(4段階)
15MaritalStatus婚姻の状況
16MonthlyIncome月収
17MonthlyRate月収レート
18NumCompaniesWorkedこれまでに勤務した企業数
19OverTime残業の有無
20PercentSalaryHike昇給率
21PerformanceRatingパフォーマンスレート(4段階)
22RelationshipSatisfaction人間関係への満足度(4段階)
23StockOptionLevelストックオプションレベル
24TotalWorkingYearsトータルの勤続年数
25TrainingTimesLastYear過去1年間のトレーニング受講時間
26WorkLifeBalanceワークライフバランス(従業員の実感、4段階)
27YearsAtCompanyこの会社での勤続年数
28YearsInCurrentRole現在の役職についてからの年数
29YearsSinceLastPromotion最後の昇進からの年数
30YearsWithCurrManager現在のマネージャーになってからの年数

データ分析のプロセスと前回のデータ分析を振り返り

体系的なプロセス

データ分析を体系化すると「データの理解→分析の目標設定→データの調整→データ分析(複数回)→分析結果に対する考察」という流れになります。前回はデータの分析の一回目まで行いました。

データ分析の目標設定の流れ

データ分析の目標設定

離職者と非離職者のデータから、従業員の離職にとって重要な意味を持つ要素の発見や、離職可能性の高い従業員の事前察知(予測)を目指します。

データの分析プロセス

データの分析は分析ごとにプロセスを踏みます。最初のデータ分析では、特徴の把握を行い、離職と要素との関係性を確認しました。

体系的プロセスで前回のデータサイエンス振り返る

前回までの分析結果

年齢や収入など30の要素のうち、一般的に離職との関連性が強いと考えられているものについてデータを可視化してみました。その結果、大まかには予想された傾向が見られるものの、離職の原因となる単一の要素を見つけることは難しそうなことがわかりました。また、各要素と離職の間の相関は、いずれも非常に弱いものでした。

今回のデータ分析(2)での目標設定

分析戦略の再検討

データ分析によって有益な情報を引き出すためには、分析と結果の検討を繰り返しながら、効果的な分析方法を探索していく必要があります。前回までの分析結果を検討して、次にどのような分析を行うべきかを検討してみます。

前回の問題点

前回の分析は、「従業員の離職には原因があり、データに含まれる30の要素のいずれかがその原因である、もしくは要素のいずれかが原因と密接に関連している」ということを期待して実施されました。しかし、実際には30の要素のいずれも、要素単体で離職を説明することは困難です。

また、離職に至るルートが複数ある可能性も十分に考慮できていません。例えば、「優秀な人から辞めていく」傾向と「極端にパフォーマンスが劣る従業員は辞める」傾向が同時に観察される組織も多いのではないでしょうか。

仮説の改良

従業員が離職する原因はいくつかの要素が絡み合って生じる、と仮定します。また、離職に至るルートも一つではないと考えます。

データの分析(2)の目標設定

データの分析(2)の目標設定

AI、機械学習の導入

改良した仮説を検証するためには、30の要素とその組み合わせを考慮する必要があり、前回行ったようなグラフ化をして検討する方法では、莫大な手間がかかります。 そこで、結果(今回は離職の有無)と多数の要素の関連を総合的に検討できる方法が望まれます。

AIを導入すると、このような人間には難しい複雑な判断を高速かつ高精度に実現できる可能性があります。AIのうち、データの特徴からそのデータの背景にある法則を把握する方法として「機械学習」があります。例えば、機械学習では離職者のデータと非離職者のデータの間の傾向の違いから、離職者と非離職者を見分ける法則を見出せる可能性があります。

AI、機械学習を用いた分析

AI、機械学習には様々な方法が含まれます。この記事では、ランダムフォレスト、サポートベクターマシン(SVM)という方法を使います。

分析結果の評価方法

ほぼ全てのケースでAI、機械学習を用いた分析結果は、完全、完璧なものではありません。常に間違いを含む可能性を認識し、分析結果の評価を行う必要があります。

具体的な評価手法としては、非離職者と離職者をそれぞれ正確に予測できるかという視点で、次の表の値を算出します。

分析結果の評価方法

機械学習では、①~④の値を使った「適合率」「再現率」という指標が使われることがあります。

  • 適合率/適合率は、AIが〇と予想したものの中に、実際に〇のデータがどれぐらいの割合を占めているかという指標です。離職者を予想する課題における適合率とは、④を③+④で割ったものが該当します。非離職者を予想する課題では、①を①+②で割ったものです。
  • 再現率/再現率は、実際に〇のデータのうち、どのぐらいの割合をAIが〇と予想できたかを示す値です。離職者を予想する課題における再現率は、④を②+④で割ったものです。非離職者を予想する課題では、①を①+③で割ったものです。
分析結果の評価方法
  • F値/適合率は「AIが間違えないこと」、再現率は「AIが見逃さないこと」の指標で、この両者はトレードオフの関係にあります。間違えないように慎重な判断基準を置けば見逃す確率が上がりますし、反対に見逃さないように基準を緩く設定すれば誤った判断をする確率が上がります。そこで、この両者のバランスを評価する指標としてF値という指標を用います。

この記事では、次の式で算出したF値(F1-Score)を用います。

  • F値 = 2 × 適合率 × 再現率 ÷ (適合率+再現率)

適合率または再現率のどちらかを重視したい事情がある場合には、適合率と再現率の値に重みづけした上でF値を算出することもあります。

データの下処理

機械学習をする前に、データの形状や値を調整する処理を行います。

量的データと質的データ(カテゴリカル変数)

データ中の要素には、年齢や収入のようにその量が数値で表されるもの(量的データ)と、所属部署や専門分野のような非数値的な情報(質的データ)が含まれています。非数値的な情報であっても、営業部=1、人事部=2、研究開発部=3のように数値に置き換えること自体は可能です。しかし、分析上、それら置き換えた数字を年齢や収入の数値と同じように取り扱うことは適切ではありません。

今回は、質的データを次のように変形します(One-hotエンコーディング)。下記のような

  • 「性別」(男 or 女) → 「男であるか」(0 or 1)と「女であるか」(0 or 1)
  • 「部署」(人事、研究開発、営業) → 「人事であるか」(0 or 1)、「研究開発であるか」(0 or 1)、「営業であるか」(0 or 1)

量的データのスケール調整

量的データの中には集団中の割合を意味する値のように0~1に収まるものや、年収のように大きな数字になるものもあります。これらのスケールの違いが機械学習の過程で問題になることがあるため、各要素においてスケールを調整し、要素間で値の範囲が大きく異ならないようにします。

学習用のデータと評価用データ

目的は未知のデータに対して正しい判断ができるかどうかを評価することなので、1470例のデータは学習用の1176例と評価用294例(学習用80%、評価用20%)に分割しました。1176例から見出される法則によって、未知の294例を正しく判断できるかが試されます。

データの分析〜AI、機械学習の実施〜

ランダムフォレスト

ランダムフォレストは、決定木という方法を多数組み合わせて判定する方法です。決定木は、A or Bのような条件分岐を繰り返して、元のデータから分類や回帰を行うことができます。いくつもの条件分岐を図にしたときに木のような構図になるため決定木という名前がついています。

ランダムフォレストでは、決定木を多数用意し、それらの判断のアンサンブルによって最終的な判断を定めます。多数の要素が含まれるデータでも手軽に分析できる強みがあります。

ランダムフォレストによる予測結果

ランダムフォレストによる予測結果

この結果を見ると、非離職者に対する予測が良好に行われている一方で、離職者に対する予測の再現率が低くなっています。離職者と予想した場合は実際に離職者である確率が高いものの、離職者を見逃しやすいと評価できます。

サポートベクターマシン(SVM)

サポートベクターマシンという手法によって、(厳密な定義はともかく)データのグループの間に境界線を見つけることができます。例えば、データ点がプロットされたグラフ上に線を引いて、離職者が多いエリアと非離職者の多いエリアを区分するようなイメージです。

サポートベクターマシンによる予測結果

サポートベクターマシンによる予測結果

ランダムフォレストと同様に、非離職者に対する予測は良好に行われています。離職者に対する予測では、ランダムフォレストと比較して再現率が向上しており、F1-scoreが改善しています。ランダムフォレストに対して、非離職者を離職者と間違って予測する確率が増加していますが、離職者を見逃す確率は低下していると評価できます。

予測結果の価値

ここでは予測結果を適合率や再現率、F1-scoreで表していますが、これらの数字のビジネス上の価値は、この予測結果を何に使うのかによって変化し得ます。 例えば、離職予防を目指して離職ハイリスク従業員に対する事前対応を行いたいのであれば、離職者の再現率が非常に重要です。この時、離職者の適合率が低ければ、実際には離職しない従業員に対応する件数が増えることになり、コスト増につながります。 また、重要なプロジェクトに離職リスクの少ない従業員をアサインしたい、といった目的のためであれば、非離職者の適合率が最重要視されることもあり得ます。

考察・今後の検討事項

ここまでランダムフォレスト、サポートベクターマシンによる離職者予測を行った結果、非離職者に対する予測精度に対して、離職者の予測精度が低いことが分かりました。この結果をもとに、データ分析方法をさらにブラッシュアップする戦略を立てることができます。

データ数の不均衡の調整

まず、離職者の予測精度が相対的に低い原因として、データ数の偏りが考えられます。今回使用した1470例のデータの内訳は、非離職者が1233例と離職者が237例です。機械学習の過程で、非離職者のデータの影響が強く出過ぎている可能性があります。

この問題への対応には、おおまかに、①データ数のバランスをとる、②不均衡なデータに合った機械学習のアルゴリズムを採用する、という方針が考えられます。

①のデータ数のバランスをとる目的では、多い方のデータを削減する方法(Under-sampling)や、少ない方のデータを模擬的に生成することで水増しする方法(Over-sampling)、両者を組み合わせる方法(Combination- sampling)などがあります。

特徴量エンジニアリング

ここまでの分析では、元データに含まれる要素のうち、明らかに不要なものを除いた30種を分析に取り入れていました。この30種の要素がどれも等しく離職者の予想に意味をもつ、ということは考えにくく、無駄な要素が含まれている可能性があります。

反対に、これらの要素を使って新たな重要な要素を生成することもできるかもしれません。例えば、月収を時給で除して月間の実労働時間(割増給等は無視できるとして)を求めることや、実労働時間と職場と自宅の距離から、拘束時間やプライベートな時間の長さに関連する数値を生成できる可能性があります。(このデータセットの場合、月収と時給の値の定義が曖昧で、上述の計算を適切に実施できない可能性があります)

予測の役に立たないノイズを減らし、真に必要なシグナルを学習させることによって予測精度の向上が期待できます。

ニューラルネットワークなどの利用

今回は、比較的容易に導入できる機械学習アルゴリズムとして、ランダムフォレストとサポートベクターマシンを採用しました。当然ながら、機械学習アルゴリズムは他にも様々なものが開発されており、今回のデータや目的に合致して良い成績を出せるものが存在するかもしれません。

例えば、生物の神経ネットワークで起こる学習のメカニズムを模倣した「ニューラルネットワーク」という手法が広く活用されています。従業員が離職するかどうかは、おそらく、「AとBの条件を満たせば離職する」といった単純なルールではなく、多くの要素が絡み合った複雑な事象であると考えられます。そのような複雑な課題に対しても、ニューラルネットワークは高い精度で予測を実現できる可能性があります。

改善、改良を重ねていくデータ分析

今回は、AI、機械学習の手法を使って、人事データから離職者の予測を行う流れを紹介しました。基本的なアルゴリズムに手持ちのデータを投げ入れただけでは、満足できる予測精度が得られないことがあります。

実際のデータ分析でも、前回の記事や今回の記事で紹介したようなプロセスを繰り返していくことによって、ビジネス上有益な情報を引き出せるよう、改善、改良を重ねていくことになります。

将棋界と藤井聡太七冠から見える「デジタルネイティブ」と「デジタル技術の使い方」

デジタルネイティブという言葉は、ざっくりと「デジタル技術を当たり前のものと考えられる」といった性質を指して使われることがあります。代表的な用法には、1990年代~2000年代に生まれた世代を、幼少期からデジタル機器がある生活をしてきたことから「デジタルネイティブ世代」と呼ぶ例が挙げられます。近年、この世代が社会で活躍するようになったタイミングに合わせるように、社会全体のデジタル化という大きな流れが作られています。

この記事を執筆している2023年6月時点では、「デジタルネイティブ」の意味は大きく拡大しつつあります。この記事では、技術の進歩に合わせて変容を続ける「デジタルネイティブ」像の現状と、将来の展望について考察します。

ネイティブとは?

デジタルネイティブについて考える前に、ネイティブという言葉の意味を確認しましょう

ネイティブ=native とは、英語で天然の~、生来の~のような意味を持ちます。よく耳にするのは、ネイティブランゲージ(母国語)やネイティブスピーカー(ある言葉を母国語とする人)という用法です。

言語習得の態様は年齢によって異なり、幼少期における言語の習得と、大人になってからの言語の学習の違いは広く認識されています。幼少期から触れてきた母国語では、ほとんどの人が微妙なニュアンスに至るまでその言語を自由に扱えるようになります。一方で、大人になってからその言語を学び始めた場合、同じような水準に達するまでに多大な努力を必要とするだけでなく、感覚的な部分を完全に習得することは極めて困難です。

このように、人間の脳には知識や感覚を習得するためのゴールデンタイムが存在し、その時間で獲得した能力には、大人になってからでは獲得することが難しい性質を含むと考えられています。

従来のデジタルネイティブ世代のイメージ

1990年代~2000年代初め頃には、家庭用PCとインターネットの普及が進みました。この時代にはPCの操作性の向上が進み、特別な知識が無くてもデジタルデータを取り扱うことが可能になりました。この時代のデジタル技術の中心は、情報の電子的記録とテキストベースのコミュニケーションで、デジタル文書を電子メールなどよって遠隔地の相手に瞬時に伝達する機会が増えました。

2000年代後半以降は、動画配信サイトやマルチメディアファイルを取り扱えるSNSの発展と、デジタルカメラ機能が付いたスマートフォンなどのデバイスの発達が相まって、デジタルデータを用いたコミュニケーションが爆発的に拡大しました。

これらの時代に教育を受けた世代は、PCやスマートフォンを難なく使いこなし、新たに開発されたデジタル技術やサービスの利用にも積極的です。結果として、デジタルを活用して効率的、効果的に仕事を進めるスキルが高い傾向にあります。

AI時代のデジタルネイティブ

従来から情報の記録や通信など、人間の行動を効率化するために使われる機会が多かったデジタル技術は、現在、人間の判断を高度化するために使われ始めています。この原動力になっているのはAIやデータ分析のような、複雑な状況に対してある種の判断を提示する仕組みです。

単純な計算能力(スピード、正確性)では人間はコンピューターに太刀打ちできないため、数値の集計や比較にデジタル技術を使うのは当然のことになっています。そこから一歩進んで、近年のAIやデータ分析は人間が判断の過程を定式化できない、直感のような領域で驚くような情報を提供してくれることがあります。

このような時代におけるデジタルネイティブとは、単にデジタル機器を使いこなし、デジタル技術を積極的に取り入れるマインドを持つだけにはとどまらない可能性があります。

具体的には、AIやデータ分析によって得られる情報を前提として、人間の判断能力の限界を拡張していくスキルを習得することが考えられます。

人間の脳の情報処理能力には限界があり、科学的トレーニングを積んだとしても、コンピューターのようにはできません。しかし、人間の脳の長所、短所と、AIやデータ分析の長所、短所を理解していれば、それらの弱点を補いつつ長所を生かした高度な判断に期待できます。

デジタル技術による高度化の例

ここまでの内容について、なんとなくイメージは分かるものの、具体的にビジネスに落とし込むのは難しいと感じるかもしれません。そこでこの記事では、プロセスとその結果の関係が比較的分かりやすい将棋を例に解説します。デジタル技術の活用法だけでなく、デジタル技術を取り入れる段階で人間が直面する葛藤のようなものも参考になると思います。

情報のデジタル化による効率化の段階

将棋には長年にわたる研鑚の歴史があり、江戸時代には幕府の保護下で専業の将棋指しを中心とした研究と競争の仕組みが出来上がっていました。大正から昭和にかけて将棋指しの団体が作られ始め、現在まで続くプロの将棋指しの形が出来上がります。

この間、偉大な先人達の創意工夫によって将棋のレベルは高められてきていましたが、1990年頃に大きな転換点を迎えることになります。

この中心になったのが、後に国民栄誉賞も受賞することになる羽生善治さんら、当時20歳ぐらいの若手棋士達でした。それまでのプロ棋士には勝負師や芸術家に近い気風が強く残っていましたが、当時の若手棋士らは徹底した事前研究による緻密な戦術を次々と導入し、棋界を席捲することになります。

この時力を発揮したのが、当時まだ珍しかったコンピューターを使った研究法です。プロ同士の対局の内容(棋譜)は紙に記録されて保管されており、紙媒体の資料を収集、整理する手間が研究の効率を制限してしまっていました。

そこで、棋譜をデジタル化したものをフロッピーディスクなどの記録媒体に集約管理することで、効率的かつ体系的な研究が可能になりました。若い世代の研究量を活かした将棋は、当時のベテラン棋士からパソコン将棋やコピー将棋と呼ばれることもあったようです。

この段階では、デジタル技術が効率化のために使われており、あくまで人間の判断材料を効果的に提示する機能に重点が置かれています。

この傾向に変化が出るのは将棋AIが人間を超える2010年代中頃に入ってからです。羽生さん達の世代は1990年頃から20年以上将棋界のほとんどのタイトル戦(大会のようなもの)で支配的な成績を残していましたが、2010年代中頃から世代交代が急速に進んだことも印象的です。

AIが人間を超えた2010年代以降の段階

2000年代中頃には、相当な実力をもった将棋AIが誕生し始めています。現在ではAIが人間を凌駕することは不思議なことではないと認識されていますが、当時、人間の知性の到達点のようなプロ棋士がAIに負けることは、プロ棋士の存在価値を脅かすのではないかという危惧もあったようです。2007年にトッププロが対戦して以降、公の場でプロ棋士が将棋AIと対戦する機会は制限されていました。

その間も将棋AIは進化を続け、2010年頃には女流棋士(いわゆるプロ棋士とは異なる制度)や引退棋士との対局で勝利を収めています。

2013年に行われた第2回将棋電王戦では、ついに現役のプロ棋士と将棋AIの真剣勝負が実現します。この大会は5対5の団体戦方式で行われ、結果はプロ棋士から見て1勝1分け3敗というものでした。

トッププロを含むプロ棋士が将棋AIに敗れたことは大きなニュースとして取り上げられましたが、一方で将棋AIの弱点や欠点も現れた大会で、人間に優位な点があることも再認識されました。

その後もプロ棋士と将棋AIの対戦は続けられ、2017年には当時プロ棋士の頂点に立つ「名人」でもあった佐藤天彦叡王と将棋AIとの対戦で一旦終止符が打たれることになります。この時点では、将棋AIの優位は間違いないと考えられていましたが、人間のトップが公の場でAIに敗北するという象徴的な出来事になりました。

この時代になると、プロ棋士とデジタル技術の付き合い方にも大きな変化が生じます。強力なAIはスパーリングパートナーとして活用されるだけでなく、人間の発想や研究をサポートする役割を担い始めたのです。人間が疑問に思ったポイントでAIの考えを参照し、それをさらなる深い思考の呼び水とすることができ、従来の常識にとらわれない新しい発想に基づく戦術が生み出されていきます。

ちなみに、現在将棋界で圧倒的な戦績を挙げている藤井聡太さん(2002年生まれ)は、日々の研究にAIを活用していることが知られています。もちろん他のプロ棋士もAIを研究に取り入れていますが、将棋はあまりに可能性が広いためAIを用いた事前研究でも全ての局面に対する解答を準備することはできません。最も若い世代のプロ棋士であり、将棋の感覚を養う期間に強力なAIが存在していた藤井さんは、他の棋士に比べてAIが提供してくれる情報を、自らの能力として取り込む能力が高い可能性があります。結果として、単なる解答の丸暗記とは次元の異なる成果を手に入れ、未知の局面に対しても正しい判断ができるのではないでしょうか。

羽生善治九段インタビュー “七冠”挑戦…藤井聡太竜王への思い AI時代のプロ棋士とは

急速に発展するデジタル技術への戸惑い

将棋は明確な結果が突き付けられるゲームであるため、優れた方法の導入が進みやすい傾向があります。しかし、それでも新しい技術に対して人間が見せた葛藤は、ビジネスにAIやデータ分析を取り入れる際にも参考にできそうです。

人間の経験や知識に対する自負

初期段階ではパソコンなんかに負けない、といった自負心が現れます。これは時に、デジタル技術を使う方法やその方法を採用する人を軽く見る、といった行動として現れることがあります。

新しい技術に対する恐れ

デジタル技術やAI、データ分析による成果が客観的に期待できる状況になると、自分の存在意義が否定されるのではないか、という恐れが生じることもあります。この感覚は、新しい技術をフラットな視点で評価することを難しくしてしまいます。

ある種の諦めと積極的な活用

現代において、車より早く走れないことを恥じる人は(おそらく)いないでしょう。ある課題に対して、優れたテクノロジーが良いソリューションを提供することは当たり前のことです。そのテクノロジーの存在を前提として、人間自身の能力を最大限発揮する方法を確立できれば、かつてない大きな成果につながる可能性もあります。

これからのデジタルネイティブ

ここまで解説したように、現代のデジタル技術は単に効率化を図るためのものにとどまらず、人間には難しいような判断も提供する存在になりつつあります。一般的に、この判断は絶対に正しいものではなく誤謬や限界を含むものですが、それでも適切に活用すれば人間の判断力を拡充することはできるかもしれません。

新しいテクノロジーが人間の役割を変化させてしまうことを恐れず、あらたな成長の可能性としてとらえることができる人材こそ、これからの時代のデジタルネイティブと言えるでしょう。また、メタ的な視点にはなりますが、数年単位で大きく進化するデジタル技術と上手く付き合うためには、常に考え方の枠組みを自由に組み立てなおす能力も重要かもしれません。

企業が直面しやすいデータ分析の課題

社会のあらゆる部分でデジタル化が進んでおり、私たちの行動に伴う莫大なデジタルデータが生み出され続けています。ビジネス分野でもデータの活用が重要な課題と認識されるようになりましたが、実際に満足できるデータ活用を実現している企業は少ないと言われています。 この記事では特に、これからデータの活用を進めていこうとする企業が直面しやすいデータ分析の課題について解説します。

データ分析を始めようとする企業へ

ひとえに「企業」といっても、専門的なデジタル人材を多数確保している大企業から、デジタル化が進んでいない業種の中小企業まで、さまざまなタイプが存在します。

この記事では、これからデータ分析を始めようとする企業を対象とします。

具体的には、データ分析を事業上の活動として立ち上げるために求められる知識、スキルを持ったスタッフを確保できておらず、データの活用に関する検討を進めている段階としています。最近では高度な統計的分析が可能なツールも利用可能になってきていますが、利用法によっては誤った結論に誘い込まれるリスクもあります。それらのツールを使う人間は、使用するデータや分析法の意味や適用範囲を正しく理解する必要があります。

企業のデジタルデータ活用の現状

企業規模によるデジタルデータ活用の違い

総務省が公開している情報通信白書によると、なんらかの分野でデジタルデータを活用している割合は、大企業で約90%、中小企業で約56%となっています。特に中小企業において、データ活用の余地が大きいことが分かります。

企業規模とデータ活用のレベル

同じく情報通信白書では、データの使い道についても調査がなされています。

これによると、データの閲覧や簡単な集計といったレベルのデータ活用は、中小企業においても大企業と遜色ない程度で行われているようです。

一方で、やや進んだ統計的な解析(相関分析や分散分析など)を行っている割合は大企業で約60%、中小企業では約30%まで落ちています。さらに進んで、機械学習やディープラーニングなど人工知能を活用した予測を行っている割合は大企業で約18%、中小企業では約4%にとどまっています。

データの分析手法にみる企業規模レベルの差

データの入手経路

企業が分析に活用しているデータの入手経路にも顕著な傾向がみられます。7割を超える企業で社内データ(自社の業務活用によって生成、収集されたデータ)を活用しているのに対し、外部データ(他社からの購入、オープンデータ、共同研究やアライアンスによって入手したもの)を活用している割合はおおよそ30%以下となっています。

データの入手経路

外部で収集されたデータには、自社データとは異なる視点から新たな情報を提供してくれる可能性があります。例えば、これから新しい事業展開を見据えている場合などにこそデータに基づいた検討が有効ですが、その検討に使用するデータは既存事業で得られたもので十分でしょうか?データ分析で検討したい対象に適したデータを入手するためには、外部データの活用も含めた幅広い選択肢を検討することが重要です。

データ活用に向けた課題

上記の現状を踏まえると、企業のデータ活用には次のような問題が浮かび上がります。

  1. 簡単な集計を超えた統計的な解析やAIによる予測が進んでいない。
  2. 使用するデータが社内で収集していたデータに限られている。

これらの問題の克服にはどのような方策が考えられるでしょうか?

データ活用に向けた課題に対する方策

単なる集計にとどまらないデータ分析に取り組む

一般的な表計算ソフトや経理ソフトを使用すれば、日々の売上や支出、それらを集計した財務状況に関するデータを得ることは難しくありません。実際にほぼすべての企業で、これらのソフトによってデジタルデータが取り扱われています。

しかし、一般的な表計算ソフトや経理ソフトで行う定型作業のレベルを超えてデータを活用するためには、知識、スキルを持つ人材の確保が課題になります。ビジネスの分野で活用できるデータ分析には、統計学や数学的知識、プログラミングの技量も重要ですが、それらの知識、スキルをビジネス上の課題(経営、財務、マーケティング、生産管理など)とすり合わせることが重要です。単に理系の学部を卒業した人材であれば良いということでもなく、社内での育成にも長い時間とコストがかかります。

そのため、データ分析の導入を検討している段階や、これからデータ分析を始める企業にとっては業務委託などの手段による外部人材の利用が効果的です。その際には、技術的要素だけでなく自社のビジネス課題を理解できるパートナーを選定することが大切になります。技術的に優れたエンジニアであっても、事業の本質を捉えられずに、企業から見るとピントを外してしまう事例が多く知られています。

データ収集能力を強化する

データ分析の成果に大きな影響を与えるのは、分析の対象とするデータの質と量です。

データの質とは、「有効な要素が含まれているか」、「分析結果をかく乱するノイズが含まれていないか」といったイメージです。企業にとって役に立つ情報を引き出すためには、その情報につながる要素を含んだデータを集める必要があります。

また、基本的にデータはノイズを含んでいる(バラついている)ため、ある程度のデータ量を集めてバラつきの情報を取り除く必要があります。

すでに収集してあるデータ(売上や財務情報など、自社の業務活用によって生成されるものなどが代表例)をデータ分析に用いる場合には、保有しているデータからどのような情報を生み出せるのかを検討することが重要なステップになります。

データが収集された経緯によってはデータに歪みや偏りが含まれている可能性があり、データ分析結果の解釈を誤らせてしまう危険性もあるので注意が必要です。データの歪みや偏りの単純な例を挙げると、購入者の特性を調べるためのアンケートのデータが実際の購入者像を示していないケースがあります。原因として、購入者の中にアンケートを回答しやすい層(性別や年齢、顧客ロイヤリティなどによる)と回答しにくい層が存在することが考えられます。

また、データ分析を見据えたデータ収集を行えると、さらにデータ活用の幅が広がります。具体的には、ビジネス上の検討材料として○○の情報が欲しい、このような判断にAIを利用したいといったビジョンを定め、そのためにどのようなデータが必要であるかを考え、実際にデータ収集の仕組みを構築するような取り組みが該当します。

例:景気循環における値引きキャンペーン効果の情報が欲しい

景気循環における値引きキャンペーン効果の情報が欲しいという場合は、景気の指数と値引きキャペーンにおける売上成長率のデータが必要になり、景気の指数が異なる複数のデータは必要になります。

景気による値下げキャンペーン効果

データ収集の手段としては、自社システムの改修やWeb上のデータを探索する、またはWebやアプリを介して情報を収集する方法が想定され、ある程度プログラミングなどの専門知識が必要になることもあります。

まずはデータ分析の可能性を知ることが重要

ここまでは、データ分析を始める段階で企業が直面しやすい具体的な課題について解説しました。

それらの課題に比べると抽象的ですが、そもそもデータ分析やAIによって何ができるのか、どのようなメリットを追求できるのかを理解することも重要です。

近年では「AI」という言葉がニュースになることも多く、あらゆる問題を解決できる魔法のようなイメージを持ってしまいがちです。実際にはAIやデータ分析でできることは限られていて、その範囲で得られる情報で課題を解決可能か(できるとすればどのような手段で実現できるか)を判断しなくてはなりません。

適切に課題と解決手段を設定できれば、データ分析やAIは人間の判断力をさらに高める働きを発揮します。

例えば、人間を凌駕する能力を獲得した将棋や囲碁のAIは、数百年の研究を経て形成された人間の感覚や定石を急速にアップグレードさせています。まだAIがとても弱かった時代から将棋界のトップを走り続けてきた羽生善治九段は、「今後の将棋界では、いかにAIから棋士が学習するか、AIに自分の才能や能力を引き出させるかが重要になっていくでしょう。」と語っています。

今後の将棋界では、いかにAIから棋士が学習するか、AIに自分の才能や能力を引き出させるかが重要になっていくでしょう。その方法はまだ誰も確立していないので、5〜10年かけて見つけていくことになるのですが、おそらく若い世代の人たちのほうが見つけやすいでしょうね。将棋ソフトだけで対局を積み重ねているような子供たちも増えていますし、AIがあるのが当たり前という世代こそが、将棋のさらなる進化を担っていくことになると思います。

羽生善治九段が語る「AIで進化する将棋界」 ディープラーニングで「棋譜記録」が変わる|リコー

人間を凌駕する能力を獲得した将棋や囲碁のAI

ビジネスにおいて多くの知識、経験を蓄積してきたと自負する方も、新たな思考法や判断基準を獲得する方法の一環としてデータ分析やAIを活用してみてはどうでしょうか。

データ分析の課題を乗り越えた先

近年、デジタルデータを活用する技術的基盤が整備されてきましたが、企業が実際にデータを活用するためには人材の問題や、分析に適したデータの収集の問題が大きな課題となっています。また、データがもたらすメリットやその活用の限界を理解し、事業に取り込んでいくビジョン形成をゼロから進めることも容易ではありません。

これからデータ分析やAIをビジネスに活用したいと考えている方は、まずは外部の専門家と連携して上記課題の克服することが有効です。データ分析やAIは万能の魔法ではありませんが、上手く利用すれば人間の判断力を大きく飛躍させる強力な手段になります。データがビジネス上の重要な決断を支え、事業のさらなる成長を促します。

弊社では、データ活用に関するクライアントの状況に応じたサポートを提供しています。現在お困りの場合、またはこれから始めたいけどどうしたら良いか悩んでいるケースでもまずはお気軽にお問合せください。

Pythonを使ったデータ分析

近年、コンピューターを使って大量のデータを簡単に収集、分析できるようになり、AIに代表されるようなデータを活用する方法が急速に発展しています。いまや事業上の意思決定の場面で、各種のデータに基づいた分析によって判断の精度を高めることは当たり前になってきています。

この記事では、データ分析の目的でよく使われる「Python」というプログラミング言語について、なぜデータ分析にはPythonが良く使われるのか、どのような使い方ができるのか、といった視点から解説します。

Pythonとは

Pythonはプログラム言語。

Pythonは、コンピューターが行う処理の手順を定めるプログラムを書くためのプログラミング言語です。Pythonそのものが何かの分析をしてくれるのではなく、利用者が思い描くデータ分析をコンピューター上で実現するための基盤を提供します。

利用者がPythonのルールに従ってプログラムを書くことで、データ分析手法に関わるあらゆる機能を使うことができます。

Pythonの特長

データ分析におけるPythonの特長には以下のようなものが挙げられます。

データ分析に必要な機能が非常に豊富

Pythonでのデータ分析に役立つ機能をまとめたもの(ライブラリ)が世界中の人によって提供されています。利用者自身で難しい数式などを取り扱う必要はほとんどなく、シンプルなプログラムで複雑な処理を実現できます。

python library 一覧

データの収集、管理からAI開発まで幅広い工程に対応できる

データ分析は、データの収集、整形、検討などの事前処理と分析、さらにはプレゼンテーションといった事後処理などの複合的なプロセスです。

Pythonは、個々のデータの収集から大規模に蓄積されたデータの取り扱いまで、あらゆる局面で利用できる強みがあります。また、分析に役立つ解析法のライブラリも充実しているので、さまざまな分析手段を自身が保有するデータに合った形で試すことができます。

(比較的)初心者でも扱いやすい

プログラミング言語には様々なものが存在しますが、Pythonは比較的初心者でも理解しやすくなっています。良く使う計算法や処理をまとめたライブラリを活用できるため、ほんの数行のコードで驚くほど複雑な処理が実現できます。

Web上で利用法に関する情報が見つけやすい

Pythonはデータ分析やAI開発に広く使われており、Web上にはPythonに関する情報が非常に豊富です。エラーメッセージへの対応や初心者がつまずきやすいポイントについて、詳細な解説を簡単に見つけることができます。

Pythonエラーメッセージ

無料で利用できる

PythonはWeb経由で簡単にインストールすることができ、無料で利用できます。導入費用をかけずにデータ分析を始めることができるので、例えば手持ちのデータについての初期的検討を行いたい時に特に適しています。

Python利用に関して注意すべきポイント

Pythonはデータ分析に役立つ優れたツールであることは間違いありませんが、効果的に使うためにはPythonのウィークポイントの理解も重要です。

データ可視化の工夫が重要

Pythonでは、データ分析結果を表示するためのグラフ作成機能が利用できます。グラフに描画する内容はプログラムで詳細に指定できますが、逆に考えると、プログラムで指定する負担があるとも言えます。

利用者ごとに知識・スキルのギャップが生じやすい

多くの事業者で利用されている表計算ソフトに比べて、Pythonに関する知識・スキルには個々の利用者による差が大きくなりがちです。複数の担当者がデータをPythonで取り扱う場合には、丁寧なコミュニケーションが求められます。

Python or BIツール?表計算ソフトで十分?判断のポイントは?

Python以外にも、企業で行うデータ分析にBIツールや表計算ソフトが利用されることがあります。これらの方法はどのようなケースに適しているのでしょうか?

Pythonが適しているケース

手持ちのデータを使って本格的にデータ分析を始めるケース

これまでの事業で蓄積されたデータの新たな活用可能性として、データ分析を行う場合にはPythonの利用が適しています。もともとデータ分析を想定せずに蓄積されたデータの場合、データ分析に適した形に調整する必要が生じることがあります。Pythonでは個々のデータの乱れ方(記述の揺らぎ、欠損、重複、あるいはこれらの複合)に合わせて細かくデータ整形処理を行うことができます。

整形されたデータはそのままPythonで分析できるので、初期コストを抑えてデータ分析の有用性を検討することができます。大規模なデータ収集や分析には多大なコストが必要になるので、まずは小規模なデータで整形と分析を試してみることが大切です。弊社では「データは保有しているけど分析に使えるかわからない」という段階からサポートいたします。

独自のAI開発を見込んでいるケース

データ分析の高度な利用法の一つに、データを基に判断するAIの開発があります。AIであれば、人間には到底扱えない莫大なデータを考慮することもできます。

PythonはAI開発に役立つライブラリが豊富に用意されているので、データの下処理後シームレスにAI開発につなげやすいメリットがあります。

非定型的な分析を行いたいケース

BIツールや表計算ソフトには、よく利用される定型的な分析法を簡単に行う機能があります。定型的な分析法はすでに実用性のコンセンサスが得られているものが多く、プレゼンテーションでの説明が容易です。例えば、売上や支出のデータを使って事業の状況を示す指標を算出する分析法が挙げられます。

一方で、定型的な分析法では個別の状況によって異なるデータの特性を適切に評価できない可能性もあります。また、独自性の高いデータの場合、そもそも定型的な分析法が確立されていないこともあります。そのような場合、独自の分析法(定型的なものの組み合わせ、アレンジ、もしくは全く異なる計算法など)の利用が効果的です。

Pythonであれば、非常に細かい計算から組み立てることができるので、オリジナルの方法を含めたあらゆる分析が可能です。

BIツールが適しているケース

ある程度形が整ったデータを保有しているケース

データウェアハウスが整備されている、もしくは普段からある程度詳細なデータを記録している場合、BIツールを使って簡便に処理が可能です。

例えば、日毎、月毎の売上や支出、財務情報に関するデータはBIツールとの相性が良いと言えます。正確な決算のために、一般的にこれらの情報は抜けや漏れ、重複が無い状態に保たれています。また、扱うデータを数値に限定すればデータの形に齟齬が生じにくくなります。

表計算ソフトで十分なケース

  • データ規模が限定的なケース

良く使われている表計算ソフトは、基本的なデータ処理機能を備えています。大量のデータを取り扱う場合、データ処理速度が問題になることがあり得ます。

  • データ分析の知見がある担当者を用意できない場合

表計算ソフトでは対応が困難な処理や、AIによる分析を行う場合には、ある程度知識・スキルのある人材の配置が重要です。ツールにデータを入力すれば分析結果は出力されますが、データの下処理や分析方法の妥当性を判断できない場合、適切でない結論に誘導されてしまうリスクがあります。

Pythonを使ったデータ分析のリソースの選択

Pythonはデータを詳細に、かつ大量に取り扱うことができ、データ分析を行う企業にとって強力なツールです。

しかし、これからデータ分析を始めようとする企業にとって、自社のデータの本質を理解でき、かつPythonも扱える人材を確保するのはとても高いハードルです。単にプログラミングができるというだけでは、事業に活きるデータ分析を実施することはできません。弊社では、クライアントの事業とデータを包括的に理解し、実用的なデータ分析を行うためのサポートを提供します。

データ分析に興味はあるが、まだ具体的なイメージがないという段階でも、まずはお気軽にお問い合わせください。