Sony Network Communications

Prediction One

HOMEブログAI(機械学習) > 機械学習とは?初心者でも理解しやすく簡単解説!

AI(機械学習)2020/03/23

機械学習とは?初心者でも理解しやすく簡単解説!

「機械学習によって業務の効率化や売上アップができないか」「自社データを機械学習に有効活用できないか」など、機械学習に注目する企業が増えています。

この記事では、機械学習とは何か、機械学習で実現できることなどをわかりやすく解説します。具体的な企業の事例や機械学習を使うために必要なスキルなども紹介するので、機械学習を活用したい場合はぜひ参考にしてください。

機械学習とは?

機械学習とは、簡潔にいうと「機械(コンピュータ)が事例・経験から学習すること」を意味します。AI(人工知能)技術の一分野が機械学習です。

事例となるデータをコンピューターに学ばせることによって、そこに潜むパターンや法則を見つけ出します。学習システムの核となるアルゴリズム(手法)は人間が設計しますが、学習自体はコンピューターが自ら行い、データが蓄積されるほど精度が上がることが特徴です。

機械学習を利用すれば、過去の事例分析だけでなく将来予測も可能になります。たとえば、新たな顧客の購入履歴や年齢、性別を入力すれば、パターンに基づいて将来の離脱率などを求めることが可能です。

機械学習が重要な理由と、何が出来るか

なぜビジネスの効率化や新規ビジネスの開拓などで、これほど機械学習が注目されているのでしょうか。機械学習が重要とされる理由と活用方法を解説します。

機械学習が重要な理由

機械学習が重要な理由は、大量でかつ複雑なデータをコンピューターが自動的に分析してくれることにあります。大量のデータを処理できるので、人ができない量の処理を任せられたり、人がとらえきれない量のデータから予測や知識を見つけたりすることができます。

たとえば、企業が顧客の声を分析したいときに、大量のアンケートをチェックする必要があるとします。しかし、人間がやる作業では大量の回答を読むだけでも多くの時間を必要とします。一方、コンピューターの機械学習は人間よりはるかに短い時間で処理を行えます。自動的に、大量のアンケートの中からテキストを分析して一定の内容を含んでいるかのパターンを見つけたり、頻出ワードから特徴を見つけ出したりすることができます。

機械学習で何が出来るか

機械学習ができることはシンプルで、分類と数値予測です。これだけで実に様々なことが実現できます。

分類について説明します。分類とは入力したデータに対して分類ラベルを割り当てることです。例えば、画像に対して「猫」や「犬」といったラベルを付与できます。また、顧客Aのデータに対して、「半年以内のサービス購入」や「半年以内の退会」というラベルも推定できます。

数値予測について説明します。機械学習では回帰とも呼ばれます。回帰はデータに対して数値を予測することです。例えば、店舗の過去の来店数のデータから来週の各日の来店数を予測することができます。

こうした分類や数値予測は経験や例外などを考慮する必要があるため、人間が得意なタスクでコンピューターには難しいものでした。しかし機械学習の事例から学習する能力によって、コンピューターも人間と同等以上に分類や数値予測ができるようになってきています。

機械学習の分類わけ

機械学習とは機械が学習することですが、機械が学習するための「教師」という概念があります。それにより、機械学習は「教師あり学習」「教師なし学習」「強化学習」の3つに分類されます。

これらの違いとなっているのは、どのようなデータをコンピューターに入力するか、ということです。それぞれの機械学習について解説します。

教師あり学習

教師あり学習の場合は、インプットするデータに対してどのようにアウトプットすべきかを学ばせる方法で、はじめにデータと正解を機械に学習させます。教師が教えた正解に合わせてルールを導き出す学習方法ともいえるでしょう。分類や数値予測が可能です。

たとえば、画像のなかの猫と犬をコンピューターに区別させたい場合は、猫の写真と「これは猫」、犬の写真と「これは犬」ということを大量にインプットします。機械学習が進めば、猫と犬の特徴を学習した機械が正解を導き出せるようになります。

教師なし学習

教師なしの学習の場合は、正解を教えずに大量のデータをインプットして、特定のパターンを機械自らに発見させる機械学習です。この機械学習がうまくいけば、たとえばネットショッピングの膨大な顧客の購入履歴のなかから、特定のグループをみつけ出すことなどが可能となります。

大手ネットショッピングサイトを利用した際、自分好みの商品が表示された経験はないでしょうか。これらのサイトの裏では、教師なし学習で機械学習をしたシステムが動作しており、顧客をグループ分けしているからです。このように、教師なし学習は特定の集団を検出して分類する「クラスタリング」によく用いられています。

強化学習

強化学習といわれている方法は、正解を教えずにデータを入力する点は教師なし学習と同じです。ただし、直接的に答えを教えないものの課題や目標などを与え、行動の結果に応じて報酬や罰に相当するフィードバックを行って機械学習させます。

これはペットの調教をイメージするとわかりやすいかもしれません。犬を調教するときのように、お手をすれば餌がもらえる、お手をしなければしつけをされるようなデータとフィードバックをセットにした入力を繰り返します。こうして、ある環境ではこういった行動をとると報酬がもらえるということが学習され、自律的に行動選択できるようになります。

データマイニング、ディープラーニングとの違い

機械学習の関連用語としてよく使われるものは、データマイニングとディープラーニングです。この2つの用語も理解しておくと、機械学習への理解がより深まるでしょう。どちらも機械学習の一種ですが、用いられるアルゴリズムや技術が違います。

データマイニングとは、教師なし学習のクラスタリングやその研究分野を指す言葉です。一方、ディープラーニングは機械学習を次の段階に進めた技術や研究分野のことで、自らデータを解析し、パターンや法則を抽出できる機械学習のことをいいます。それぞれ詳しく解説します。

データマイニングとは

データマイニングとは、大量のデータの中からパターンやルールを発見することで、教師なし学習のクラスタリング(探索的データ解析方法)やその研究分野を意味します。クラスタリングは特に見込み客や顧客層の分析に用いられ、CRM(顧客関係管理または顧客管理)を行うための技術やツールとして用いられることもあります。

ただし、データマイニングは統計的なアプローチであり、因果関係に基づくわけではないことが多くあります。十分なデータ数がないと無意味なクラスタリングが行われることもあるので注意が必要です。

ディープラーニングとは

ディープラーニングとは、高度な機械学習のことです。動物や人間の脳神経回路をモデルとしたアルゴリズムが多層的に使われており、十分なデータがあれば自動的にデータから特徴やパターンを抽出できます。

企業が採用しているディープラーニングのAIは、現状では人間の知能のように柔軟で汎用的なものではなく、ある業務を対象とした特化型がほとんどです。「ディープラーニング=AI(人工知能)」と勘違いしている人も多いですが、「AI>機械学習>ディープラーニング」という入れ子の関係となっています。

機械学習が使用されている身近な事例

機械学習には難解で抽象的な面があることは確かです。そこで、機械学習が導入されている身近な事例を取り上げながら、特徴や機能、メリットなどを具体的に紹介します。

オンラインショップのレコメンド機能

世界大手の音楽配信会社Spotifyでは、ディープラーニングによるレコメンド機能を搭載しました。従来はユーザーのなかで再生した曲が重なる人たちをみつけ出し、似た趣味を持つと思われるグループを作っていました。ある人に曲をリコメンドするときは、同じグループの人たちの再生リストからその人がまだ再生していない曲を選ぶという方法です。

この方法の弱点は、ユーザー分析は行っていても曲自体の分析を行っていないことです。そのため、リコメンドにバリエーションがなく、いつも再生回数の多い人気曲ばかり紹介してしまう傾向がありました。

そこでSpotifyではディープラーニングを採用し、曲そのものを機械学習させて類似度を判定し、リコメンドするようにしました。それにより、曲紹介にバリエーションが生まれ、マイナーな曲や新しい曲も注目してもらえるようになったのです。

自動運転(Googleのロボットカー)

Googleのロボットカーなど自動運転技術が急速に発展しており、近い将来には完全自動運転が実用化されるとみられています。その根底にあるのは、ディープラーニングによる画像認識技術です。人間でいえば認知にあたるプロセスを、画像認識技術によって実現しています。

そもそもディープラーニングが脚光を集めるきっかけとなった出来事は、この技術が画像認識コンテストで抜群の成績を収めたからです。ディープラーニングのシステムを採用した開発チームは、人が作ったアルゴリズムを大幅に上回る精度を実現し、ブレイクスルーを起こしました。高度な自動運転をするためには画像認識コンテストより遥かに膨大な走行データと世界中の周辺環境データが必要です。

Googleはこうしたビックデータ解析技術とAI開発にかけてはトップクラスであり、自動車業界に変革をもたらすだろうといわれています。

その他事例

金融業界においては不正利用検出やマーケット分析に機械学習を取り入れています。融資の際に行う査定の精度向上や自動化などにも、機械学習させたシステムが稼働しています。

医療分野へも機械学習の導入が進んでいます。たとえば、多くの人がウェアラブル端末を医療システムへつなぎ、異常を検知したり病気を予防したりできるようになっています。これも大量のデータを短時間で処理できる機械学習のツールがあるからこそ実現できる事例です。

その他にも、Facebookでは機械学習を活用して、顔認識による自動タグ付けや問題のあるコンテンツを発見するなどしており、適応分野はさまざまです。

機械学習はどうやって勉強する?自分で行うには?

機械学習を活用するためには、機械学習についての勉強が欠かせません。昨今では需要も高まってきています。ここでは機械学習の勉強法について解説します。

プログラミングを学ぶ

機械学習を活用するためには、プログラミングができた方が自由度が増します。市販のAIツールを使用する場合でも、機械学習用として入力できるように「データ前処理」をプログラムで処理させることが多いからです。

あまり多くはないですが機械学習のアルゴリズムを自社で実装する場合には、プログラミングの知識が欠かせません。具体的にはPythonやRといった言語があります。自ら開発するにはプログラミングの知識だけでなく数学や統計学などの知識も必要です。

既存の機械学習ライブラリを使う

機械学習ライブラリとは、よく行う処理をプログラミングコードでパッケージ化しているもののことです。パーツを組み合わせるようにして大きなプログラム、ソフトウェアを作ることが可能です。

機械学習アルゴリズムを自分でプログラムを書くことは難易度が高いので、できるだけ既存の機械学習ライブラリやコードを使って書くようにするとよいでしょう。

機械学習に特化した既存のアプリケーションを利用する

専門外の方がプログラミングを学ぶところから始めると、機械学習の活用までにかなりの年月を要するでしょう。そのため、既存のアプリケーションを利用することがおすすめです。機械学習を用いて将来の結果を予測分析したい場合や、機械学習で業務効率化や売上向上を目指す場合など、既存アプリで対応できる業務は多くあります。

専門的な知識が少なくて済むように工夫されていて、トライアルの可能なアプリがよいでしょう。すでに実績があるものであれば、予想と結果が違った場合でも「機械学習のさせ方」や「ツールの誤作動」などのよくある問題にさかのぼって検証できるのでコストがかかりません。まずは通常のパソコンで動作するアプリやソフトウェアから試してみてはどうでしょうか。

まとめ

機械学習とは、データから機械に学習させることです。すでに音楽配信のリコメンド機能や車の自動運転など非常に多くの領域で実用化が進んでいます。機械学習技術の発展、データの増加などの流れがあり、今後さらに実用化が進んでいくでしょう。

専門的な知識は少ないものの、機械学習で自社のデータを分析したいと考えている企業の担当者は、ソニーが提供する「Prediction One」の利用を検討してみてはどうでしょうか。統計や機械学習についての最低限の知識があれば、数クリックで高度な予測分析が可能です。

tag

Prediction One お申し込みフォーム

留意事項

  • ・ご入力いただいたメールアドレス宛にダウンロードリンクを送付いたします。
  • ・必須項目は必ず入力・選択してください。
  • ・入力の際は下記の文字を使用すると正しく送信されませんので、ご注意ください。
    (半角の : < > " ' \、半角カナ、機種依存文字)
PAGE TOP