
- 機械学習ってなんだろう?
- 人工知能と機械学習ってどんな関係?

人工知能について調べると必ず出くわすキーワードが機械学習です。
人工知能と機械学習は密接に関わっており人工知能の中枢を担っていると言えますが、この機械学習について理解しようとしてもなかなか難しいとも言えます。
この記事では機械学習とAIの関係や機械学習の使いみちを見ることで機械学習への理解を深めます。
昨今のAIを勉強する場合は機械学習に関する理解が重要になりますのでAIの学習における機械学習の意味を理解することでAI学習に向けた準備をしてください。
✔︎機械学習とは人工知能の予測判断を作成する手段
✔︎過去の経験から特徴を見つけ出し予測を行うためのアルゴリズムを作成してくれる
目次
機械学習の概要

機械学習とはその名の通り「機械」に「学習」させる行為のことを言います。
ここで機械・学習のそれぞれの意味についてもう少し深堀して考えてみましょう。
機械学習の「機械」と「学習」
機械学習における機械とは当然パソコンのことを指しますが、パソコンに学習させるとはどういう意味でしょうか。
ここで一旦、学習という言葉の意味ではなくAIとは何かを考えてみましょう。
AIは非常に定義が曖昧な存在ですがAI搭載のソフトウェアは次のように定義されることが多いです。
(事前準備)機械学習により過去のデータを分析
- 新しいデータを入力
- 入力結果を過去のデータ分析と照らし合わせて判断
- 判断内容をもとにプログラミングによって人間の代わりに作業を行う
この一連の作業内容を搭載したソフトウェアがAI搭載のソフトウェアと考えられる

多くの人は過去の経験から予測をします。
AIも同様で何かしらの予測を行うには過去の経験が必要となります。

ところでパソコンというのは数字しか処理できません。
そのため、機械学習を行うには「過去の経験・知識」を「数式化」します。
数式化された過去の経験や知識をもとに予測や判断を行うためのアルゴリズムを作る作業のことを機械学習といいます。

「機械」に「学習」させてアルゴリズムを作るの意味
機械学習でアルゴリズムを作るとは過去のデータを人間が指定した計算方法で学習する(法則を導き出す)ことで最適なアルゴリズムを作るという意味になります。
例えば、家賃の予測の例を考えてみましょう。
家賃の予測を行う際は
・駅からの距離
・治安
・利便性
などを総合的に考える必要があります。
その際、様々な過去のデータからどの項目が重要で最終的な家賃予測にどれくらいの影響を与えるかに着目して学習するかを人間側で指示します。(モデルの選択)
このモデルの計算式に沿って学習することで検討項目の中で重要な情報はなんなのかといったことなどを機械が学び数式を作っていく過程となります。
人間が適切に操作することで機械学習は行われます。
そのため、どのように機械学習を行うかといった制御のために以下のような、内容を決定することが一般的です。
- モデル
- ハイパーパラメータ
モデルの設定
機械学習におけるモデルの選択とは目的に合わせてどのようなアルゴリズムを使うのかという意味になります。
機械学習といっても学習方法は複数ありますが大まかに分けて次の三つに分かれます。
- 教師あり学習
- 教師なし学習
- 強化学習
教師あり学習
教師あり学習とは過去のデータの中で結果(回答)が存在しているデータを学習する手法になります。
入力する際に、今後判定したい内容のものを学習データとして、その結果を教師データとして抱き合わせて入力し判定する手法になります。
例えば、メールの迷惑メール判定ではメールの内容と実際に迷惑メールかどうかということを抱き合わせで入力します。
また、画像の判定で不良品を検知する場合に入力の段階で不良品か否かを抱き合わせで入力し学習させます。
教師無し学習
教師無し学習は過去のデータの中で結果が存在しないようなものを学習する手法になります。
具体的には過去のデータをクラスタリングすることで、様々な内容を読み取る技術になります。
例えば、コンビニの購買データがあったとします。
この購買データをクラスタリングすることでどのような年齢層の人がどんな商品を買う傾向が強いのかといったことがわかります。
強化学習
強化学習とは、一定の範囲内でどのようにすれば最適な回答になるのかといったのを模索していく技術になります。
例えば、ゲームで敵が学習して強くなっていく、味方がプレーヤーの行動を学習し適切なサポートを行ってくれるといったことがあります。
ハイパーパラメータの調整
ハイパーパラメータとはアルゴリズムの生成過程における調整となります。
アルゴリズムの生成方法がモデルで定義するとすれば、ハイパーパラメータは精度をさらに高めるために調整するための作業となります。

アルゴリズム作成の種類によっては、特定のデータに偏りすぎたアルゴリズムになってしまうことがあります。
そうすると、AIが正確な判断ができなくなってしまいますのでハイパーパラメータで調整することになります。

学習結果の使いみち
機械学習によって作成された数式は新しいデータを過去のデータと照らし合わせてどのようなデータなのかという結果を判断することができます。
例えば、Amazonのようサイトを想像してください。
Amazondeha顧客の購買データがあるためその結果を分析したアルゴリズムがあります。
このアルゴリズムに対して商品Aを買ったというデータを入力します。
するとアルゴリズムがこれまでの購買データと照らし合わせて次に何を買う確率が高いかを予測します。
機械学習とデータサイエンス

人工知能を調べるとデータサイエンスという言葉も聞いたことがあるかと思います。
データサイエンスとは過去のデータを分析し分析結果から新しい価値を引き出す学問になります。
▶︎関連記事:データサイエンスって結局なに?AI学習の観点から考えるデータサイエンス
情報を引き出し予測を行うということは過去のデータを勉強させる必要がありますので機械学習はデータサイエンスに含まれるという考え方が一般的です。

機械学習とディープラーニング

人工知能と聞くとディープラーニングという言葉を聞くかと思います。
ディープラーニングとは機械学習における一つの手法となります。
機械学習によってアルゴリズムを作成する際にどのようなモデルを選択するかが重要ということを書きましたが、そのモデルの中の一つにディープラーニングがあります。
▶関連記事:ディープラーニングって結局なに?人工知能との関係でみるディープラーニング

人工知能というとここ10年くらいの産物のイメージがあるかもしれませんが、実際はもっと古くから人工知能の研究は行われています。
人工知能の開発が進む中で多くのモデル、つまりアルゴリズムの開発手法が考えられていました。
しかしながら従来の手法によるアルゴリズムの作成はすでに技術的に頭打ちを食らっており予想に対する精度の向上が進みませんでした。
そんな中で新たな手法として取り入れられたのがディープラーニングとなります。
このディープラーニングによって従来の人工知能の精度を大幅に高めることができました。

ディープラーニングしか使われていないというわけではないぞ
ディープラーニングは従来のような目的を持ったアルゴリズムではなく、人間の脳を数学的に表現したアルゴリズムになります。
そのため、従来のアルゴリズムと考え方が全く違うほか、さまざまなことに応用が可能なため特別扱いされています。
まとめ:機械学習は現代における人工知能で重要な存在だ

機械学習とは、データサイエンスの一分野で過去のデータからアルゴリズムを作成する作業のことを言います。
機械学習を行うには
1.モデルで学習の方向性を決めて
2.ハイパーパラメータで精度を高める
という作業が必要になります。
モデルには大きく分けて次の三つが存在しています。
- 教師あり学習(結果が伴った内容を学習)
- 教師なし学習(データをクラスタリングする)
- 強化学習(一定のルール内で最適化する方法を見つける)
人工知能を知るうえでは欠かせない技術なので概要を押さえておきましょう。
当サイトでは機械学習を含めたAIを学習するための正しいSTEPをまとめておきました。
このSTEPでは自分が本当にAIを学ぶべきなのかどうかから、AIをどのように学習すればいいのかまで正しく考えることができます。
AI学習に向けて正しい順序で考えないと無駄な時間で悩んでしまい時間を浪費してしまう可能性があります。
いざ学習したとしても、習得できず地盤だけではなくお金を失うことにもなりかねません。
AI学習に向けて正しい段階を踏むことで後悔のないようにしてください。