
機械学習を始めようと考えている人「機械学習に必要なライブラリを知りたい。ライブラリって何だろう?どのライブラリについて勉強したらいいか分かりません。具体的に何を勉強したらいいか教えてください。」
こういった疑問に答えます。
目次
本記事のテーマ
機械学習に必要なライブラリまとめ【初心者必須】
機械学習に必要なライブラリ(厳選8選)
- ①numpy
- ②pandas
- ③matplotlib
- ④scikit-learn
- ⑤seaborn
- ⑥TensorFlow
- ⑦Keras
- ⑧PyTorch
結論から言うと以上が機械学習に必要なライブラリの一覧です。
読者さんへの前置きメッセージ
本記事では「機械学習に必要なライブラリについて知りたい」という方に向けて書いています。
この記事を読むことで、「機械学習に必要なライブラリ、勉強するべきライブラリ、これからの方向性」までをイメージできるようになると思います。
それでは、さっそく見ていきましょう。
機械学習に必要なライブラリまとめ

機械学習におけるデータの取り扱い
①numpy
numpyとは、数値計算を行うためのライブラリです。
機械学習において最も利用する機会の多いと言っても過言ではないライブラリです。Pythonで機械学習プログラミングを行う上で、numpyについて勉強することは避けては通れないでしょう。画像なども数値に置き換えて扱う必要があるので、必須のライブラリですね。
②pandas
pandasとは、表および時系列データなどの「テーブルデータ」を取り扱うためのライブラリです。
機械学習やプログラミングを行う上で、多くの数値やテキスト情報を扱う場面が頻繁に登場します。それぞれ知りたい情報がまとまったcsvファイルなどを読み込む、編集する、保存するなど テーブルデータを扱う上での重要な機能が多く備わっています。テーブルデータとしてまとまっている事も多いので、pandasについても知っておく必要があります。
③matplotlib
matplotlibは、グラフや図の描画のためのライブラリです。
機械学習においては、特徴量の可視化や学習経過のグラフ化、画像の出力等の機能が多く利用されています。データを取り扱う上で、分かりやすく可視化する事が重要になります。基本的に何かを実際に可視化してみてみたい。そんな時にはmatplotlib!そんな感じで覚えておいてください。
④scikit-learn
scikit-learnとは、多くの機械学習アルゴリズムを含む巨大なライブラリです。
Pythonにおいて、最も一般的に知られている、そして幅広い機能を持った機械学習ライブラリでしょう。scikit-learnには、データセットや機械学習アルゴリズムなどが含まれており、機械学習で全般的に活躍します。モデルの評価の部分にまで活躍するので、scikit-learnを学ぶことで機械学習の概要を網羅できる。そんなライブラリですね。まずは、ここから勉強していくのもいいかもしれませんね。
見やすい!を心がけよう
⑤seaborn
seabornはmatplotlibと並んで有名かつ便利でかっこいい可視化が出来るライブラリです。
seabornの主な特徴は、matplotilbと比べて洗練されたかっこいい見やすい図を描くことができること、matplotlibと比べて少ないコードで可視化が可能であることです。matplotlibの方が一般に広く活用されてはいるものの、seabornも可視化には非常に便利なライブラリとなっています。
これは少し補足ライブラリとして上記4つとは別枠として紹介しましたが、僕は常に見やすい!を心がけることが重要だと考えています。細かい部分かもしれませんが、細かい気配りが出来ることで周りからの信頼が得られたりこの人の見やすい!と思われるので、ぜひ勉強してみて欲しいライブラリです。
深層学習に必要なライブラリ
⑥TensorFlow
TensorFlowはGoogleが提供している機械学習、深層学習ライブラリです。
深層学習を行う上で、必須のライブラリになります。ニューラルネットワークの構築、訓練ができるなどの機能を持ったライブラリです。なかなかここで説明は出来ないくらい奥深いものなので、ぜひ勉強していってください。
⑦Keras
Kerasは、TensorFlowをはじめとしていくつかの機械学習ライブラリ上で動かすことができる深層学習ライブラリです。
特徴としては、シンプルで簡単に深層学習モデルを構築できる点や、分散処理に対応していることで効率的な学習ができる点などが挙げられます。Kerasは結構シンプルな作りで、記述も簡単なので、初心者におすすめのライブラリになります。
⑧PyTorch
Facebookの人工知能研究グループが開発したPython用の機械学習ライブラリが、PyTorchです。
特徴としては、記述方法がnumpyに類似している点です。numpyを扱えるようになればに扱いやすい点はとても良い点であると思います。また、Kerasと比べると細かく記述する必要があるため少し難しく感じるかもしれませんが、その分思うままにモデルを構築できるためかなり人気のライブラリになります。
また、最新の論文などで発表された手法などが一早く公開されやすいのも、PyTorchなので最新の研究に興味ある人はPyTorchがおすすめです。
まとめ
以上、今回は機械学習に必要なライブラリまとめ【初心者必須】について記事を書きました。
それぞれについてざっくりとした説明でしたが、まずはこれらを勉強していったらいいのではないでしょうか。補足として深層学習において重要なライブラリまで解説しましたが、今後細かく1つずつライブラリの解説などもしていきたいと思っています。