読者です 読者をやめる 読者になる 読者になる

「機械学習のルール」のメモ:ルール3

Rule #3: Choose machine learning over a complex heuristic. ルール3:複雑なヒューリスティクスよりも機械学習を選ぶ

「機械学習のルール」のメモ:ルール2

Rule #2: First, design and implement metrics

ルール2:初めにメトリクスを設計し、実装する

  • 機械学習で何をするかを決める前に、まず既存のシステムをトラックする
  • 早い段階からメトリクスを図ることを念頭において進める
  • 何か起きたらその変化をメトリクス経由で確認できるようにする
  • ユーザーをバケットにグルーピングしておいて、実験できるようにしておくようになフレームワークも重要

所感

以外でできそうでできないんですよね。。。

出典

http://martin.zinkevich.org/rules_of_ml/rules_of_ml.pdf

「機械学習のルール」のメモ:ルール1

Rule #1: Don’t be afraid to launch a product without machine learning.

ルール#1:機械学習なしでプロダクトをローンチするのを恐れない

  • 機械学習にはデータが必要
  • 理論的には別の問題のデータを使って新しい製品のためのモデルを作ることも可能
  • 人間による編集も利用することを恐れない
  • 機械学習が製品で絶対的に必要になっていないなら、データが得られるまで使わない

http://martin.zinkevich.org/rules_of_ml/rules_of_ml.pdf

良さげなものを見つけたので1日1個ずつくらい英語のリハビリも兼ねて眺めていく

見過ごせない5つの機械学習プロジェクト

元記事

5 Machine Learning Projects You Can No Longer Overlook, January

1. Hyperopt-sklearn

GitHub - hyperopt/hyperopt-sklearn: Hyper-parameter optimization for sklearn

Hyperopt by hyperopt

2. Dlib

dlib C++ Library

3. NN++

GitHub - stagadish/NNplusplus: A small and easy to use neural net implementation for C++. Just download and #include!

4. LightGBM

GitHub - Microsoft/LightGBM: A fast, distributed, high performance gradient boosting (GBDT, GBRT, GBM or MART) framework based on decision tree algorithms, used for ranking, classification and many other machine learning tasks. It is under the umbrella of the DMTK(http://github.com/microsoft/dmtk) project of Microsoft.

5. Sklearn-pandas

GitHub - paulgb/sklearn-pandas: Pandas integration with sklearn

  • PandasのデータフレームとScikit-learnの橋渡しとなるモジュール

所感

  • Dlibはどこかのプロジェクトで使われていたような気がするがあとは始めて知った
  • なんとなくHyperopt-sklearnは面白そう
  • アルゴリズム使えます、みたいなライブラリは出揃ったので、その他のワークフローに焦点が映っているんだろうなぁ、と。