今天给大家分享一个超强 python 库,autogluon
https://github.com/autogluon/autogluon
AutoGluon 是一个用于深度学习的 AutoML 工具包,它可以自动执行端到端机器学习任务,使我们能够通过几行代码实现强大的预测性能。
AutoGluon 「可自动执行机器学习任务」,使你能够在应用程序中轻松实现强大的预测性能。
初体验
安装 AutoGluon
我们可以直接使用 pip 来进行安装。
pip install autogluon
加载数据集
可以通过 TabularDataset 来加载数据集。
from autogluon.tabular import TabularDataset, TabularPredictor
train_data = TabularDataset('https://autogluon.s3.amazonaws.com/datasets/Inc/train.csv')
test_data = TabularDataset('https://autogluon.s3.amazonaws.com/datasets/Inc/test.csv')
模型构建
使用该模型需要初始化「评估指标、因变量和存储结果的目录。」
在如下示例中,我们使用 f1 作为评估指标。因变量是 “class”,模型被放入 “output_models” 文件夹中
evaluation_metric= "f1"
data_label= "class"
save_path= "output_models"
predictor = TabularPredictor(label='class').fit(train_data, time_limit=120) # Fit models for 120s
leaderboard = predictor.leaderboard(test_data)
#创建预测器
predictor = TabularPredictor(label=data_label,path=save_path,eval_metric=evaluation_metric)
predictor=predictor.fit(train_data)
predictor.leaderboard(silent=True)
下图所示的排行榜可以让你了解「所有模型的尝试情况以及你在这些模型上获得的分数。」
下面一起来看一下特征重要性。
X = train_data
Predictor.feature_importance(X)
所有已构建的模型都存储在输出文件夹 “output_models” 中。