机器学习初学者 2024年11月28日
【机器学习】Kaggle竞赛被AutoML模型霸榜了...
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

Autogluon是一个强大的端到端自动机器学习框架,在最近的Kaggle Swag比赛中表现出色,许多前列方案都采用了它。它能够在图像、文本、时间序列和表格数据上训练和部署高精度模型,只需几行代码即可实现。Autogluon可以应用于传统的表格数据问题、多模态问题和时间序列预测问题,并提供自定义设置选项,例如交叉验证、模型组合和元学习等,以进一步提升模型性能。本文简单介绍了Autogluon及其在Kaggle比赛中的应用,并提供了使用示例,方便读者快速上手和应用。

🍄Autogluon是一个端到端自动机器学习框架,能够在多种数据类型上训练和部署高精度模型,包括图像、文本、时间序列和表格数据。

📊在Kaggle Swag比赛中,Autogluon被广泛应用于前列方案,例如第一名和第三名方案都以Autogluon为核心进行建模。

🛠️Autogluon提供自定义设置选项,例如自定义损失函数、交叉验证、模型组合和元学习,用户可以根据需求调整模型训练过程,提升模型性能。

⏱️Autogluon能够简化机器学习建模过程,只需几行代码即可完成模型训练和部署,适用于各种场景,包括表格数据问题、多模态问题和时间序列预测问题。

🏆Autogluon在Kaggle比赛中表现出色,建议参与相关竞赛的选手尝试使用,以提高建模效率和模型性能。

无言 2024-11-28 12:01 浙江

霸榜Kaggle竞赛的AutoML模型。

作者:无言

霸榜Kaggle竞赛的AutoML模型。

竞赛背景

在Kaggle最近结束的Swag比赛Binary Prediction of Poisonous Mushrooms中,前五的方案中,很多团队都是用到了端到端的自动建模库Autogluon,第一名和第三名的方案中都是以其为核心进行的。

例如第三名的方案框架如下:

所以本文我们简单学习一下Autogluon。


Autogluon

关于Autogluon:是一个端到端的自动机器学习框架,只需几行代码,就可以在图像、文本、时间序列和表格数据上训练和部署高精度的机器学习和深度学习模型。

可以使用的场景


使用案例

1.表格问题

# pip install autogluon
from autogluon.tabular import TabularPredictor
predictor = TabularPredictor(label="class").fit("train.csv")
predictions = predictor.predict("test.csv")

2.时序问题

# 详细案例参见:https://towardsdatascience.com/autogluon-timeseries-every-time-series-forecasting-model-in-one-library-29a3bf6879db
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import os
import subprocess
from gluonts.dataset.repository import get_dataset, dataset_names
from gluonts.dataset.util import to_pandas
from gluonts.evaluation.metrics import mse
from autogluon.timeseries import TimeSeriesDataFrame, TimeSeriesPredictor
 
train_data = TimeSeriesDataFrame.from_data_frame(
    train,
    id_column="item_id",
    timestamp_column="start"
)
test_data = TimeSeriesDataFrame.from_data_frame(
    test,
    id_column="item_id",
    timestamp_column="start"
)
multiple_timeseries_path = "multiple-timeseries"
model_path_fast = "tourism-quarterly-fast"
path = os.path.join(multiple_timeseries_path, model_path_fast)
predictor = TimeSeriesPredictor(
    prediction_length=24,
    #path = "multiple_timeseries_path/tourism-quarterly-fast"
    path= path,
    target="target",
    eval_metric="MSE"
)
predictor.fit(
    train_data,
    presets="fast_training",
    random_seed=42)

小结

Autogluon目前在Kaggle的诸多比赛中是非常受欢迎的一个自动化端到端的建模工具,非常建议大家在参加相关竞赛时尝试使用。

参考文献

    https://towardsdatascience.com/autogluon-timeseries-every-time-series-forecasting-model-in-one-library-29a3bf6879db

    https://github.com/autogluon/autogluon

    https://www.kaggle.com/competitions/playground-series-s4e8/discussion/523656

往期精彩回顾





请备注:”昵称-学校/公司-研究方向“,例如:”张小明-浙大-CV“加群。

也可以加入机器学习交流qq群772479961


跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Autogluon 自动机器学习 Kaggle 机器学习 AutoML
相关文章