机器学习初学者 2024年11月06日
【机器学习】Kaggle竞赛被AutoML模型霸榜了...
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文介绍了在Kaggle竞赛中表现出色的AutoML模型Autogluon。在Swag比赛中,前五方案多使用该模型,文中还列举了第三名方案的具体设置。此外,阐述了Autogluon的功能、可使用场景及相关案例。

🥇在Kaggle竞赛中,Autogluon表现出色,多个团队使用

📋第三名方案中使用默认版和自定义版AutoGluon

💻Autogluon可用于传统表格、多模态、时间序列等问题

📈提供表格和时序问题的使用案例

无言 2024-11-06 12:01 浙江

霸榜Kaggle竞赛的AutoML模型。

作者:无言

霸榜Kaggle竞赛的AutoML模型。

竞赛背景

在Kaggle最近结束的Swag比赛Binary Prediction of Poisonous Mushrooms中,前五的方案中,很多团队都是用到了端到端的自动建模库Autogluon,第一名和第三名的方案中都是以其为核心进行的。

例如第三名的方案框架如下:

所以本文我们简单学习一下Autogluon。


Autogluon

关于Autogluon:是一个端到端的自动机器学习框架,只需几行代码,就可以在图像、文本、时间序列和表格数据上训练和部署高精度的机器学习和深度学习模型。

可以使用的场景


使用案例

1.表格问题

# pip install autogluon
from autogluon.tabular import TabularPredictor
predictor = TabularPredictor(label="class").fit("train.csv")
predictions = predictor.predict("test.csv")

2.时序问题

# 详细案例参见:https://towardsdatascience.com/autogluon-timeseries-every-time-series-forecasting-model-in-one-library-29a3bf6879db
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import os
import subprocess
from gluonts.dataset.repository import get_dataset, dataset_names
from gluonts.dataset.util import to_pandas
from gluonts.evaluation.metrics import mse
from autogluon.timeseries import TimeSeriesDataFrame, TimeSeriesPredictor
 
train_data = TimeSeriesDataFrame.from_data_frame(
    train,
    id_column="item_id",
    timestamp_column="start"
)
test_data = TimeSeriesDataFrame.from_data_frame(
    test,
    id_column="item_id",
    timestamp_column="start"
)
multiple_timeseries_path = "multiple-timeseries"
model_path_fast = "tourism-quarterly-fast"
path = os.path.join(multiple_timeseries_path, model_path_fast)
predictor = TimeSeriesPredictor(
    prediction_length=24,
    #path = "multiple_timeseries_path/tourism-quarterly-fast"
    path= path,
    target="target",
    eval_metric="MSE"
)
predictor.fit(
    train_data,
    presets="fast_training",
    random_seed=42)

小结

Autogluon目前在Kaggle的诸多比赛中是非常受欢迎的一个自动化端到端的建模工具,非常建议大家在参加相关竞赛时尝试使用。

参考文献

    https://towardsdatascience.com/autogluon-timeseries-every-time-series-forecasting-model-in-one-library-29a3bf6879db

    https://github.com/autogluon/autogluon

    https://www.kaggle.com/competitions/playground-series-s4e8/discussion/523656

往期精彩回顾





请备注:”昵称-学校/公司-研究方向“,例如:”张小明-浙大-CV“加群。

也可以加入机器学习交流qq群772479961


跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AutoML Autogluon Kaggle竞赛 机器学习
相关文章