Meta公司发布网络爬虫Meta External Agent,用于收集大量数据以支持其AI模型,该爬虫可抓取如新闻文章等的训练数据,Meta的Llama模型曾用大型数据集训练,新爬虫推出或因公司需更多数据来改进AI模型。
🥳Meta公司悄然推出Meta External Agent网络爬虫,此爬虫的主要作用是搜索互联网并收集大量数据,为其人工智能模型提供支持,类似于OpenAI的GPTBot,能够抓取多种类型的人工智能训练数据。
🤖Meta的大型语言模型Llama曾使用Common Crawl等来源收集的大型数据集进行训练,而新爬虫的出现可能表明Meta尽管已有大量数据,但仍需要更多数据来推动AI模型的更新与改进。
📰媒体对Meta公司的这一举措进行了报道,包括凤凰科技、C114通信网/IT之家等,同时还提及了Meta在AI领域的其他事件,如叫停明星AI聊天机器人,以及因收集用户数据训练AI触发监管而暂停行动等。
Meta公司悄然发布了一款名为Meta External Agent的网络爬虫,用于搜索互联网并收集大量数据,以供其人工智能模型使用。这款新爬虫类似于OpenAI的GPTBot,可以抓取网络上的人工智能训练数据,例如新闻文章和在线讨论组的对话。Meta公司的大型语言模型Llama使用了Common Crawl等来源收集的大型数据集进行训练。尽管Meta已经积累了大量数据,但新爬虫的推出可能意味着公司需要更多数据来支持其AI模型的更新和改进。
媒体报道
事件追踪