HackerNews 2024年12月24日
人工智能可生成 10,000 种恶意软件变体,88% 的案例可逃避检测
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

网络安全研究人员发现,大型语言模型(LLM)可被用于大规模生成恶意JavaScript代码的新变种,以逃避检测。尽管LLM难以从头创建恶意软件,但犯罪分子可利用其重写或混淆现有恶意软件,使其更难被发现。通过不断转换,该方法可降低恶意软件分类系统的性能,使其误判恶意代码为良性。研究人员利用LLM重写恶意软件样本,成功绕过机器学习模型的检测,创建了10000种新型变体,且功能不变。这些变体甚至能逃避VirusTotal等平台的检测。LLM的混淆更自然,难以指纹识别,但也可用相同策略提高模型稳健性。

🤖️大型语言模型(LLM)被发现可用于大规模生成恶意JavaScript代码的新变种,这些变种可以更好地逃避检测,使得传统的网络安全防御手段面临新的挑战。

✍️犯罪分子利用LLM重写或混淆现有恶意软件,使得恶意代码的检测难度增加。经过多次转换,恶意软件分类系统的性能会下降,可能将恶意代码误判为良性。

🛡️研究人员使用LLM迭代重写恶意软件样本,成功绕过了机器学习(ML)模型的检测,生成了10000种新型JavaScript变体,这些变体在功能不变的情况下,恶意评分显著降低,且能逃避VirusTotal等检测平台的检测。

💡基于LLM的混淆技术产生的重写代码比传统混淆工具更自然,难以被检测和指纹识别。但研究人员也指出,可以通过相同的策略重写恶意代码,生成训练数据,以提高机器学习模型的稳健性。

网络安全研究人员发现,可以使用大型语言模型 (LLM) 大规模生成恶意 JavaScript 代码的新变种,以更好地逃避检测。

Palo Alto Networks Unit 42 研究人员在一项新报告中表示: “尽管 LLM 很难从头开始创建恶意软件,但犯罪分子可以很容易地使用它们来重写或混淆现有的恶意软件,使其更难检测。” “犯罪分子可以促使 LLM 执行看起来更自然的转换,这使得检测这种恶意软件更具挑战性。”

随着时间的推移,经过足够多的转换,该方法可以降低恶意软件分类系统的性能,诱使它们相信一段恶意代码实际上是良性的。

尽管 LLM 提供商已不断加强安全防护,以防止其出轨并产生意外输出,但恶意开发人员却宣传使用WormGPT等工具来自动编写令人信服的网络钓鱼电子邮件,这些电子邮件针对潜在目标,甚至会创建新的恶意软件。

早在 2024 年 10 月,OpenAI就披露它阻止了 20 多项试图使用其平台进行侦察、漏洞研究、脚本支持和调试的操作和欺骗网络。

Unit 42 表示,它利用 LLM 的强大功能迭代重写现有的恶意软件样本,目的是绕过“无罪推定”(IUPG)或PhishingJS等机器学习(ML)模型的检测,从而有效地为创建 10,000 种新型 JavaScript 变体铺平了道路,同时又不改变其功能。

对抗性机器学习技术旨在每次将恶意软件作为输入输入系统时,使用各种方法对其进行转换——即变量重命名、字符串拆分、垃圾代码插入、删除不必要的空格以及完全重新实现代码。

该公司表示:“最终的输出是恶意 JavaScript 的新变种,它保持了与原始脚本相同的行为,但恶意分数几乎总是低得多。”并补充说,算法在 88% 的时间内将其恶意软件分类器模型的判定从恶意转变为良性。

更糟糕的是,这些重写的 JavaScript 工件在上传到 VirusTotal 平台时也会逃避其他恶意软件分析器的检测。

基于 LLM 的混淆提供的另一个关键优势是,它的大量重写看起来比 obfuscator.io 等库实现的重写自然得多,后者由于它们对源代码引入更改的方式,更容易可靠地检测和指纹识别。

Unit 42 表示:“在生成式人工智能的帮助下,新的恶意代码变种的规模可能会增加。不过,我们可以使用相同的策略来重写恶意代码,以帮助生成可以提高机器学习模型稳健性的训练数据。”

 

 

 


转自军哥网络安全读报,原文链接:https://mp.weixin.qq.com/s/iSCmefHzaCwcHO0tuNkk2w

封面来源于网络,如有侵权请联系删除

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

LLM 恶意代码 网络安全 机器学习 代码混淆
相关文章