Everything you care about in one place

Follow feeds: blogs, news, RSS and more. An effortless way to read and digest content of your choice.

Get Feeder

paper.seebug.org

paper - Last paper

Get the latest updates from paper - Last paper directly as they happen.

Follow now 549 followers

Latest posts

Last updated about 19 hours ago

城门之外的“野蛮人”:人工智能如何颠覆系统研究

about 19 hours ago

作者:Audrey Cheng, Shu Liu, Melissa Pan等 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/html/2510.06189v3 摘要 人工智能(AI)正通过自动化新解决方案的发现,改变我们所熟知的研究流程。面对一项任务,典型的AI驱动方法包括:(i)生成一组多样化的解决方案;(ii)验证这些解决方案并选择其中能解决问题的方案。...

对抗性诗歌:大型语言模型中一种通用的单轮越狱机制

2 days ago

作者:P. Bisconti, M. Prandi, F. Pierucci, F. Giarrusso等 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/html/2511.15304v2 摘要 本文证实,对抗性诗歌可作为大型语言模型(LLMs)的通用单轮越狱技术。在25个前沿的专有模型和开源权重模型中,精心设计的诗歌提示词实现了较高的攻击成功率(ASR),...

BrowseSafe:理解并防范 AI 浏览器代理中的提示注入攻击

3 days ago

作者:Kaiyuan Zhang、Mark Tenenholtz、Kyle Polley、Jerry Ma、Denis Yarats、Ninghui Li 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/html/2511.20597v1 摘要 将人工智能(AI)代理集成到网页浏览器中,带来了超越传统Web应用威胁模型的安全挑战。已有研究已将提示注入识别为We...

基于大型语言模型的恶意软件检测与解释:低秩适配(LoRA)与全量微调的准确性 - 效率权衡及对比研究

6 days ago

作者:Stephen C. Gravereaux, Sheikh Rabiul Islam 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/html/2511.19654v1 摘要 本研究探讨了低秩适配(LoRA)微调的大型语言模型(LLMs)在生成恶意软件分类的人类可解释决策和解释方面,是否能接近全量微调模型的性能。实现可信的恶意软件检测(尤其是涉及大型语言...

AttackPilot:基于大语言模型智能体的机器学习服务自主推理攻击

7 days ago

作者:Yixin Wu, Rui Wen, Chi Cui,Michael Backes, Yang Zhang 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/html/2511.19536v1 摘要...

PRISM:基于语义草图协作的自适应云边大语言模型推理隐私感知路由

8 days ago

作者:Junfei Zhan, Haoxun Shen, Zheng Lin, Tengjiao He 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/html/2511.22788v1 摘要 大语言模型(LLMs)在自然语言理解与生成方面展现出令人瞩目的能力,但在云端部署时会产生高昂的通信开销和隐私风险,而局限在边缘设备运行时又面临计算和内存约束。云边协同推...

碳感知入侵检测:面向可持续物联网边缘网关的有监督与无监督深度强化学习对比研究

9 days ago

作者:Saeid Jamshidi∗、Foutse Khomh、Kawser Wazed Nafi、Amin Nikanjam、Samira Keivanpour、Rolando Herrero、Omar Abdul-Wahab、Martine Bellaiche 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/html/2511.18240v1...

快速响应:在边缘网关利用IDS和LLMs实现物联网实时入侵推理

13 days ago

作者:Saeid Jamshidi, Amin Nikanjam,Negar Shahabi,Kawser Wazed Nafi等 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/html/2511.18230v1 摘要 随着物联网(IoT)设备连接数量持续增长,保障这些系统免受网络威胁攻击仍是一项紧迫的挑战,尤其是在计算和能源资源受限的环境中。本文提出一种以...

代码中的阴影:探索基于大语言模型的多智能体软件开发系统的风险与防御措施

15 days ago

作者:Xiaoqing Wang, Keman Huang, Bin Liang, Hongyu Li, Xiaoyong Du 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/html/2511.18467v1...

AutoBackdoor:通过大语言模型代理实现自动化后门攻击

16 days ago

作者:Yige Li, Zhe Li, Wei Zhao, Nay Myat Min, Hanxun Huang, Xingjun...

FORGEDAN:一种用于破解对齐大型语言模型的进化框架

20 days ago

作者:Siyang Cheng, Gaotian Liu, Rui Mei等 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/html/2511.13548v1 摘要 大型语言模型(LLMs)的快速普及既带来了变革性应用,也引发了新的安全风险,包括绕过对齐防护机制以获取有害输出的越狱攻击。现有自动化越狱生成方法(如AutoDAN)存在变异多样性有限、适应度评估...

BadThink:针对大型语言模型思维链推理的触发式过度思考攻击

21 days ago

作者:Shuaitong Liu1 Renjue Li, Lijia Yu, Lijun Zhang, Zhiming Liu, Gaojie Jin...