Everything you care about in one place

Follow feeds: blogs, news, RSS and more. An effortless way to read and digest content of your choice.

Get Feeder

keenlab.tencent.com

腾讯科恩实验室官方博客

Get the latest updates from 腾讯科恩实验室官方博客 directly as they happen.

Follow now 42 followers

Latest posts

Last updated 4 months ago

SecCorpus: 构建安全领域大模型数据的技术实践

about 1 year ago

1. 引言过去十几年来,人工智能技术不断发展,逐渐被应用于网络安全领域,大幅提升了检测分析、处置响应等方面的效率。ChatGPT的问世及其卓越表现,再次激发了网络安全市场对于大模型的期待。然而,以ChatGPT为代表的通用大模型通常以API形式供使用方调用,这不可避免地带来了成本和数据隐私问题。此外,通用大模型在网络安全领域的实际应用效果尚存优化空间。因此,针对特定业务场景的私有化部署的领域大模型应运而生。如何构建一个适用于网络安全领域的大模型,以协同提升安全攻防、安全运营等能力,成为关键课题。目前众多网络安全厂商已陆续推出自有网络安全垂直领域大模型。为了强化和推进大模型在安全垂直领域的表现,腾讯安全科恩实验室构建了SecCorpus安全领域大模型数据清洗套件及相应的安全语料数据集。本文首先概述当前网络安全领域大模型的进展及应用场景,并以腾讯安全科恩实验室在安全领域大模型安全语料数据方面的研究工作为背景,分享我们在构建SecCorpus过程中的一些经验和成果。2. 安全领域大模型进展2.1. 网络安全领域大模型进展根据IDC发布的“破土萌芽——大模型在网络安全领域的应用市场洞察报告”[1],报告指出国内众多网络安全厂商在2023年陆续推出了各具特色的网络安全垂直领域大模型,由于数据、成本、时间等原因,针对大多数网络安全专业厂商,在基础通用大模型之上投喂安全知识语料,进行模型的再次预训练和微调,从而生成安全垂直领域大模型,是一个性价比更高的途径。安全运营、威胁情报、威胁检测与分析、应用程序安全、数据分类分级成为大模型在网络安全领域的五个主要应用方向。作为网络安全行业的领军者,Google和Microsoft也相继推出了自有的网络安全大语言模型或平台。Google在2023年发布了自研的网络安全大模型Sec-Palm2[2],Sec-Palm2针对安全应用场景进行了微调,整合了大量威胁情报数据。Sec-Palm2结合VirusTotal推出了code insight功能,可帮助安全分析人员快速分析和说明潜在恶意代码的行为,而无需对脚本进行耗时耗力的逆向工程;与此同时,Sec-Palm2还结合Google cloud 推出了Duet AI,Duet AI是目前网络安全领域与大模型结合的标杆产品,具备情报分析与威胁狩猎、安全运营(自动提供安全事件的总结摘要,提供威胁背景,并???出具体建议处置威胁)、攻击溯源(实时分析安全问题,发现可能的攻击路径)等能力,大幅提升安全团队的工作效率。另一个标杆产品是微软发布 Security Copilot[3],Security Copilot凭借OpenAI提供强大的模型能力和Microsoft自身在基础设施、威胁情报以及安全能力等方面的深厚积累,将...

SecCorpus: 构建安全领域大模型数据的技术实践

about 1 year ago

1. 引言过去十几年来,人工智能技术不断发展,逐渐被应用于网络安全领域,大幅提升了检测分析、处置响应等方面的效率。ChatGPT的问世及其卓越表现,再次激发了网络安全市场对于大模型的期待。然而,以ChatGPT为代表的通用大模型通常以API形式供使用方调用,这不可避免地带来了成本和数据隐私问题。此外,通用大模型在网络安全领域的实际应用效果尚存优化空间。因此,针对特定业务场景的私有化部署的领域大模型应运而生。如何构建一个适用于网络安全领域的大模型,以协同提升安全攻防、安全运营等能力,成为关键课题。目前众多网络安全厂商已陆续推出自有网络安全垂直领域大模型。为了强化和推进大模型在安全垂直领域的表现,腾讯安全科恩实验室构建了SecCorpus安全领域大模型数据清洗套件及相应的安全语料数据集。本文首先概述当前网络安全领域大模型的进展及应用场景,并以腾讯安全科恩实验室在安全领域大模型安全语料数据方面的研究工作为背景,分享我们在构建SecCorpus过程中的一些经验和成果。2. 安全领域大模型进展2.1. 网络安全领域大模型进展根据IDC发布的“破土萌芽——大模型在网络安全领域的应用市场洞察报告”[1],报告指出国内众多网络安全厂商在2023年陆续推出了各具特色的网络安全垂直领域大模型,由于数据、成本、时间等原因,针对大多数网络安全专业厂商,在基础通用大模型之上投喂安全知识语料,进行模型的再次预训练和微调,从而生成安全垂直领域大模型,是一个性价比更高的途径。安全运营、威胁情报、威胁检测与分析、应用程序安全、数据分类分级成为大模型在网络安全领域的五个主要应用方向。作为网络安全行业的领军者,Google和Microsoft也相继推出了自有的网络安全大语言模型或平台。Google在2023年发布了自研的网络安全大模型Sec-Palm2[2],Sec-Palm2针对安全应用场景进行了微调,整合了大量威胁情报数据。Sec-Palm2结合VirusTotal推出了code insight功能,可帮助安全分析人员快速分析和说明潜在恶意代码的行为,而无需对脚本进行耗时耗力的逆向工程;与此同时,Sec-Palm2还结合Google cloud 推出了Duet AI,Duet AI是目前网络安全领域与大模型结合的标杆产品,具备情报分析与威胁狩猎、安全运营(自动提供安全事件的总结摘要,提供威胁背景,并提出具体建议处置威胁)、攻击溯源(实时分析安全问题,发现可能的攻击路径)等能力,大幅提升安全团队的工作效率。另一个标杆产品是微软发布 Security Copilot[3],Security Copilot凭借OpenAI提供强大的模型能力和Microsoft自身在基础设施、威胁情报以及安全能力等方面的深厚积累,将...

科恩实验室最新网联汽车信息安全研究成果发布于安全顶会IEEE S&P 2024 - 对车载攻击面的重新审视与思考

over 1 year ago

背景与摘要近年来,随着现代车辆技术的快速发展,网联汽车的攻击面(Attack Surface)和车载网络结构(In-Vehicle Network)都变得更加复杂。目前,已出台多项网联汽车信息安全标准,包括WP29 R155e、ISO 21434以及一系列国标,但这些刚出台标准与法规仍处于起步阶段,需要在摸索实践中直面各种挑战并不断完善。在这样的背景下,我们展开了如下的研究来重新审视现在的网联汽车信息安全:我们通过深入访谈15位网联汽车信息安全专家,揭示了安全团队在保障车辆信息安全过程中遇到的挑战,以及现行规定的局限性:包括缺乏高质量的车载威胁案例信息库以及难以高效执行Threat Analysis & Risk Assessment (TARA)等。基于现有的法规和收集的访谈数据,我们建立了一个新的层次化的网联汽车信息安全的威胁???例库,包括多达119条具体的车载威胁案例。同时我们提出一种新的基于Datalog的推理方法,可根据车载网络结构自动化推理攻击路径和计算对应的威胁分数。以实车上的安全研究案例分析展示了自动化方法的有效性。该研究由科恩实验室和香港理工大学罗夏朴教授团队及香港大学钱晨雄教授联合完成,且相关论文《Revisiting Automotive Attack...

BinaryAI二进制比对功能设计与实现|大模型下函数的语义匹配

almost 2 years ago

科恩实验室自研二进制安全智能分析平台- BinaryAI技术分享:全新功能“二进制比对”的设计与实现。本文介绍了BinaryAI如何在大模型 BAI-2.0基础上叠加启发式算法,以函数粒度的语义匹配提高了复杂场景下二进制比对准确率及召回率。体验地址:https://www.binaryai.cn科恩实验室在2021年8月首次发布二进制安全智能分析平台—BinaryAI,BinaryAI可精准高效识别二进制文件的第三方组件及其版本号,旨在推动SCA(Software Composition Analysis,软件成分分析)技术在DevSecOps、威胁情报、安全研究等应用场景发展。BinaryAI二进制比对功能亮相二进制可执行文件比对是计算机安全的经典问题,通过比对两个二进制文件的异同,即使源代码不可用,也能够进行程序版本变更分析及第三方组件识别等任务。但现有工具大多依赖于人工选定的特征,对函数语义理解不足,在跨版本或优化级别的复杂场景下识别效果不佳。科恩实验室凝聚多年“AI+算法”研究成果经验,推出函数相似度匹配模型 BAI-2.0(BinaryAI全新代码匹配模型BAI-2.0上线, “大模型”时代的???全实践),并在此基础上叠加启发式算法,实现了BinaryAI最新的二进制文件比对功能,以函数粒度的语义匹配提高了复杂场景下二进制比对准确率及召回率。该功能底层比对算法代码现已开源,欢迎复现:https://github.com/binaryai/bindiffmatch平台比对功能体验传送门:https://www.binaryai.cn/四大使用场景(1)比较新老版本软件功能变更软件迭代代码变更有限,在面对新老版本时,可以迅速识别并排除相似的部分,从而集中精力在变更的函数上。(2)识别组件库的使用情况及风险分析大型程序时,处理集成的开源组件代码需要花费大量精力。手动构建带有符号信息的开源库程序,并借助二进制文件比对技术匹配函数以完成符号标注,可以快速理解程序的局部逻辑,形成对程序整体结构的认识,有助于进一步分析核心逻辑和组件可能引入的安全缺陷、许可证问题等。(3)鉴定软件抄袭侵权在无法获得源代码的场景下,通过二进制文件比对也可以判断待测程序是否与已知程序雷同,可以用于版权调查或者剽窃抄袭判定。(4)分析恶意软件变体同一家族的恶意软件在实现上会有一定的共同特征。通过二进制文件比对可以将相似的样本归类,有利于找到具有类似行为的恶意软件变体。二进制比对相关工具及研究目前工业界和学术界有大量针对二进制比对任务的工具及研究,几个有代表性的工作如下:BinDiffBinDiff[1]是zynamics团队开发的产品,可以和IDA、Ghidra、Binary Ninja工具结合使用,对两个二进制文件执行细粒度的比对。BinDiff采用的是基于图结构(控制流图和调用图)的匹配以及若干启发式特征匹配技术。截至目前,BinDiff的最新版本为2021年发布的7.0版本,其特征导出模块BinExport已经开源。DiaphoraDiaphora[2]是一款流行的开源二进制比对工具,目前仍在积极维护中,最新版本为上月发布的3.0版本。其分析过程分为两个阶段,第一阶段:作为IDA Script运行,导出文件和函数的各种特征存入数据库;第二阶段:可以作为IDA Script运行或者离线运行,在导出的特征上运行各种策略(heuristics),最终生成完全匹配、部分匹配、无法匹配的函数列表。匹配结果导入IDA后,能够以函数、伪代码、汇编、调用图等多种粒度展示。Diaphora的核心能力在于其策略,这些策略大多是基于人为选定的特征,用于判断单个函数的匹配性,例如”Same KOKA hash...

BinaryAI全新代码匹配模型BAI-2.0上线,“大模型”时代的安全实践

about 2 years ago

科恩自研二进制安全智能分析平台—BinaryAI带来重要功能更新:发布全新代码匹配模型BAI-2.0、准确率提升、数据集拓展及用户体验优化。体验地址:https://www.binaryai.net 科恩实验室在2021年8月首次发布二进制安全智能分析平台—BinaryAI,BinaryAI可精准高效识别二进制文件的第三方组件及其版本号,旨在推动SCA(Software Composition Analysis,软件成分分析)技术在DevSecOps、威胁情报、安全研究等应用场景发展。BinaryAI本次发布产品重要更新,配备创新的算法模型和持续扩展的后台数据。科恩代码匹配模型BAI-2.0和配套算法引擎彻底革新了SCA的表现,配合业界领先的数据集和种种精彩新功能,BinaryAI实现了分析准确性及效率的大幅提升。 关于BinaryAIBinaryAI对上传文件进行自动化解包、解析后,基于自研SCA算法和后台GitHub全量C/C++库的开源组件数据集,对其进行软件成分分析、函数相似性检索,以业界领先的识别准确率匹配到文件所使用的开源组件,辅助用户完成软件成分分析和恶意软件分析的安全分析工作。BinaryAI算法引擎背后是各种AI算法和经典算法,其中核心的代码匹配模型在行业内具备显著优势。科恩实验室持续深耕智能软件安全分析研究,联合多所高校和科研院所,在信息安全、软件工程和人工智能领域的多个顶级会议上发表十余篇文章。基于科恩智能软件安全分析的研究沉淀,BinaryAI不断提升其准确分析能力。 BinaryAI更新亮点后端模型重磅升级科恩代码匹配模型上线BAI-2.0,顺应了AI模型开发领域向大模型演进的趋势。大模型的出现不仅促进了技术的迭代,还衍生出一批备受关注的大模型应用,如AIGC图像生成应用、ChatGPT工具等。作为领域内的先行者,科恩通过在软件成分分析领域落地应用大模型,适配了该领域的细分场景,提升了BinaryAI的召回效果。 准确率步步攀升BinaryAI基于科恩自研的代码匹配模型BAI-2.0和复杂图的程序分析算法,对可执行文件中的二进制函数使用图算法分析,同时与AI算法相辅相成,在GitHub全量C/C++库中找到匹配的源代码函数。经过多次迭代,BinaryAI的算法引擎提升了算法的准确率,降低了误报,较上个版本更上一台阶。 亿级函数数据集持续拓展BinaryAI已经支持全网主流开源C/C++语言项目,采集了数万代码仓库的百万级版本分支,累计百亿C/C++源代码文件特征数据,去重后包含亿级函数特征。数据能力和算法引擎使得BinaryAI的SCA能够准确定位二进制文件所使用的的开源项目的具体版本,满足查看软件成分清单的需求。数据集已经拓宽对其他开发语言的支持,共计三百多万个代码仓库,未来将支持BinaryAI在其他开发语言、应用场景发挥其成分分析能力。BinaryAI功能更新布告|构建全量开源项目数据集 倾听用户之声为改善过去BinaryAI提供的插件在客户端上网络请求结果慢、交互体验不佳的问题,BinaryAI在网页平台上新增“BinaryAI函数相似性检索”导出能力,用户可以在平台上传二进制文件并浏览分析结果后,下载结果导入到IDA或Ghidra等二进制分析软件中,继续安全分析工作,这一优化将大幅提升深度分析二进制文件场景的用户体验。此外,平台增加科恩自研腾讯云二进制软件成分分析产品—BSCA的跳转入口,用户可一键跳转体验漏洞扫描、License审计等特有功能,适用于DevSecOps 制品扫描、软件上线前安全风险识别、检查上下游供应链安全问题等应用场景。 最新功能特性展示点击“BinaryAI函数相似性检索”,即可下载结果Json文件,获得插件的GitHub下载链接。 典型文件示例:软件成分分析和函数识别:示例1、示例2威胁情报(C2样本检测):示例3威胁情报(挖矿样本检测):示例4...

BinaryAI全新代码匹配模型BAI-2.0上线,“大模型”时代的安全实践

about 2 years ago

科恩自研二进制安全智能分析平台—BinaryAI带来重要功能更新:发布全新代码匹配模型BAI-2.0、准确率提升、数据集拓展及用户体验优化。体验地址:https://www.binaryai.net科恩实验室在2021年8月首次发布二进制安全智能分析平台—BinaryAI,BinaryAI可精准高效识别二进制文件的第三方组件及其版本号,旨在推动SCA(Software Composition Analysis,软件成分分析)技术在DevSecOps、威胁情报、安全研究等应用场景发展。BinaryAI本次发布产品重要更新,配备创新的算法模型和持续扩展的后台数据。科恩代码匹配模型BAI-2.0和配套算法引擎彻底革新了SCA的表现,配合业界领先的数据集和种种精彩新功能,BinaryAI实现了分析准确性及效率的大幅提升。关于BinaryAIBinaryAI对上传文件进行自动化解包、解析后,基于自研SCA算法和后台GitHub全量C/C++库的开源组件数据集,对其进行软件成分分析、函数相似性检索,以业界领先的识别准确率匹配到文件所使用的开源组件,辅助用户完成软件成分分析和恶意软件分析的安全分析工作。BinaryAI算法引擎背后是各种AI算法和经典算法,其中核心的代码匹配模型在行业内具备显著优势。科恩实验室持续深耕智能软件安全分析研究,联合多所高校和科研院所,在信息安全、软件工程和人工智能领域的多个顶级会议上发表十余篇文章。基于科恩智能软件安全分析的研究沉淀,BinaryAI不断提升其准确分析能力。BinaryAI更新亮点后端模型重磅升级科恩代码匹配模型上线BAI-2.0,顺应了AI模型开发领域向大模型演进的趋势。大模型的出现不仅促进了技术的迭代,还衍生出一批备受关注的大模型应用,如AIGC图像生成应用、ChatGPT工具等。作为领域内的先行者,科恩通过在软件成分分析领域落地应用大模型,适配了该领域的细分场景,提升了BinaryAI的召回效果。准确率步步攀升BinaryAI基于科恩自研的代码匹配模型BAI-2.0和复杂图的程序分析算法,对可执行文件中的二进制函数使用图算法分析,同时与AI算法相辅相成,在GitHub全量C/C++库中找到匹配的源代码函数。经过多次迭代,BinaryAI的算法引擎提升了算法的准确率,降低了误报,较上个版本更上一台阶。亿级函数数据集持续拓展BinaryAI已经支持全网主流开源C/C++语言项目,采集了数万代码仓库的百万级版本分支,累计百亿C/C++源代码文件特征数据,去重后包含亿级函数特征。数据能力和算法引擎使得BinaryAI的SCA能够准确定位二进制文件所使用的的开源项目的具体版本,满足查看软件成分清单的需求。数据集已经拓宽对其他开发语言的支持,共计三百多万个代码仓库,未来将支持BinaryAI在其他开发语言、应用场景发挥其成分分析能力。BinaryAI功能更新布告|构建全量开源项目数据集倾听用户之声为改善过去BinaryAI提供的插件在客户端上网络请求结果慢、交互体验不佳的问题,BinaryAI在网页平台上新增“BinaryAI函数相似性检索”导出能力,用户可以在平台上传二进制文件并浏览分析结果后,下载结果导入到IDA或Ghidra等二进制分析软件中,继续安全分析工作,这一优化将大幅提升深度分析二进制文件场景的用户体验。此外,平台增加科恩自研腾讯云二进制软件成分分析产品—BSCA的跳转入口,用户可一键跳转体验漏洞扫描、License审计等特有功能,适用于DevSecOps 制品扫描、软件上线前安全风险识别、检查上下游供应链安全问题等应用场景。最新功能特性展示点击“BinaryAI函数相似性检索”,即可下载结果Json文件,获得插件的GitHub下载链接。典型文件示例:软件成分分析和函数识别:示例1、示例2威胁情报(C2样本检测):示例3威胁情报(挖矿样本检测):示例4演示视频若视频无法正常播放请点击更多业务体验BinaryAI的算法引擎核心能力已同步落地应用于腾讯安全多款产品:腾讯云二进制软件成分分析:BSCA包月免费活动进行中腾讯威胁情报 TIX:TIX腾讯主机安全云镜:腾讯主机安全(云镜)兵器库:斩杀挖矿木马的利剑-BinaryAI引擎除此之外,科恩实验室始终以积极的姿态探索软件安全领域和前沿AI结合的科研落地,推动成果转化以解决产业痛点问题。加入???户群微信扫码或搜索并添加“keenlab”为好友,发送“BinaryAI交流群”获得入群链接往期回顾[1]腾讯安全科恩实验室推出首款免费在线SCA平台:BinaryAI[2]科恩实验室最新NeurIPS-2020论文解读:基于跨模态检索的二进制代码-源代码匹配[3]AAAI-20论文解读:基于图神经网络的二进制代码分析

“精”准把握静态分析|科恩二进制文件自动化静态漏洞检测工具正式开源

about 3 years ago

为提升静态分析在二进制文件漏洞检测领域效率和可扩展性,科恩孵化并开源二进制文件静态漏洞分析工具BinAbsInspector项目。代码仓库地址:https://github.com/KeenSecurityLab/BinAbsInspector背景软件漏洞检测“两板斧”随着信息产业的发展,网络安全问题日益严峻,软件漏洞对于互联网威胁极大,是网络安全中的核心问题。为了缓解漏洞所造成的危害,需要对软件进行安全检测,尽可能地发现并消除潜在漏洞。目前常见的自动化漏洞检测手段可以分为两类:动态分析测试和静态分析。动态分析测试方法(如fuzzing等)在过去五年里吸引了研究者的广泛关注,相关系统在工业界中已经得到了大规模的部署和应用。相比于动态方法,静态分析通常具有更高的覆盖率,然而,现阶段对于静态分析的使用多依赖于人工经验规则,且精度和效率之间尚未找到一个合适的平衡点,这导致其在现实场景中的落地不尽如人意。静态分析工具现状目前国际上较为成功的商业化分析工具有 Coverity[1] 、 CodeSonar[2] 、 VeraCode[3] 等,它们在代码质量保障上发挥了重要作用,相关产品也在Google等公司的DevOps流程中得到了广泛部署和使用。包括开源及商业化产品在内,现有的静态分析方案多为???码级分析。面向源代码进行扫描,尽管可以在一定程度上满足软件安全需要,然而在真实安全场景中,待分析对象多为二进制文件,如嵌入式系统固件,商业软件等,研究人员难以获得相应的源代码,此时源码级静态分析方案不再适用。值得一提的是,部分商业化产品(如CodeSonar等)也提供了对于二进制文件的分析能力,然而商业化路线所带来的封闭性,在很大程度上限制了普通研究者的使用和二次开发。与此同时,在开源社区中也涌现出一批知名的二进制分析工具,如 angr[4] 、 BAP[5] 、 cwe_checker[6]...

“精”准把握静态分析|科恩二进制文件自动化静态漏洞检测工具正式开源

about 3 years ago

为提升静态分析在二进制文件漏洞检测领域效率和可扩展性,科恩孵化并开源二进制文件静态漏洞分析工具BinAbsInspector项目。代码仓库地址:https://github.com/KeenSecurityLab/BinAbsInspector 背景软件漏洞检测“两板斧”随着信息产业的发展,网络安全问题日益严峻,软件漏洞对于互联网威胁极大,是网络安全中的核心问题。为了缓解漏洞所造成的危害,需要对软件进行安全检测,尽可能地发现并消除潜在漏洞。目前常见的自动化漏洞检测手段可以分为两类:动态分析测试和静态分析。 动态分析测试方法(如fuzzing等)在过去五年里吸引了研究者的广泛关注,相关系统在工业界中已经得到了大规模的部署和应用。相比于动态方法,静态分析通常具有更高的覆盖率,然而,现阶段对于静态分析的使用多依赖于人工经验规则,且精度和效率之间尚未找到一个合适的平衡点,这导致其在现实场景中的落地不尽如人意。 静态分析工具现状目前国际上较为成功的商业化分析工具有 Coverity[1] 、 CodeSonar[2] 、 VeraCode[3] 等,它们在代码质量保障上发挥了重要作用,相关产品也在Google等公司的DevOps流程中得到了广泛部署和使用。 包括开源及商业化产品在内,现有的静态分析方案多为源码级分析。面向源代码进行扫描,尽管可以在一定程度上满足软件安全需要,然而在真实安全场景中,待分析对象多为二进制文件,如嵌入式系统固件,商业软件等,研究人员难以获得相应的源代码,此时源码级静态分析方案不再适用。 值得一提的是,部分商业化产品(如CodeSonar等)也提供了对于二进制文件的分析能力,然而商业化路线所带来的封闭性,在很大程度上限制了普通研究者的使用和二次开发。与此同时,在开源社区中也涌现出一批知名的二进制分析工具,如...

RSoC—科恩实验室2021编程之夏正式结项

over 3 years ago

8月20日,在经过参与者们逐步项目推进后,RSoC落下帷幕。参与RSoC的高校同学与Rizin核心成员Anton以及科恩实验室研究员深度协作交流,以国际开源逆向工程框架Rizin为研究主体,在科恩实验室感受了别样的代码之夏。RSoC2021年3月,由腾讯安全科恩实验室与国际二进制开源逆向工程框架Rizin联合举办的一场开源程序设计项目—Rizin Summer of Code 2021 正式开启报名申请。报名申请回顾:RSoC-科恩编程之夏申请通道正式开启7月初,RSoC最终参与者来到科恩实验室进行项目沟通规划,8月20日,在经过参与者们逐步项目推进后,RSoC落下帷幕。参与RSoC的高校同学与Rizin核心成员Anton@akochkov以及科恩实验室研究员深度协作交流,以国际开源逆向工程框架Rizin为研究主体,在科恩实验室感受了别样的代码之夏。RizinRizin是项类Unix的逆向工程框架和命令行工具集,是来自世界各地的优秀编程极客的思想结晶,由国际知名免费开源逆向工程框架Radare2提取分支而来。Rizin持有二进制文件分析,反汇编代码,调试程序…等等功能。RSoC参与者结项总结Heersin:在这个暑假,我的项目内容是实现一个对IL相关的bug进行修复和重构,以及为Rizin实现一个基于位向量运算的中间语言支持。目是为了Rizin日后能在此基础上运用一些分析技术。通过这样次实践,我对开源项目的协作有了更深刻的体会,也拓展了我对这一领域的认识。于我而言,我借助这次rsoc接触到了不少与反编译相关的知识,这也是一个了解相关研究和技术实践的切入点。部分解决了我的一个疑惑:一个大型项目是如何组织和管理的。科恩的氛围特别???,大家都对安全技术很有热情且大佬们很多,我在这里学到了不少东西。值得一提的是,科恩给我的感觉是一个很注意成员直接沟通的团队,大家能为了同一个目标去工作,在这样的团队里工作很愉快。Basstorm:七月初,我怀着紧张又激动的心情,开始了科恩实习与RSoC 2021之旅。我在RSoC 2021中的主要任务是Type相关的工作。在第一周,我与Anton合作修复了新的Type Parser中的一些bug,推进了项目的总体进程。之后,我相继完成了迁移Type Constraints、添加对Global variable的支持、重构PDB parser等工作。在这一个多月的工作过程中,我感受到了社区成员间的良好氛围,社区成员都很乐于助人,有问必答,也许这就是开源社区的魅力,大家互帮互助,共同朝着一个美好的目标前进。同时,这一个多月我也是收获满满,不仅收获了相应的开发经验与能力,更锻炼了我适应环境的能力,还认识了一些志同道合的朋友。在科恩实习期间,我感受到了科恩实验室的开放协作、朝气蓬勃的工作氛围,这里都是技术大牛,我也从中学到了不少实用的经验技巧。除此之外,科恩的格言“追求极致、主动担当”也激励着我不畏艰难,砥砺前进。祝愿RSoC可以长久的办下去,也祝愿Rizin和科恩实验室越来越好!科恩秋招/实习生招聘攻略简历投递入口:腾讯招聘官网→...

RSoC—科恩实验室2021编程之夏正式结项

over 3 years ago

8月20日,在经过参与者们逐步项目推进后,RSoC落下帷幕。参与RSoC的高校同学与Rizin核心成员Anton以及科恩实验室研究员深度协作交流,以国际开源逆向工程框架Rizin为研究主体,在科恩实验室感受了别样的代码之夏。 RSoC2021年3月,由腾讯安全科恩实验室与国际二进制开源逆向工程框架Rizin联合举办的一场开源程序设计项目—Rizin Summer of Code 2021 正式开启报名申请。报名申请回顾:RSoC-科恩编程之夏申请通道正式开启 7月初,RSoC最终参与者来到科恩实验室进行项目沟通规划,8月20日,在经过参与者们逐步项目推进后,RSoC落下帷幕。参与RSoC的高校同学与Rizin核心成员Anton@akochkov以及科恩实验室研究员深度协作交流,以国际开源逆向工程框架Rizin为研究主体,在科恩实验室感受了别样的代码之夏。 RizinRizin是项类Unix的逆向工程框架和命令行工具集,是来自世界各地的优秀编程极客的思想结晶,由国际知名免费开源逆向工程框架Radare2提取分支而来。Rizin持有二进制文件分析,反汇编代码,调试程序…等等功能。 RSoC参与者结项总结Heersin:在这个暑假,我的项目内容是实现一个对IL相关的bug进行修复和重构,以及为Rizin实现一个基于位向量运算的中间语言支持。目是为了Rizin日后能在此基础上运用一些分析技术。通过这样次实践,我对开源项目的协作有了更深刻的体会,也拓展了我对这一领域的认识。于我而言,我借助这次rsoc接触到了不少与反编译相关的知识,这也是一个了解相关研究和技术实践的切入点。部分解决了我的一个疑惑:一个大型项目是如何组织和管理的。科恩的氛围特别好,大家都对安全技术很有热情且大佬们很多,我在这里学到了不少东西。值得一提的是,科恩给我的感觉是一个很注意成员直接沟通的团队,大家能为了同一个目标去工作,在这样的团队里工作很愉快。 Basstorm:七月初,我怀着紧张又激动的心情,开始了科恩实习与RSoC 2021之旅。我在RSoC...

腾讯安全科恩实验室推出首款免费在线SCA平台:BinaryAI

over 3 years ago

8月11日,腾讯安全科恩实验室正式发布在线软件成分分析平台——BinaryAI,第一次将软件成分分析(Software Composition Analysis,SCA)技术推广到日常安全研究。伴随着开源软件的迅速成长,应用软件中使用开源代码的比重逐年持续增长。然而,开源代码中的安全问题也让软件市场面临软件供应链安全的挑战。 BinaryAI闪亮登场基于软件安全和人工智能领域的多年研究经验,科恩实验室积极布局软件成分分析方向,已落地并助力厂商修复软件安全问题,现在首次将SCA能力以平台型产品BinaryAI免费开放给用户,旨在推动软件成分分析在DevSecOps、安全研究等场景应用发展。 BinaryAI是二进制文件SCA的智能分析平台,自动化完成文件解析到输出分析结果全部使用环节,帮助研究人员高效实现SCA线上检查的需求。 专注二进制SCA开源代码安全问题不仅存在于源代码,在构建过程中也会引入问题,因此构建阶段的二进制产物有必要进行SCA分析。使用BinaryAI可以确认软件所使用的第三方组件及具体版本号,及时发现引入的问题第三方库,便于研发团队跟进修复。 文件类型全面覆盖用户可以打开BinaryAI官网,上传待分析文件获取SCA功能,现已支持200M以下常见CPU架构的可执行文件及包格式文件的检测。BinaryAI实现智能化文件解包或解析、软件成分分析等分析流程。 后台数据资源丰富经过长期积累,BinaryAI后台具备10000余种第三方组件数据,内容覆盖组件基本信息、开源许可证使用情况等信息,能够全面提升软件成分分析的检测水平,并在持续不断扩大支持范围中。现在向用户开放的信息为组件的基本信息。 SCA检测能力强科恩实验室在近年发表了《Order Matters: Semantic-Aware Neural...

腾讯安全科恩实验室推出首款免费在线SCA平台:BinaryAI

over 3 years ago

8月11日,腾讯安全科恩实验室正式发布在线软件成分分析平台——BinaryAI,第一次将软件成分分析(Software Composition Analysis,SCA)技术推广到日常安全研究。伴随着开源软件的迅速成长,应用软件中使用开源代码的比重逐年持续增长。然而,开源代码中的安全问题也让软件市场面临软件供应链安全的挑战。BinaryAI闪亮登场基于软件安全和人工智能领域的多年研究经验,科恩实验室积极布局软件成分分析方向,已落地并助力厂商修复软件安全问题,现在首次将SCA能力以平台型产品BinaryAI免费开放给用户,旨在推动软件成分分析在DevSecOps、安全研究等场景应用发展。BinaryAI是二进制文件SCA的智能分析平台,自动化完成文件解析到输出分析结果全部使用环节,帮助研究人员高效实现SCA线上检查的需求。专注二进制SCA开源代码安全问题不仅存在于源代码,在构建过程中也会引入问题,因此构建阶段的二进制产物有必要进行SCA分析。使用BinaryAI可以确认软件所使用的第三方组件及具体版本号,及时发现引入的问题第三方库,便于研发团队跟进修复。文件类型全面覆盖用户可以打开BinaryAI官网,上传待分析文件获取SCA功能,现已支持200M以下常见CPU架构的可执行文件及包格式文件的检测。BinaryAI实现智能化文件解包或解析、软件成分分析等分析流程。后台数据资源丰富经过长期积累,BinaryAI后台具备10000余种第三方组件数据,内容覆盖组件基本信息、开源许可证使用情况等信息,能够全面提升软件成分分析的检测水平,并在持续不断扩大支持范围中。现在向用户开放的信息为组件的基本信息。SCA检测能力强科恩实验室在近年发表了《Order Matters: Semantic-Aware Neural Networks for Binary Code Similarity Detection》、《CodeCMR...