Follow feeds: blogs, news, RSS and more. An effortless way to read and digest content of your choice.
Get Feederrsshub.app
Get the latest updates from InfoQ推荐 directly as they happen.
Follow now 60 followers
Last updated 15 days ago
16 days ago
AI 领域近期最热门的话题之一当属 MCP,它通过标准化的接口设计,让大语言模型能够更高效地连接外部工具和数据源,被业界誉为“AI 界的 USB-C 接口”。这种开放的趋势,不仅仅局限于 AI 领域。在项目管理领域,我们同样看到了开放生态的崛起。2025 年 4 月 23...
16 days ago
在 InfoQ 举办的 AICon 全球人工智能开发与应用大会"上网易有道国际 App 产品部业务负责人赵越"做了专题演讲“AI 创新应用 C 端 B 端商业化实践,从中国走向全球”,演讲围绕...
16 days ago
很多人都觉得 2025 年会是“AI 智能体元年”,也就是基于 OpenAI、Anthropic、Google 和 DeepSeek 等机构提供的大语言模型,打造专注特定任务的智能体系统。 但是,最近在社交平台 X 上有个调查显示,现在大部分Agent都在“玩票”阶段,还没真正走出实验室,普遍滞留在“企业试点”的状态中。 不过,李飞飞所在的一支团队或许即将带来改变:他们与西北大学、微软、斯坦福大学和华盛顿大学的研究人员合作,最近推出了一套名为...
16 days ago
5月23日-24日,AICon 全球人工智能开发与应用大会上海站"即将拉开帷幕。本次大会将聚焦 AI 技术的前沿突破与产业落地,围绕 AI Agent、多模态应用、大模型架构创新、推理性能优化、大模型驱动数据创新、AI 产品创新与出海策略等核心议题,呈现技术与应用融合的最新趋势。华为高级开发工程师张君已确认出席AICon 上海并将在大模型推理性能优化策略"专题发表题为《华为昇腾推理技术的优化实践"》的主题分享。随着大模型技术的快速发展,其在LLM、多模态融合等领域的应用越来越广泛。然而,大模型的高效推理仍然是一个关键挑战???从计算复杂度、内存占用、通信技术等各个技术层面展开,如何在保证性能的同时降低计算成本、提升推理效率成为了关键挑战。本次演讲将围绕大模型推理优化的技术发展方向,围绕模型层、推理框架层、算子层这3个方面展开,并结合实践案例,阐述相关的技术方案和选型,帮助听众更好地理解和应用大模型推理技术。张君作为核心开发者参与 AI 框架 (昇思) 的开发,并负责动态图的自动微分以及动静结合模块。目前主要参与大模型推理在昇腾硬件上的相关开发和优化工作,致力于通过优化推理框架、模型算法和算子加速库等层面,进一步提升大模型推理的性能。他在本次会议的详细演讲内容如下:演讲提纲:1...
16 days ago
本月,就在大家还在为 GPT-4o 惊艳的生图、改图能力刷屏时,一个来自中国合肥的开源模型,悄然冲上了全球 AI 图像生成的第一梯队。截图源自Hugging Face(截止4 月 24 日)它叫 HiDream-I1",由初创公司「智象未来」打造:Hugging Face 文生图模型趋势榜第一;Artificial...
16 days ago
近年来,多模态大模型技术发展迅速,展现出强大的视觉理解能力,显著提升了 AIGC 的可控性,各行各业正经历从“人工密集型”到“AI 原生驱动”的颠覆性变革。那么,多模态技术中面临哪些核心技术挑战?在 AIGC 技术落地过程中,会产生什么新的应用场景?大模型的下一阶段突破可能来自哪些方向?近日 InfoQ《极客有约》X AICon 直播栏目特别邀请了 上海交通大学人工智能学院副教授赵波 担任主持人,和 快手快意多模态模型算法负责人高欢、腾讯混元专家研究员邵帅...
16 days ago
作者 | 华卫 4月22日,酷开在以“大爱AI”为主题的2025春季发布会上发布超级智能体,包括影音、健康、生活、设备、创作、教育六大智能体,以及智能体硬件酷开学习机 Y41 Air、酷开闺蜜机C20系列等产品。深耕AI领域多年的酷开宣布:正式以AI原生企业的定位面向未来发展。 “所有硬件都值得用AI重做一遍”,酷开CEO王志国在现场表示。 当下,市面上各类智能体如雨后春笋涌现,但由于缺乏应用广度及深度,以及设备交互无法承载场景需求,智能体的应用价值未得到充分发挥。市面上不缺乏智能体,但缺少能够提供满意服务的智能体。 据王志国介绍,此次推出超级智能体后,酷开接下来的规划是分步走的。第一,做用户数据的闭环,要观察三个月左右的时间,尤其是用户留存、活跃数据和功能满足率大方面;第二,主动服务能力是下一个重心,准备把超级智能体的意图识别模型从7B模型换到32B模型,把它做成跟用户情感对话的工具;第三,时刻保持着跟行业内最领先的大模型做,一定要做AI原生,只要中间隔着人,大模型的能力就会被大幅度衰减。 同时,酷开超级智能体和六大专业智能体支持软件售卖、设备授权、PaaS服务、生态共赢的等合作模式,致力构建开放智能生态。据王志国透露,今年Q1季度,酷开签约智能体销售(软件销售)已经达到了软件和硬件各占一半。 “性价比是我们追求的主要方向。今天大厂的逻辑基本上都是在大模型上下工夫,而就只有我们这样的应用厂商才会真正去考虑性价比。” 王志国表示,酷开内部还在做这几件事:首先是核算成本。当大规模使用时能不能确保成本足够低的,如果不低,所有都用不了。其次是确保用户的数据是否达到基本的程度。智能体不是想卖售卖就售卖的,需要成为一个标准化产品。...
16 days ago
作者 | 褚杏娟、华卫在 4 月 25 日的百度 Create 开发者大会现场,百度创始人李彦宏发布了两大模型、多款热门 AI 应用,并宣布将帮助开发者全面拥抱 MCP。同时,百度正式点亮了国内首个全自研的三万卡集群,可同时承载多个千亿参数大模型的全量训练,支持...
16 days ago
整理|华卫 刚刚,OpenAI 宣布,将推出深度研究工具Deep Research的全新“轻量级”版本,以扩大 ChatGPT Plus、Team 和 Pro 用户对Deep Research当前的使用限额。 今日起,所有免费用户也都可以使用轻量级的Deep Research版本,所有Plus用户、团队用户和专业版用户对深度调研功能的使用权限都已扩大。企业用户和教育用户将在下周获得访问权限,且使用额度与团队用户相同。...
16 days ago
从OpenAI于3月27日宣布全面支持MCP协议开始,市面上的MCP Server数量,在不到一个月的时间里,逼近了10,000大关。接下来,Google在4月10日为Gemini系列模型添加了对MCP协议的支持,称其为“AI Agent时代的开放标准”,同时推出A2A协议(Agent-to-Agent Protocol)与MCP形成互补,聚焦智能体间协作。至此,从模型到Agents,Agents之间的多点协作,在通信协议层面,已经完全就绪,AI推理业务至此完成了在2025年的“二级加速”,可以预见的是,其云用量即将迎来迅猛上涨。 但对于AI Infra来说,仍面对很大挑战。从技术产品上,整个AI Infra属于迭代更新的初期,还有大量面对推理的调优亟待完成,比如模型下载的策略优化等。本质上,预训练业务与推理业务,对AI Infra的需求,有着非常大的不同。预训练对单卡性能和显存带宽要求极高,需适配大规模专家并行系统。但推理业务更看重推理数据传输效率、全链条的低延迟,以及稳定性、可观测等方面。基于以上行业变化,云厂商纷纷处于“技术解题”阶段,最新交卷的火山引擎AI云原生,给出了一份让客户推理更强、更省的解决方案。我们该如何理解ServingKit 推理套件4月17日,在杭州火山引擎Force Link大会上,火山引擎推出AI云原生推理套件ServingKit,目标是为企业提供从模型部署、推理优化到运维观测的一站式解决方案。套件内涉及多项服务,包括镜像服务、算子加速器、AI网关等等。应该说,2025年,各家云厂商的一个主要任务,就是对AI推理业务的基础设施进行升级。但以全链路服务套件的形式推出,目前来看,仅有火山引擎一家。火山引擎云基础产品负责人罗浩对InfoQ分享了背后的思考:在服务客户的过程中,火山引擎发现,有一类客户,原本就是做企业服务的,他们可能在开发AI中间件,甚至正在推动AI平台类产品的诞生。这类客户可能会有模型开发和定制服务。还有一类客户是大体量的C端互联网公司,他们往往具有很强的科研驱动力。第三类客户像金融行业、汽车行业,可能会组建AI相关业务部门,专注AI带来的业务效率提升与品牌增值效果。因此不同客户群体对AI技术的底层需求完全不同,可能会用三种不同的工具来实现AI的能力。且不想将自己的能力完全绑定在某个技术提供方身上,这是可以理解的。所以今天的AI Infra升级,不仅需要为客户提供资源层面的能力,还需要提供解决方案层面的能力和服务。从技术上要看懂ServingKit,也不麻烦。简单来说,就是推理业务的主要流程,在各个核心节点做优化。总体来说,在推理服务启动前,需完成模型仓库调度与异构资源适配:即从Hugging Face拉取模型文件及依赖库,通过分级缓存策略(如火山引擎ServingKit的Onion镜像权重加速引擎)加速分发。模型加载与预热完成后,来自公网或私网的推理请求流量,通过智能网关进行分发与治理。与此同时也要注意资源的运维和调度,包括将Prefill预填充与Decoder生成阶段解耦,按负载独立扩缩容器实例。通过统一的KV...
16 days ago
5月23日-24日,AICon 全球人工智能开发与应用大会上海站"即将拉开帷幕。本次大会将聚焦 AI 技术的前沿突破与产业落地,围绕 AI Agent、多模态应用、大模型架构创新、推理性能优化、大模型驱动数据创新、AI 产品创新与出海策略等核心议题,呈现技术与应用融合的最新趋势。腾讯推理架构师向乾彪已确认出席AICon 上海并在大模型推理性能优化策略"专题发表题为《腾讯混元 AngelHCF 推理加速框架优化实践"》的主题分享。腾讯 AngelHCF 推理加速框架针对混元...
16 days ago
AI 领域近期最热门的话题之一当属 MCP,它通过标准化的接口设计,让大语言模型能够更高效地连接外部工具和数据源,被业界誉为“AI 界的 USB-C 接口”。这种开放的趋势,不仅仅局限于 AI 领域。在项目管理领域,我们同样看到了开放生态的崛起。 2025 年 4 月...