Follow feeds: blogs, news, RSS and more. An effortless way to read and digest content of your choice.
Get Feederjiqizhixin.com
Get the latest updates from 机器之心 directly as they happen.
Follow now 97 followers
Last updated 3 months ago
3 months ago
「DeepSeek V4 来了!」这样的消息是不是已经听烦了?我们也是。不过 DeepSeek V4 虽然迟迟未发,但今天我们等来了其与清华、北大合作撰写的一篇新论文。总结来说,这篇新论文介绍了一个名为「DualPath」的创新推理系统,专门针对智能体工作负载下的大语言模型(LLM)推理性能进行优化。具体来讲,通过引入「双路径 KV-Cache 加载」机制,解决了在预填充 - 解码(PD)分离架构下,KV-Cache 读取负载不平衡的问题。该推理系统带来了显著效果:在离线推理场景中实现了 1.87...
3 months ago
编辑丨%过去几年,生成式人工智能(Generative AI)在生物医学领域大放异彩。从蛋白结构预测到药物筛选,大模型不断刷新效率边界。但它们始终有一个隐形前提:单体模型在执行任务。来自美国洛杉矶 Cedars-Sinai 医疗中心的一支团队提出了一个更激进的方向——让多个「具备自主决策能力的智能体人工智能(Agentic AI)」协作。他们总结出有助于智能体 AI 系统开发的三种关键算法和七种基础构建块特征,并重点介绍了它们的应用、设计考量,以及在后续部署中面临的挑战和机遇。相关研究内容以「Agentic AI and the rise of...
3 months ago
在全球具身智能领域的顶级权威评测 WorldArena 榜单中,清华陈建宇(星动纪元创始人)团队联合斯坦福 Chelsea Finn(PI 创始人) 团队研发的 Ctrl-World 世界模型交出优异答卷:具身任务能力斩获全球第一,更在主体一致性、轨迹精度、深度准确性、策略评估一致性四大核心维度登顶;视频生成能力排名全球第二,仅次于阿里 Wan 2.6,强势超越谷歌 Veo...
3 months ago
编辑|冷猫去年 7 月的 IMO 数学奥林匹克竞赛中,两大人工智能公司抢夺竞赛「金牌」成绩的闹剧搞得沸沸扬扬。当时 OpenAI 和 谷歌 同时声称取得竞赛金牌,而 OpenAI 因绕过官方竞赛规则提前官宣,遭到广泛吐槽;谷歌 DeepMind...
3 months ago
编辑|Panda、冷猫刚刚,路透社与 The Information 等多家媒体报道称,此前加入 Meta 的前苹果 AI 负责人庞若鸣已经加入 OpenAI。庞若鸣此前在 Meta Superintelligence Labs...
3 months ago
目前,时间序列预测方法通常采用基于极大似然估计的 MSE 作为损失函数,但这类损失在标签序列具有自相关性时有偏。近期,北大林宙辰团队将时间序列预测转化为条件分布对齐问题。并提出一种新的损失函数,通过最小化预测序列与标签序列条件分布之间的 Wasserstein 距离训练预测模型;既能保证无偏训练,又能充分考虑标签序列内的几何结构(自相关性)。这一工作为以最优传输为代表的分布对齐技术赋能预测问题提供了全新的研究思路和理论框架。论文标题:DistDF: Time-series Forecasting Needs Joint-distribution Wasserstein Alignment作者单位: 小红书、北京大学、浙江大学、上海财经大学、松鼠...
3 months ago
编辑|Panda、杨文马斯克又一次跳过了所有正式流程。没有官方博客,没有技术文档,甚至连宣传推文都把自家产品的名字给拼错了。但就在这种极其「马斯克」的氛围中,Grok 4.20 Beta 版悄无声息地正式上线并进行了更新。正如马斯克之前说的那样,Grok 4.20 采用了某种快速学习机制,能够持续进化。18 号开始公测后能每周通过用户真实交互持续迭代,不再等下一次大版本更新。对于当前版本的 Grok 4.20,xAI 给出的官方介绍是「4 Agents」,也就是说,与以往单一的 Grok...
3 months ago
大模型已经很强,但一旦进入 “长对话、跨多轮、多任务” 的真实智能体交互场景,模型很快就会遇到两类老问题:一是上下文窗口有限,越聊越长时不可避免地 “塞不下”;二是经典的 lost in the middle,即使塞得下也未必用得好。于是,给大模型配 “外部记忆系统” 尤为重要:把对话写进长期记忆、需要时再检索出来。但现实很快给出了代价 —— 记忆系统往往非常贵:频繁调用大模型做总结...
3 months ago
编辑|泽南、杨文最近频频登上新闻头条的 OpenClaw,终于被「制裁」了一回。本周一,谷歌宣布限制部分开发者使用旗下 vibe Coding 平台 Antigravity,并指控他们「恶意使用」,此举在社交平台上引发了争议。 Windsurf 前联合创始人、现任 Google Antigravity 成员 Varun...
3 months ago
视频生成扩散模型越做越大:2B、5B、14B…… 效果提升很快,但训练与推理的成本也随之飙升。社区一直希望用量化把模型 “压小”,把显存和算力成本打下来,真正落到更多卡、更便宜的机器、更多真实应用中。可现实很残酷:一到 3/4 bit,视频生成的量化感知训练(QAT)往往比图像更难训、更不稳定,质量掉得更狠 —— 不是 “略降一点”,而是直接不可用。图表 1 在 CogVideoX-2B 模型上...
3 months ago
编辑|冷猫今天,Web 开发社区爆发了一条令人咋舌的技术新闻。Cloudflare 的一名工程师在一周之内,借助 AI 模型从头重建了 Next.js 。该公司的首席技术官 Dane Knecht 发推庆祝这一史诗级的成就,称之为「Next.js 的解放日」,Next.js 属于每个人。Cloudflare...