Follow feeds: blogs, news, RSS and more. An effortless way to read and digest content of your choice.
Get Feederjiqizhixin.com
Get the latest updates from 机器之心 directly as they happen.
Follow now 88 followers
Last updated less than a minute ago
about 1 hour ago
编辑|泽南、Panda今天上午,上海创智学院 OpenMOSS 团队联合初创公司模思智能(MOSI),正式发布了端到端音视频生成模型 —— MOVA(MOSS-Video-and-Audio)。作为中国首个高性能开源音视频模型,MOVA 实现了真正意义上的「音画同出」。它不仅能生成长达 8 秒、最高 720p 分辨率的视听片段,更在多语言口型同步、环境音效契合度上展现了极高的工业水准。更具行业意义的是,在 Sora 2...
about 1 hour ago
编辑|杨文AI 网红们在社交平台上混得风生水起。他们手握品牌合作,还坐拥百万粉丝,但很多人至今不知这些都是 AI 生成的,依然像追真人明星一样互动、点赞、被种草。 视频来源:X 博主 @thetripathi58这也难怪有博主直呼:虚拟网红时代已经到来。现在,昆仑万维也来添了把火,直接把背后的技术开源了。1 月 29 日,Skywork AI 团队宣布开源...
about 1 hour ago
编辑|冷猫你想象中真正的 AI 是什么样子的?至少有一点,大多数人会同意:未来的 AI,应该具备像人一样思考的能力。问题在于,我们现在研究大模型走的这条路,能通向真正的「思考」吗?当前最先进的大模型系统,几乎是在整个人类可获取的历史数据之上训练出来的:网页、书籍、代码、论文、对话,数万亿 token。训练大模型所需的数据,远超任何一个人类个体一生所能接触的总和。AI 需要整个互联网来学习,而人类只需要一个童年。人类在成年之前,所接触的语言、文本与符号,顶多只有几十亿 token,相差几个数量级。正是从这个问题出发,一家几乎没有产品、没有盈利、也不急于商业化的 AI 创业公司,从 GV、Sequoia 和 Index...
about 4 hours ago
近日,科技巨头亚马逊继去年裁员 14000 名员工后,再次开启新一轮大规模裁员,预计影响 16000 名员工。其实这一次裁员属于计划内操作,去年十月的裁员期间,亚马逊就列了个约 3 万个岗位的裁员计划,这一次属于计划的「收尾」阶段,但这并不排除其后续进一步裁员的可能性。据了解,此次裁员范围波及全球,或将涉及亚马逊网络服务、零售、Prime Video 和人力资源等多个团队,但具体的裁员地点、职位等更多细节尚不清楚。但「有意思」的是,一名亚马逊员工使用 AI 工具对内部 Slack...
about 4 hours ago
多模态生成技术突飞猛进,成为目前人工智能领域的热点。Midjourney和Sora等产品获得惊艳的效果,并给我们获取信息的主要途径之一--推荐系统--带来深远的影响,甚至一场底层范式的根本性变革:从传统的“在既有内容库中选择与用户兴趣匹配的候选项”进化为“为每一位用户主动创作生成独一无二的个性化内容”。长期以来,推荐系统主要进行“兴趣匹配”的工作:在海量的物品或内容库中搜寻选择出可能与用户兴趣匹配的候选项。如今,在新闻、电影、电商、短视频、创作等多种场景中被推荐的对象是多模态内容,新一代推荐系统可能不再通过在既有内容库中“选”,而是根据用户的兴趣现“造”一个符合个性化偏好的内容。华中科技大学张瑞教授团队最近发表于“计算机科学与探索”期刊的综述论文《面向推荐系统的多模态生成研究综述》(An Overview of Multimodal Generation for Recommender Systems)揭示了多模态推荐系统的这一正在发生的范式革新,并率先形式化地阐明了这个新范式,为该领域的工作提供理论框架。论文标题:面向推荐系统的多模态生成研究综述(An Overview of Multimodal Generation...
about 4 hours ago
在当前人工智能从“聊天”范式加速向“能办事”的智能体时代演进的关键节点,LLM 系统优化与技术落地的实践探索,更需要开发者们的深度联结与经验共创。基于此,由 SGLang 社区、机器之心、张江孵化器联合举办线下 Meetup,让屏幕前的贡献者走到台前,让幕后优化者分享实战心法。2 月 6日下午,「SGLang 上海 Meetup」将在上海浦东·纳贤路 800 号 1...
about 5 hours ago
Moltbot是近期推出的现象级开源Agent项目,原名 Clawdbot,用户无需打开网站或App,通过通讯软件即可发送消息并执行任务。该项目的部署方式已成为全球用户关注的焦点,海外社交媒体甚至涌现大量用户购买Mac mini来本地部署。在国内,阿里云、腾讯云等云厂商也陆续提供 Moltbot 云服务,作为工作场景的首推入口,钉钉也在 Github 上开源了 Moltbot接入方式。用户在终端用钉钉发送命令,Moltbot即可自动在云端执行任务,这也意味着人人都能拥有一个专属的工作AI助手。(Github 地址:https://github.com/DingTalk-Real-AI/dingtalk-moltbot-connector)一、钉钉机器人配置第一步:如何申请钉钉机器人1.打开 钉钉开放平台2.登录后进入 应用开发→ 企业内部开发3.创建应用,选择...
about 6 hours ago
编辑丨ScienceAI基因组如同一本细胞运行的「操作指南」,详尽记录着生物体从组装到运作的全部指令,掌控着生命活动的每个环节。然而,这是一本由 DNA 编码的「天书」,并且字母排版错误 —— 基因变异就可能导致生物体产生重要改变。解读基因组序列变异的影响是生物学领域的关键挑战。基于此,谷歌 DeepMind 的研究人员提出了 AlphaGenome,它以 1 兆碱基的 DNA 序列作为输入,能够预测数千个功能基因组轨迹,最高可达单碱基对分辨率,涵盖多种模态,包括基因表达、转录起始、染色质可及性、组蛋白修饰、转录因子结合、染色质接触图谱、剪接位点使用情况以及剪接连接点的坐标和强度。今天,研究论文登上了最新一期《Nature》杂志封面。论文地址:https://www.nature.com/articles/s41586-025-10014-0目前,AlphaGenome...
about 9 hours ago
编辑|泽南、杜伟从上周末开始,AI 圈最火的当属可以 24 小时自动运行的「Clawdbot」!这个智能体助手是真的能帮你干活,它已经引走了 AI 圈的大半注意力。甚至因为太火被 Anthropic 指控商标侵权,Clawdbot 已经改名为「Moltbot」。短短一周的时间,Clawdbot 在 GitHub 上的...
about 9 hours ago
扩散语言模型(Diffusion LLMs, dLLMs)因支持「任意顺序生成」和并行解码而备受瞩目。直觉上,打破传统自回归(AR)「从左到右」的束缚,理应赋予模型更广阔的解空间,从而在数学、代码等复杂任务上解锁更强的推理潜力。然而,本研究揭示了一个反直觉的现实:当前的任意顺序生成,反而通过「规避不确定性」收窄了模型的推理边界。基于此,本文提出了一种回归极简的方法——JustGRPO。实验表明,在 RL 阶段让模型自回归生成,并直接用标准的 GRPO 进行训练,即可超越当前各类针对 dLLM 设计的 RL 算法表现。更重要的是,这种训练方式在提升推理表现的同时,并未牺牲 dLLM...
about 9 hours ago
1 月 29 日,继连续发布空间感知与VLA基座模型后,蚂蚁灵波科技再次刷新行业预期,开源发布世界模型 LingBot-World。该模型在视频质量、动态程度、长时一致性、交互能力等关键指标上均媲美 Google Genie 3,旨在为具身智能、自动驾驶及游戏开发提供高保真、高动态、可实时操控的“数字演练场”。图说:LingBot-World在适用场景、生成时长、动态程度、分辨率等方面均处于业界顶尖水平针对视频生成中最常见的“长时漂移”问题(生成时间一长就可能出现物体变形、细节塌陷、主体消失或场景结构崩坏等现象),LingBot-World通过多阶段训练以及并行化加速,实现了近 10 分钟的连续稳定无损生成,为长序列、多步骤的复杂任务训练提供支撑。交互性能上,LingBot-World 可实现约 16...
about 10 hours ago
1月29日上午,平头哥官网悄然上线一款名为“真武810E”的高端AI芯片,此前被央视《新闻联播》曝光的阿里自研芯片PPU正式亮相。这是通义实验室、阿里云和平头哥组成的阿里巴巴AI黄金三角“通云哥”首次浮出水面。阿里巴巴正在将“通云哥”打造成一台AI超级计算机,它同时拥有全栈自研芯片平头哥、亚太第一的阿里云,以及全球最强的开源模型“千问”,可以在芯片架构、云平台架构和模型架构上协同创新,从而实现在阿里云上训练和调用大模型时达到最高效率。目前,阿里和谷歌是全球唯二在大模型、云和芯片三大领域均具备顶级实力的科技公司。据悉,“真武”PPU已在阿里云实现多个万卡集群部署,服务了国家电网、中科院、小鹏汽车、新浪微博等400多家客户。 (图说:平头哥官网上线“真武”PPU。)据平头哥官网介绍,“真武”PPU采用自研并行计算架构和片间互联技术,配合全栈自研软件栈,实现软硬件全自研。其内存为96G HBM2e,片间互联带宽达到700 GB/s,可应用于AI训练、AI推理和自动驾驶。阿里巴巴已将“真武”PPU大规模用于千问大模型的训练和推理,并结合阿里云完整的AI软件栈进行深度优化,为客户提供一体化产品和服务。据业内人士透露,对比关键参数,“真武”PPU的整体性能超过了英伟达A800和主流国产GPU,与英伟达H20相当。另据外媒最新报道,升级版“真武”PPU的性能强于英伟达A100。多位行业从业者告诉记者,“真武”PPU性能优异稳定、性价比突出,在业内口碑良好,市场供不应求。“真武”PPU的正式亮相,显示了平头哥在芯片领域积累多年的实力。阿里巴巴2009年创建阿里云,2018年成立平头哥芯片公司,2019年启动大模型研究,经过长达17年的战略投入和垂直整合,终于实现“通云哥”全栈AI的完整布局。1月26日,通义实验室发布千问旗舰推理模型Qwen3-Max-Thinking,创下多项权威评测全球新纪录,性能媲美GPT-5.2、Gemini 3 Pro。全球最大AI开源社区Hugging Face的最新数据显示,千问开源模型的衍生模型数量突破20万个,下载量突破10亿次,稳居全球第一。