Follow feeds: blogs, news, RSS and more. An effortless way to read and digest content of your choice.
Get Feedercdjax.com
Get the latest updates from jax directly as they happen.
Follow now 17 followers
Last updated 22 days ago
22 days ago
4月18日,扣子空间正式开启内测,有网友通过Prompt hacking挖出了它的系统提示词: 你是任务执行专家,擅长根据用户的需求,调用多个工具完成当前任务。 # 消息模块说明 – 必须使用工具(函数调用)进行响应,禁止使用纯文本响应 – 尽量独立解决问题,在必要的时候才使用 message_ask_user 工具与用户进行交互 –...
about 1 month ago
Vibe Coding这个词火了,指挥AI干活的风潮席卷全球。为了验证当下的实际效果,最近正好想把多个模型供应商开放的免费模型放在一起,方便自己使用的同时,也能再降低独立开发者对接大模型API的门槛。 我用的工具:Trae国际版+Cursor(Claude3.5/3.7+DeepSeek-V3-0324) 技术架构:Next.js+Supabase+Vercel 如果你也想体验AI编程,推荐黄叔在WaytoAGI社区发布的Build on Trae系列教程,跟着实操很容易上手~ https://waytoagi.feishu.cn/wiki/O5V5wLC5Jiilpjk9j9RcAuACnZcWaytoAGI 直接进入正题: AI Tools开放平台 https://platform.aitools.cfd/...
about 2 months ago
Agent Loop(智能体循环) 是自主智能体(AI Agent)的核心运行机制,通过不断迭代的步骤实现目标导向的任务执行。以下是其核心流程及关键组成部分: 1. 核心原理:闭环反馈驱动 Agent Loop是一个持续循环的过程,通过以下步骤动态调整策略以完成任务: 输入解析:理解用户指令或环境状态。 规划与决策:生成行动计划(如分解子任务、选择工具)。 执行操作:调用工具(如API、代码、外部服务等)获取结果。 反馈学习:根据执行结果调整策略,优化后续步骤。...
2 months ago
Manus还在少量邀请测试中,但官方做了会话回放功能,使得更多用户可以看到Manus的工作过程以及产生的交付物。 从几个回放的会话中观察到了目前Manus能够执行的行为,列了一下(括号中为具体操作): 使用终端(执行命令) 使用编辑器(创建文件、编辑文件、读取文件) 使用搜索(搜索) 使用浏览器(浏览、向下滚动、点击元素、处理浏览器错误) 状态: 初始化沙盒 建议的知识 连接数据源(Get stock profile、Get...
3 months ago
-运行模型(本地没有会自动pull,模型名称可以带远程仓库路径):ollama run 模型名称 -运行时显示性能数据:ollama run –verbose 模型名称 -拉取模型(比如嵌入模型):ollama pull 模型名称 -查看已安装模型(可看到模型大小和安装时间):ollama list...
3 months ago
在深度学习中,稠密架构(Dense Architecture)和稀疏架构(Sparse Architecture)是两种常见的神经网络设计方式,它们的主要区别在于神经元或连接的分布密度。 1. 稠密架构(Dense Architecture) 稠密架构是指每一层的神经元都与前一层的所有神经元连接的网络结构。这种结构在大多数传统的深度学习网络中都很常见,比如经典的全连接神经网络(Fully Connected Networks)和卷积神经网络(CNN)中的某些部分。 • 特点: •...
3 months ago
在回沪的航班上,我用本地大模型翻译了这篇paper,这里也分享出来,省略部分图表。 DeepSeek-R1:通过强化学习激励大型语言模型的推理能力 DeepSeek-AIresearch@deepseek.com 摘要我们介绍了我们的第一代推理模型,DeepSeek-R1-Zero 和DeepSeek-R1 。DeepSeek-R1-Zero 是通过大规模强化学习(RL)训练的模型,没有经过监督微调(SFT)作为初步步骤,展现了显著的推理能力。通过 RL,DeepSeek-R1-Zero 自然地展现出许多强大而有趣的推理行为。然而,它面临着可读性差和语言混合等挑战。为了解决这些问题并进一步增强推理性能,我们引入了 DeepSeek-R1,该模型在 RL 之前结合了多阶段训练和冷启动数据。...
3 months ago
1月 2024-01-01 20:19:02 对甜品的最高评价是不太甜 对男人的最高评价是不太男 2024-01-02 12:02:27 一些景点有了新的装修;iPhone用上了八达通;更多商户支持了WeChatPay和Alipay;KeeTa崛起,蚕食Foodpanda等外卖平台;很多地方还残留有covid-2019疫情的贴纸提示,有些taxi上也还留有“认证抗疫的士”的贴纸; 2024-01-02 12:05:16 元旦假期日均出入境人次恢复到2019年水平 2024-01-02...
3 months ago
1、去年5月V2发布后,我首次注意到DeepSeek-chat和DeepSeek-coder两个模型,API价格是国内最低的。当时还不了解DeepSeek的愿景是实现AGI,只觉得幻方做量化交易囤了GPU正好用来训练自己的大模型,是蛮自然的事情。后来读了36氪”暗涌Waves”栏目在23年和24年两次对梁文锋的采访,才更加了解这个团队以及模型背后的故事。 2、DeepSeek对世界的重大贡献是把具有思维链的推理模型R1开源了,并且是1月20日当天发布即开源。而OpenAI的o1是去年9月发布预览版,12月发布正式版,满血的o1需要200美元的Pro订阅用户才可以用到。 3、模型开源,最直接能体会到的是可以把具有推理过程的LLM运行在自己的设备上,不用联网、不用把你的问题发送到服务器。企业或组织也可以很方便的将模型部署在组织内部。 4、我在16GB内存的M芯片MacBook Pro上用Ollama运行了R1-7b参数的版本,在需要深度思考和推理的问题上,表现确实优于Qwen2.5,但某些测试问题,思维链在反思中会否定正确答案,或者连续几分钟仍在思考中像是进入了死循环。DeepSeek线上的网页版应该是671b的版本,则没有出现这类情况。 5、除夕当天,DeepSeek在全球所有区的AppStore(来自七麦数据监测的149个国家和地区应用商店)免费榜登顶,此前应该没有任何app达成这个成就。
5 months ago
1. 引言 o1 系列模型是 OpenAI 通过强化学习(RLHF)训练的高级语言模型。其核心特性之一是链式推理(Chain of Thought, CoT),这使得模型能够在回答问题前进行逻辑推理,从而提升其在复杂任务中的表现。 • 主要功能: •...
7 months ago
华为于2024年10月8日宣布开启手机版原生鸿蒙操作系统HarmonyOS NEXT的公测,首批开启公测的设备共3个系列14个型号(Mate60系列、MateX5系列、MatePad13寸2024款)。 华为自今年1月中旬开始启动开发者内测,6月底至9月底经过4轮先锋用户内测,现在正式进入公测,但国民级超级应用“微信”一直没有上架鸿蒙应用市场。随着公测开启,腾讯也终于宣布微信同日开启邀请内测,内测时间为10月8日至12日。从部分参与内测的用户分享截图来看,鸿蒙原生版微信的版本号为1.0.0,首页标题为“微信测试版”,目前已有基础通信(支持消息和音视频聊天,暂不支持转发消息/收发文件/红包等)、公众号、小程序(仅支持下拉查看“最近使用的小程序”,暂不支持搜索)、朋友圈、扫一扫、收付款及零钱包等功能,暂不支持视频号及直播。 WXG员工@客村小蒋 在微博分享了鸿蒙原生版微信的开发难点: 1、鸿蒙原生版和 iOS、安卓有啥区别? 原生鸿蒙(HarmonyOS NEXT)完全是一套新的技术框架,编程语言是独特的 ArkTS 语言,这意味着所有的 app...