Follow feeds: blogs, news, RSS and more. An effortless way to read and digest content of your choice.
Get Feedercdjax.com
Get the latest updates from jax directly as they happen.
Follow now 19 followers
Last updated 1 day ago
1 day ago
You are an interactive CLI agent specializing in software engineering tasks. Your...
6 days ago
文/Jerry、Gemini AI编码工具的浪潮正以前所未有的方式重塑软件开发行业。然而,若仅仅将这些工具视为简单的聊天机器人或代码补全器,我们将错失其真正的潜力。我们正处在一个新时代的黎明,在这个时代,开发者生产力的下一次飞跃将不再仅仅源于更强大的大型语言模型(LLM),而是源于更精密的沟通协议和上下文管理工具。 从最初简单的代码片段建议,到如今能够执行复杂、多文件任务的AI Agent,我们与AI的互动模式正在发生根本性的转变。这种转变凸显了一个核心挑战:如何有效地与这些日益强大的AI系统进行沟通?当AI的“记忆”有限、知识陈旧、且其推理过程如同一个“黑箱”时,我们如何确保它能准确理解我们的意图,并可靠地执行任务? 本文旨在深入探讨这一核心问题。笔者将剖析当前开发者与AI沟通时面临的根本性障碍,并以AI原生代码编辑器Cursor为例,详细拆解其为解决这些问题而设计的精密工具集。更重要的是,我们将视野拓宽至整个生态系统,审视诸如模型上下文协议(Model Context Protocol, MCP)等新兴标准,以及Context7等第三方服务如何共同构建一个更加智能、可控的AI协作环境。通过对主流AI编码工具的横向比较,我们将揭示行业的发展趋势,并最终描绘出在人机协作的新范式下,未来软件开发的蓝图。这不仅是一份工具指南,更是一次对未来开发者角色的深度思考。 沟通的鸿沟——你的“AI程序员实习生”需要一份指南 在深入探讨解决方案之前,我们必须首先理解问题的本质。为何我们需要专门的工具来与AI沟通?答案在于当前大型语言模型固有的局限性。这些局限性构成了人机协作中的“沟通鸿沟”,只有正视它们,我们才能构建有效的桥梁。 记忆与注意力的极限:“迷失在中间” 大型语言模型最广为人知的特性之一是其“上下文窗口”(Context...
2 months ago
4月18日,扣子空间正式开启内测,有网友通过Prompt hacking挖出了它的系统提示词: 你是任务执行专家,擅长根据用户的需求,调用多个工具完成当前任务。 # 消息模块说明 – 必须使用工具(函数调用)进行响应,禁止使用纯文本响应 – 尽量独立解决问题,在必要的时候才使用 message_ask_user 工具与用户进行交互 –...
3 months ago
Vibe Coding这个词火了,指挥AI干活的风潮席卷全球。为了验证当下的实际效果,最近正好想把多个模型供应商开放的免费模型放在一起,方便自己使用的同时,也能再降低独立开发者对接大模型API的门槛。 我用的工具:Trae国际版+Cursor(Claude3.5/3.7+DeepSeek-V3-0324) 技术架构:Next.js+Supabase+Vercel 如果你也想体验AI编程,推荐黄叔在WaytoAGI社区发布的Build on Trae系列教程,跟着实操很容易上手~ https://waytoagi.feishu.cn/wiki/O5V5wLC5Jiilpjk9j9RcAuACnZcWaytoAGI 直接进入正题: AI Tools开放平台 https://platform.aitools.cfd/...
3 months ago
Agent Loop(智能体循环) 是自主智能体(AI Agent)的核心运行机制,通过不断迭代的步骤实现目标导向的任务执行。以下是其核心流程及关键组成部分: 1. 核心原理:闭环反馈驱动 Agent Loop是一个持续循环的过程,通过以下步骤动态调整策略以完成任务: 输入解析:理解用户指令或环境状态。 规划与决策:生成行动计划(如分解子任务、选择工具)。 执行操作:调用工具(如API、代码、外部服务等)获取结果。 反馈学习:根据执行结果调整策略,优化后续步骤。...
4 months ago
Manus还在少量邀请测试中,但官方做了会话回放功能,使得更多用户可以看到Manus的工作过程以及产生的交付物。 从几个回放的会话中观察到了目前Manus能够执行的行为,列了一下(括号中为具体操作): 使用终端(执行命令) 使用编辑器(创建文件、编辑文件、读取文件) 使用搜索(搜索) 使用浏览器(浏览、向下滚动、点击元素、处理浏览器错误) 状态: 初始化沙盒 建议的知识 连接数据源(Get stock profile、Get...
5 months ago
-运行模型(本地没有会自动pull,模型名称可以带远程仓库路径):ollama run 模型名称 -运行时显示性能数据:ollama run –verbose 模型名称 -拉取模型(比如嵌入模型):ollama pull 模型名称 -查看已安装模型(可看到模型大小和安装时间):ollama list...
5 months ago
在深度学习中,稠密架构(Dense Architecture)和稀疏架构(Sparse Architecture)是两种常见的神经网络设计方式,它们的主要区别在于神经元或连接的分布密度。 1. 稠密架构(Dense Architecture) 稠密架构是指每一层的神经元都与前一层的所有神经元连接的网络结构。这种结构在大多数传统的深度学习网络中都很常见,比如经典的全连接神经网络(Fully Connected Networks)和卷积神经网络(CNN)中的某些部分。 • 特点: •...
5 months ago
在回沪的航班上,我用本地大模型翻译了这篇paper,这里也分享出来,省略部分图表。 DeepSeek-R1:通过强化学习激励大型语言模型的推理能力 DeepSeek-AIresearch@deepseek.com 摘要我们介绍了我们的第一代推理模型,DeepSeek-R1-Zero 和DeepSeek-R1 。DeepSeek-R1-Zero 是通过大规模强化学习(RL)训练的模型,没有经过监督微调(SFT)作为初步步骤,展现了显著的推理能力。通过 RL,DeepSeek-R1-Zero 自然地展现出许多强大而有趣的推理行为。然而,它面临着可读性差和语言混合等挑战。为了解决这些问题并进一步增强推理性能,我们引入了 DeepSeek-R1,该模型在 RL 之前结合了多阶段训练和冷启动数据。...
5 months ago
1月 2024-01-01 20:19:02 对甜品的最高评价是不太甜 对男人的最高评价是不太男 2024-01-02 12:02:27 一些景点有了新的装修;iPhone用上了八达通;更多商户支持了WeChatPay和Alipay;KeeTa崛起,蚕食Foodpanda等外卖平台;很多地方还残留有covid-2019疫情的贴纸提示,有些taxi上也还留有“认证抗疫的士”的贴纸; 2024-01-02 12:05:16 元旦假期日均出入境人次恢复到2019年水平 2024-01-02...
5 months ago
1、去年5月V2发布后,我首次注意到DeepSeek-chat和DeepSeek-coder两个模型,API价格是国内最低的。当时还不了解DeepSeek的愿景是实现AGI,只觉得幻方做量化交易囤了GPU正好用来训练自己的大模型,是蛮自然的事情。后来读了36氪”暗涌Waves”栏目在23年和24年两次对梁文锋的采访,才更加了解这个团队以及模型背后的故事。 2、DeepSeek对世界的重大贡献是把具有思维链的推理模型R1开源了,并且是1月20日当天发布即开源。而OpenAI的o1是去年9月发布预览版,12月发布正式版,满血的o1需要200美元的Pro订阅用户才可以用到。 3、模型开源,最直接能体会到的是可以把具有推理过程的LLM运行在自己的设备上,不用联网、不用把你的问题发送到服务器。企业或组织也可以很方便的将模型部署在组织内部。 4、我在16GB内存的M芯片MacBook Pro上用Ollama运行了R1-7b参数的版本,在需要深度思考和推理的问题上,表现确实优于Qwen2.5,但某些测试问题,思维链在反思中会否定正确答案,或者连续几分钟仍在思考中像是进入了死循环。DeepSeek线上的网页版应该是671b的版本,则没有出现这类情况。 5、除夕当天,DeepSeek在全球所有区的AppStore(来自七麦数据监测的149个国家和地区应用商店)免费榜登顶,此前应该没有任何app达成这个成就。