AI 科技 未来
2025-07-25 00:10
AI高价值信息精选速览
AI领域正飞速发展,智能代理是未来应用核心,其UI和架构正演进,多模型结合将实现专业卓越。AI驱动的创业公司正迅速实现高收入,但财务数据披露需更严谨。政策层面,美国积极推动AI创新,同时探讨法规...
AI高价值信息精选速览 (2025年07月24日)
Hi,早上好!我是你的专属情报官。今天从92条信源中,为您整理如下内容,希望能给你带来启发!此外,日报官网已上线,网址:alphanews.club。您可前往官网阅读历史日报或预约个性化日报服务,任何问题可咨询kiki220238。
个人成长与创业洞察
创业策略与效率提升
- 项目选择与生产力:关于选择项目,这是一个带来“前后对比”感悟的引文,它改变了作者对选择项目的看法。该引文链接至 Sam Altman 的《生产力》文章 (https://blog.samaltman.com/productivity)。 @GregKamradt
- LLMs 能让写代码速度快得多,但对决定“构建什么”的能力几乎没有影响。 @jnnnthnn
- 最没有效率的人,现在正在炫耀自己9/9/6的工作时长。 @databoy97 转推 @willdepue
- 专业发展:可以阅读最新的技术,也应该阅读最古老的道德基础。 @mbrendan1 转推 @M_Millerman
- 技术创始人建议:这是技术创始人最重要的一条建议。你和你的联合创始人应该拥有共同的语言,并相互信任和尊重。如果你是技术背景,那么很可能你的联合人也应该是技术背景。 @GuptaAnkitV
- 创始人团队:如果你是技术创始人,你不需要非技术联合创始人。 @vijaytupakula 转推 @snowmaker
- 产品发布后的免费流量策略:包括在 X、LinkedIn、YouTube、Instagram、TikTok 和 Reddit 上发布产品发布和新功能更新,在合适的子版块(如产品管理、开源、SaaS、ChatGPT)发布,并在 Product Hunt、Tiny Startups、Hacker News 和 “There's an AI for that” 上发布,同时创建大量由 AI 生成的 Medium 博客文章(关于产品对比和相关主题),以获取 SEO 和 GEO 帮助。 @gabrielste1n
- ARR计算:如果你在产品发布第三天,甚至七个月后就公开分享 ARR (年经常性收入),那是在进行操纵。 ARR 最好在 13个月 后计算,因为那时流失率(churn)开始显现。即使是 5% 的“适度”流失率,到年底也会是报告 ARR 的 50%。 @DmytroKrasun
- 订阅服务:当看到月度订阅服务谈论 ARR 时,这让人有些恼火。感觉这并非对财务状况的诚实体现。 @Rich_Belt
AI模型与智能体进展
智能体架构与应用
- AI代理的UI演变:在为“严肃工作”开发日常AI代理(例如2万-4万行代码量的Vibe Coding或进行复杂数据分析)时,UI正在发生有趣的变化:IDE (集成开发环境) 正在被挤压。目前的循环主要在三个部分之间:
- 代理控制:一个简单的提示栏,显示状态信息。用户在此创建和监督半自主任务列表。
- 氛围测试:运行应用程序、阅读分析报告等。用户在此引导代理,确保AI保持“接地气”。
- 质量控制:定期从氛围测试切换到更严格的审计,例如 GitHub 上的PR审核。作者认为跳到 VS Code 等 UI 是 AI自动化流程 中存在“大块污垢”的信号,是需要消除的目标。虽然出于安全考虑需要保留IDE,但 AI UI 更多是为了消除手动 IDE 时间。 @lmeyerov
- AI代理与LLMs的结合:
- 来自 聊天LLM时代 的最佳实践对于构建 编码代理 来说,不仅过时,而且会带来积极的危害。 @raphaelmansuy 转推 @jxnlco
- 所有的编码代理和 LLM 都需要 外部上下文 才能正常工作,否则它们会表现得很差。作者正在 @nozomioai 解决这个问题。 @arlanrakh
- 当 100多个AI代理 分析表现最佳的 电商广告 时,它们能分解出成功的 钩子结构 并生成内容。 @RTkatsenko 转推 @Salmaaboukarr
- 前沿代理 的基准测试已转向 HLE (Human-Level Evaluation)。 @manuaero 转推 @andrewwhite01
- 使用 grep工具 的代理有一半时间都无法正确使用它。 @olliethedev
- Scout异步编码代理 进行了大量升级,包括:无限上下文 (子代理 + 自动刷新上下文)、恢复检查点 (撤销代理/文件更改)、强大的虚拟机 (处理像Linux这样的大型仓库) 和 闪电般快速的UI。可在此尝试: Scout (https://scout.new)。 @justinsunyt
- AI的未来将围绕着 代理 而非仅仅是AI本身。 @razroo_chief 转推 @SledgeDev
- IMO (国际奥林匹克数学竞赛) 获胜的代理系统似乎一直是 Nous Forge 和 推理模型 的结合。或许未来需要以更适合 强化学习 (RL) 的形式重新引入它们。相关信息可在此阅读: Nous Forge (https://forge.nousresearch.com/)。 @Teknium1
- 模型如果能智能地:1) 抓取网络,2) 发现数百万个可验证问题,3) 按预期价值排序,4) 将其实现为新的 强化学习环境 (RL envs),那么还有哪些自定义的RL环境值得构建?这可能在1-2年内实现。 @khoomeik
- 模型能够为任意任务设置正确的 强化学习环境 将是一个奇迹。作者不确定目前的架构能否实现,因为 奖励函数 需要领域知识,这看起来是 AGI 级别的问题。 @atroyn
AI产业前景与政策动态
- AI产业发展速览:这是AI领域疯狂的一周:Anthropic 估值接近 1000亿美元;ChatGPT Agent 上线;Google Search 获得 Gemini 2.5 Pro;OpenAI 和 Google 都赢得了 IMO金牌;Qwen3-Coder 超越了 SOTA (State-of-the-Art);Claude Mobile 添加了 记忆和MCP (Model-Controller-Pairing) 功能,允许跨会话持久保存信息,iOS代码表明即将全面推出。相关链接: (https://x.com/testingcatalog/status/1947448890678038604)。 @andrewztan
- 竞争与AI领导力:Sam Altman 对 Meta 挖走 OpenAI 人才表示:“他们想进入AI游戏。那就来吧。” 关于竞争与戏剧性:“赢很有趣,我期待赢。如果世界上没有竞争和戏剧性,那会很无聊。” 他认为许多企业家(包括他自己和Elon)都被戏剧性所吸引,他们不仅在混乱中建设,更在混乱中茁壮成长。 @Yuchenj_UW
- 产业颠覆:在人工智能领域,一些公司致力于彻底重组或颠覆整个经济产业,例如 Mechanize (不稳定智能)、Workshop (分布式智能)、Intelligent Internet (去中心化智能)。相关论文:(https://arxiv.org/abs/2407.16314v1)。 @jonas_kg
- SaaS行业:“SaaS已死”论:以 ServiceNow 为例。 @anshublog
- 媒体出版商与AI:媒体出版商与AI的交易 的高峰期已经结束。 @sallyshin
- AI政策与法规:
- 美国将通过签署关于 AI在实体世界中的行政命令 来赢得AI竞赛,计划核心人物是 @mkratsios47。 @melisatokmak
- AI正在快速发展,但你的基础是否能持久? @pwang 转推 @anacondainc
- 美国在十年内将遭受严重的经济崩溃,如果它不加速 机器人创新(中国已大幅领先),以及如果它对 AI创新 增加繁重的繁文缛节和法规。作者认为美国经济已严重负债,若失去技术创新(尤其是自动化)优势,将有严重后果。 @bindureddy
- 创作者在 AI版权 辩论中失败只有一个原因:决策者将他们(错位的)对中国的恐惧置于公平原则之上。 @ednewtonrex
- 关于 AI去监管化 的重大新闻。 @alexkehr 转推 @BasedBeffJezos
- 美国已经宣布了其 AI行动计划。 @leslieasheppard 转推 @sriramk
- 2024年,仅美国两家监管机构就开出了 253亿美元 的罚款,主要源于未能及时掌握规则变化。如果企业不实时跟踪 政策情报,就已面临风险。 @Joe_Scheidler
- AI对就业与健康的影响:
- 未来将有更多我们尚未想象到的AI相关工作。 @RMB 转推 @IntuitMachine
- 主权健康 (sovereign health) 的顺风车效应非常惊人:ChatGPT医生 > 大多数医生;医疗保健过于昂贵;新的供应链安全即将上线;Ozempic 让美国人对 肽 感到适应;新的肽比Ozempic好 80%以上;AI使美丽成为竞争优势。 @hypersoren
- AI模型的计算成本:
- 使用 Sonnet 编写 PyTorch模块 的成本是 $0.038,而编写 React组件 的成本是 $33.74。 @LeeLeepenkman 转推 @vikhyatk
- 我买了 Claude Pro,但使用API还需要购买积分? @bgyankarki
- AI领导力对话:这是我与 Google DeepMind 首席执行官 Demis Hassabis 的对话,内容关于AI和AGI的未来、模拟生物学等。 @leslieasheppard 转推 @lexfridman
AI开发与工具生态
AI开发实践与工具
- 上下文工程:上下文工程才是真正的突破,而非花哨的指令。大多数 LLM 应用失败是因为它们把提示工程当作小把戏,但关键在于用以下内容填充上下文窗口:用户意图、相关历史记录 + 工具、少样本示例、结构化任务 + 数据。做错了会导致LLM又笨又贵,做对了则会感觉它很智能、很懂。 @SherryYanJiang
- 文本编辑器:Monaco文本编辑器 会比它的外部壳 VS Code 活得更久。 @janwilmake 转推 @romdot2
- 开源AI:开放源代码持续进步,并将成为AI领域的重要组成部分。可以尝试 Kimi K2。 @jeffwsurf
- AI驱动的工作流:AI驱动的工作流已扩展到 人力资源、法律、金融 和 风险管理团队。 @BernAceituno 转推 @StackAI_HQ
- AI构建哲学:Builder.io 的博客和视频是为那些需要构建AI背后的技术哲学的人提供的被低估的瑰宝。 @Steve8708 转推 @rajatsandeepsen
- 开发者工具:我们很高兴看到您使用 Builder.io (https://t.co/DmuLFwAiZA) + Netlify 交付成果。 @Steve8708 转推 @Netlify
- 边缘AI部署:Google DeepMind Gemma 3 4B 模型可以在 iPhone 15 Pro 上完美运行。 @la_bct
- 音乐与AI:MUSICWILLGONEURAL:一个新时代正在到来!受到 @karpathy “LLMs 是 chmod a+w 人工制品”的启发,正在从…转变。 @walterdebrouwer 转推 @TheSoundPatrol
- 开发工具更新:Evo 2 现在更容易安装,包括支持 Docker。 @pdhsu
- RAG评估框架:zbench 是一个用于 RAG (检索增强生成) 的开源注解和评估框架,比脆弱的“LLM即评委”方法更健壮。 @ghita__ha
- AI辅助编码:SwiftUI Previews 将成为 Claude Code 的出色反馈工具,如果它们能可靠工作并且不与 Xcode 绑定。越来越多的人认为 Xcode 的内部机制应该分层并开放以供程序化接口。 @pepicrft
- 跨平台开发工具对比:与团队中的 Android工程师 合作,他正在使用 Jetpack Compose,交互式预览几乎是即时加载的。他可以在几秒钟内生成几十种变体。这表明 Apple平台工具 有多糟糕。 @camsoft2000
- AI生成代码:AI应该编写足够的 样板代码,以便你可以手动编写小型功能并定义应用程序。 @Esteban_Puerta9
- PyTorch优化:现在可以编译 PyTorch 中的整个训练循环。 @LeeLeepenkman
- PyTorch应用:我们正在讨论 偏导数 和 雅可比矩阵,你可能没有意识到我们可以用 PyTorch 优化多少东西。 @LeeLeepenkman
- RAG的局限:请停止使用 RAG。 @pashmerepat
AI技术理念与未来方向
- AI基础设施与规模:Google 每月处理 980万亿+ 令牌,比5月份的 480万亿 大幅增长,并且没有放缓迹象。 @cdossman 转推 @OfficialLoganK
- 硬件测试:当 PCB 有缺陷部件时,可以通过 MCU 中的测试控制台立即发现。这帮助作者识别了许多电机驱动器有一个死引脚的问题,导致一个车轮无法反转,否则可能会被忽视。 @uavster
- 多模型与多代理架构:“一台超级代理包揽一切” 的想法在理论上听起来很吸引人,但它根本误解了专业卓越的实际运作方式。AI行业将开始认识到这种模式。最成功的AI应用不是试图用基本工具做所有事情,它们正在构建与目标领域复杂性和专业性相匹配的综合工具集。理解这一原则的公司将提供更好的AI体验,但不是通用的AI体验。多模型、多代理 的系统承认这一现实,并将其转化为竞争优势。通过智能地结合来自不同来源的最佳能力——无论是开放API、合作伙伴关系还是内部模型——这些系统可以提供始终超越任何单一模型所能提供的体验。用户获得最佳的创意写作能力、最佳的推理能力、最佳的视觉理解和最佳的编码辅助——所有这些都在一个无缝体验中。作者认为AI的未来在于 多模型和多代理的结合。 @ericjing_ai
- 认知AI与LLMs的效率差异:AI能够以百万倍更少的数据和计算量实现 认知AI,并且无需重新训练。LLM则会消耗大量资源。 @Srini_Pa 转推 @Hello_World
- LLMs的效用与成本:我们应该尽可能利用 LLM 的效用,但不要在此基础上建立万亿美元的基础设施。 @Srini_Pa 转推 @Hello_World
- 知识获取与应用:持续获取和应用知识及技能的能力,包括在各种新颖上下文中的应用。 @Srini_Pa 转推 @sowmaler
- 自然模式与AI学习:想象一下,如果自然界中形成的每种模式——比如蛋白质折叠或宇宙现象——都可以被AI内在学习。 @KindiBALDE 转推 @GoogleDeepMind
- AI开发路线图:Claude Code 的下一步是将其带到远程 MCP (Model-Controller-Pairing),以便进行 代理工人测试。有趣的方面是为带有上下文的提示构建一个更简洁的界面,让 flaredream 变得非常有趣。 @janwilmake
- 认知AI vs. 大数据统计AI:一个孩子最多用几百万个单词就能学会语言和基本推理,而不是几十万亿或几百亿万个单词。我们的大脑只消耗约 20瓦 的能量,它们不需要核能级别的电力来“构建模型”。因此,从第一性原理来看,人类水平的智能可以用数量级更少的电力和数据实现。实现这一点的关键是清晰地理解人类智能为何如此强大。这是一种 认知AI 方法,而不是大数据统计AI。 (https://t.co/dWs2SM0BMM)。 @peterevoss
创投与产品前沿
- Lovable 仅用 8个月 就达到了 1亿美元 ARR (年经常性收入),比 OpenAI、Cursor、Wiz 以及历史上所有其他软件公司都快。 @taro_f
- Lovable 仅用 8个月 就突破了 1亿美元 ARR。 @leslieasheppard 转推 @antonosika
- 旧金山很疯狂:作者认识的三位朋友,从失业到在一个月内筹集到数百万美元。 @edchucation
- 我们 CodeAntAI 在 60天内 实现了 150万美元 收入,没有技巧,只有一个教训:卖给错误的 ICP (理想客户画像) -> 构建错误的产品。卖给正确的 ICP -> 一切都会复合增长。我们将AI代码审查重新定位到企业市场,这一转变改变了一切。 @amartya_jha_
- AI语音聊天机器人:我们每年与8000家初创公司交流,一直在寻找用于设置服务和销售预约的 语音AI聊天机器人。我们发现增长最快的公司是 Pam。 @BeardAintWeird_
- 家用机器人:我们带着我们的 衣物折叠机器人 到 Joanna Stern 的家中折叠T恤——完全自主、自动故障恢复、陌生环境、陌生T恤。尽管有硬件问题,平均每件T恤耗时 2分20秒。可加入等待列表,价格 3000美元。 @Deeplearner2
- 营销合作:推荐粉丝超过10万的TikTok创作者给我,即可免费获得 FloweAI Pro。 @mlg27_
- 员工培训与税收:AI行动计划的最新进展:Vellum AI 现在是公司提升员工技能的 可抵税费用。这是一个引人入胜的发展! @akashsharma503
- 社交销售AI代理:推出 Blueberry Social,一个社交销售代理,它能跟踪所有与你的广告和帖子互动的人,向他们发送个性化DM,捕获电子邮件,并将他们转化为客户,像人类一样但全天候24/7。 @TheSeanRich
- 我们用不到 10分钟 重建了 cupidly,并且做得更好。包含完整教程。 @AnnieLiao_2000
- 会议辅助AI:你现在可以使用 @cluely 在会议中进行网络搜索。Cluely 会预测你在对话中何时需要信息,并实时提供给你所需内容。 @im_roy_lee
- AI模型排名:很高兴看到 #SolarPro2 在 @yupp_ai 的前沿模型中取得了前18名的排名,获得了用户满意度终极模型的认可。这一排名反映了用户的直接反馈和投票,被认为是大型语言模型最客观的评估方法。可在 SolarPro2 (https://t.co/rCZLwEgSkC) 了解。 Upstage 正在准备 SolarPro3,很快将争取进入前10名。 @hunkims
- 产品受众:作者曾非常担心自己已经太老了,无法构建Z世代会喜欢的产品,但现在看来他大错特错了。 @jnnnthnn
其他值得关注的领域
区块链与数字经济
- 加密货币市场:我不想再回到加密货币领域了,它太混乱了,骗局太多,缺乏价值。 @nizzyabi
- 加密货币文化:加密货币以前是狂野西部,很有趣,现在都公司化了。让加密货币的堕落再次伟大。 @lottsnomad
- USDT链上发行:TRON 再次成为发行 USDT 的第一大链。 @ASvanevik
- USDT链上发行竞争:以太坊 曾短暂超越 TRON,但现在 TRON 又回来了。 @ASvanevik
- 区块链游戏:AstroCats 将登陆 TheRootNetwork。请继续在 Root 上构建游戏! @aaronmcdnz 转推 @AstroCatsIdl
- 创作者经济:受到 @wbnns 启发,我在 @zora 上购买了大量的自己的代币。我认为它是一个优于 Instagram 的版本。它允许任何类型的内容创作者根据内容的受欢迎程度赚钱,而不是必须拥有大量粉丝。 @TheChainGamer
开发者体验
- Rust开发体验:写 Rust代码 是一种我很久以来都缺失的感觉。今晚将进行一些内核黑客攻击。 @GYuvrender
社区与内容
- 产品社区:Venice 的更新日志持续发布。这个团队很棒。Discord 社区也很活跃,如果你是用户,欢迎加入讨论 (https://discord.gg/askvenice)。 @ErikVoorhees
- 信息分享新形式:一个新的想法:一个邮件列表或博客,但其内容主要链接到行业内各种深度研究。 @LeeLeepenkman
- AI播客:Omar Waseem 与 @spirosx 的 @resolveai 节目现已上线。可在 YouTube 上搜索 “Omar Waseem”。 @lottsnomad 转推 @omarwasm
教育与职业发展
- AI在教育中的应用:我是 William & Mary 的英语教授,在所有课程的第一个写作作业中,我告诉学生给出……她向学生推荐了 Chat GPT 以帮助他们完成写作任务。 @bradley_emi 转推 @aliciaandrz
- AI在技能提升中的认可:我问 Chat GPT 推荐如何更新我的 React Web 技能,它不经意地提到了 @kentcdodds。 @kentcdodds 转推 @PierceGardner
投资与金融
- 量化交易:我很喜欢大家说“80/20是垃圾,90/10更好”,不,这个更好!看对比。如果这些专业交易员连基本数学都不懂,他们如何在日内交易中生存?就像我说的,一小块西瓜比一大块葡萄要好。规模决定一切!使用代码“Rocketscooter”可获得巨大折扣。 @TradersParadise
AI硬件与基础设施
- NVLink/SHARP调试:有人帮助调试了 NVLink/SHARP。所有的 NVLink 系统都包含 SHARP,但你必须在单个集体中使用所有 8个GPU 才能使其工作。如果你使用比如4个GPU(例如 TP=4),你只会得到基本的 NVLink 带宽。这是否意味着在 NVL72 上必须使用所有 72个GPU 才能使 SHARP 工作?这让作者想起AMD的 MI 节点内通信*,你必须在单个集体中使用所有8个GPU才能获得高速。当然,这不是相同的情况,你仍然可以通过 NVLink 获得高速,但不如使用8个GPU那么高。 @StasBekman