AI、独立开发高价值信息精选速览
AI领域涌现多款效率工具如ScreenSage和FLUX.1 Kontext改进录屏和图像编辑SoftWhisper简化音视频处理AI正步入主权分层时代算力成战略资源编程语言推动大模型发展Dee...
AI、独立开发高价值信息精选速览 (2025年05月30日)
Hi,早上好!我是你的专属情报官。今天从66条信源中,为您整理如下内容,希望能给你带来启发!此外,日报官网已上线,网址:alphanews.club。您可前往官网阅读历史日报或预约个性化日报服务,任何问题可咨询kiki220238。
产品开发与设计
以下是一些关于产品开发和设计的洞察。
@v0 的新功能:@pranathiperii 透露 @v0 即将发布令人兴奋的新功能 (https://t.co/hrD7bmYIUm) @tahcely 转推 @pranathiperii
录屏软件:ScreenSage:
ScreenSage (https://t.co/KelJkIfPS5) 是一款 Mac 上的录屏软件,目标是提供一站式的课程(演示视频)录制、后期制作的专业解决方案。它的设计理念是在保持简洁的交互的同时满足做课的大部分需求,一个 App 出课,让用户不再需要去其它软件二次剪辑 @s1ntone
ScreenSage 支持多音频输入,方便录制音乐类教程或多人 reaction 视频,无需复杂的配置流程,一切都是简单的傻瓜操作 @s1ntone
ScreenSage 新版本支持“无背景”选项、倍速、人像磨皮,功能轨道数量增加到 8 个,分别是 3D 运镜、遮罩、字幕、按键、音乐 @s1ntone 转推 @s1ntone
录屏 App 的问题与解决方案:从昨天起,我计划花几天时间解决录屏时的崩溃问题和其他边界问题。打算将 ScreenCaptureKit 和 AVFoundation 的录制功能整合起来,统一接口处理设备获取、多设备预览和录制等这些问题 @s1ntone
图片编辑工具:FLUX.1 Kontext:
Black Forest Labs 发布 FLUX.1 Kontext 模型,支持用提示词对图片进行无损修改,包括保持角色一致性、修改特定元素、更改风格等,效果优于 4o @op7418
FLUX.1 Kontext 的测试用例,提示词包括带上墨镜、躺在草地上看着天空、将汽车变为红色 (https://t.co/pPMJWTb1St) @op7418
FLUX.1 Kontext 解决了 AI 视频中角色和场景一致性的难题 @op7418
使用 FLUX.1 Kontext 演示,提示词包括站在酒吧吧台前,低角度侧脸,白衬衫加领带,吧台灯带背光等 (https://t.co/VG0aI1u2JJ) @op7418
FLUX.1 Kontext 在人脸相似度方面存在问题,欧美五官立体的效果较好,亚洲人像不太像 @op7418
使用 FLUX.1 Kontext 将照片上色 (https://t.co/M6fJqcRSGH) @op7418
使用 FLUX.1 Kontext 转换为真实照片 (https://t.co/TImHG8pDuY) @op7418
使用 FLUX.1 Kontext 转换为吉卜力风格 (https://t.co/j7wCd1yLJY) @op7418
使用 FLUX.1 Kontext 修改海报上的文字,字体保持一致 (https://t.co/dnpBipLAMi),提示词:将“Fractal Haze”改为“Gui Zang”@op7418
使用 FLUX.1 Kontext 直接让小米偷 Oppo 海报 (https://t.co/XMlWbTDtfq),提示词:Change "Oppo" to "Xiaomi", and set the image background color to orange. @op7418
Padphone 老师发现 FLUX.1 Kontext 是最强去水印模型,可以去除 Unsplash 的水印 (https://t.co/F7XHOkHU7q) @op7418
使用 FLUX.1 Kontext 更改 Logo 的材质和添加背景 (https://t.co/3K227QfPHz),Logo 的每个细节都是正确的,提示词:Transform the logo text into a shimmering metallic material, floating above a grassy field filled with flowers. @op7418
FLUX.1 Kontext 虽然不能生成中文,但不改动里面的中文,文字不受影响 @op7418
使用 FLUX.1 Kontext 去掉景区照片中无关的行人 (https://t.co/tk6z5fQw7p)。相关讨论见 (https://x.com/op7418/status/1928367133416902915) @op7418
AI工具:SoftWhisper:强大的 Whisper 模型简化音视频工具,允许用户选择自定义模型、语言和任务,并通过调整光束大小进行精细的转录优化,还可以指定起始和结束时间进行分段处理 https://github.com/NullMagic2/SoftWhisper @ilovek8s
AI工具:Flux.1 Kontext:体验新一代多模态图像生成与编辑模型,Kontext 同时理解文本与图像输入,能够实现真正的“上下文生成与编辑”https://flux1.ai/flux-kontext @ilovek8s
SwiftUI动画问题与解决方案:Swiftui 自带的 Spring 动画, 设置 completionCriteria: .removed 时,完成时间太长,比如 duration 设置 0.25s,实际完成要 0.85s,但如果设置 completionCriteria: .logicallyComplete,调用回调时 Spring 的震荡动画还没有完成会有一点点跳动,在 gemini-2.5-pro 的帮助下写了一个符合我需求的自定义动画,舒服了 @sfjccz
用 AI 学习:用讲故事的方式学习 AI 领域的各种黑话,比如Transformer、强化学习、监督学习等。提示词和文档都共享到了Github (https://github.com/joeseesun/AI100Stories)。文章 (https://mp.weixin.qq.com/s/zy3yBE1sXuthsQmUHISDYA),电子书 (https://pan.quark.cn/s/2d6c263a165b) @vista8
雷鸟发布会图标:雷鸟发布会图标一眼就看出是4o做的,细节和一致性上还有提升空间,厂商也许可以和AI创作者合作生产宣传物料,也能帮忙宣传产生一定的话题性 @sundyme
AI 辅助编程的经验分享:忙完这阵我准备出一个自己的经验分享,近几个月是怎么驾驭 Cursor、GitHub Copilot 这类 vibe coding 工具的 @caiyue5
用于Mac的录音软件:SWAN CAM:SWAN CAM 黑柔滤镜正式上线!App Stroe 下载 SWAN CAM,即可开启专属黑柔摄影之旅! (https://t.co/I3PSHFJg0W) @WarrenLau_
AI 设计提升:我做了一个关于如何改进你的AI设计的45分钟教程 (https://t.co/ayvBuYUIZM) @MengTo 转推 @fuguizhuo
豆瓣读书 Chrome 插件:浏览豆瓣书籍页面,右侧多出来安娜的档案和zlibrary的下载地址。插件下载 (https://chromewebstore.google.com/detail/douban-book+/lkmnoeojcpmcpjlbhbjbilpmccfljdoj) @vista8
Figma 插件:Gemini:结合 Gemini API 的能力和 Figma 的形态,做了一个言出法随改图插件,所有工作流都在一处完成,未来一定是这种原生多模态的天下 (https://t.co/mkv9PKHQby) @LgyLight 转推 @jarodise
Augment code:今天尝试用了 augment code,真是不错,之前 cursor 与 windsurf 没解决的问题,augment 一遍过了。除了价格全是优点 @kiwiflysky
mcp:Sequential Thinking:我对 mcp 是比较无感的,直到我用到了 Sequential Thinking 这个 mcp ,的确让生成的代码质量有了质的提高,不知道是不是我的错觉 @kiwiflysky
用 2 个 prompt 构建家庭信息管理系统:用 zed.dev 做了个家庭成员、事件、故事管理系统 @xqliu
- Prompt: Please help to create a ror app to manage all family informations, memebers and their infomration, stories, personal informations etc.This system is target to manage those information for LLM AI to do learn and RAG Please help to offer the list of requirements first. Then help to design the whole system, and then implement them. Make sure the system is extendable, but no need to consider high traffic, high currency etc. @xqliu
- 2 个 prompt 做了个家庭成员、事件、故事管理系统, 但为啥 zed 后台显示用了 80 个 prompt 呢?因为中间调用了太多次 tool 吗? @xqliu
用于解决Mac录屏崩溃:从昨天起,我计划花几天时间解决录屏时的崩溃问题和其他边界问题。因为本以为 ScreenCaptureKit 应该能解决很多问题,但还是出现了许多意料之外的情况。 例如首帧问题、空白帧问题,以及多源录制时需要处理的同步问题 @s1ntone
AI 与大模型
以下是一些关于 AI 和大模型的观察和资源。
大语言模型代码能力:编程语言对于大语言模型的成功来说确实是功不可没的,一方面它是优质的训练语料;另一方面它又有清晰的逻辑定义;还有能很容易的校验结果是对还是错 @dotey
AI Inside 分析:AI 正进入「主权分层」阶段:
- 老黄在英伟达财报会议上直言,500 亿美元的中国市场「有效关闭」,这是全球 AI 权力结构发生断裂的信号 @bluebird0605
- 英伟达客户结构正在发生变化:过去十年,它服务的是全球云巨头;现在,它服务的是国家本身。这意味着,AI 算力正从「企业生产力工具」转向「数字基础设施」的战略资源 @bluebird0605
- AI 正进入「主权分层」阶段:上层是「应用主权」:本土语言、本地法律、本地认知;中层是「基础设施主权」:数据中心、电力、带宽、自主算力;底层是「技术主权」:架构、自研模型、开源社区主控权 @bluebird0605
- 完整内容 (https://next.iois.me/ai-insider-305/) 包括:多国案例分析(印/新/中东/欧)、主权 AI 三层架构图、战略悖论框架、英伟达客户结构变化背后的真正含义 @bluebird0605
- 获取试读 (https://next.iois.me/ai-insider/) @bluebird0605
大模型进化速度:以 Artificial Analysis Intelligence Index 来看几家模型的进化速度 @bluebird0605
闭源模型:OpenAI (黑色) 一直保持领先,Google (绿色) 追赶速度惊人,Anthropic (橙色) 稳健增长,xAI (深灰色) 逐步提升但有差距 @bluebird0605
开放权重模型:Meta (蓝色) 在 24 年 5 月后爆发,Mistral (橙色) 迅速崛起 @bluebird0605
开放权重模型:早期是 Meta、Mistral 轮流坐庄;如今变成了Alibaba 与 DeepSeek 你追我赶 (https://t.co/jOviokyE52) @bluebird0605
竞争格局白热化、中国力量崛起、2024 年加速论、技术民主化趋势加快…… 把闭源模型和开放权重模型放在一起看,你还能读出什么?(https://t.co/4HQKGYMzrf) @bluebird0605
对 AI 内容的比喻:这个对于 AI 内容比喻确实很准确:“作为听众和消费者,感觉好像是从以前吃家庭作坊养的鸡 (价格贵而质量参差不齐) 变成吃工业化农场生产的鸡 (价格便宜,质量有基本保证)” @dotey
DeepSeek 0528 模型:
DeepSeek 0528 被 Sonnet 4 认定更适合写口播稿。Sonnet 4 认为自己的文章句子偏长,缺少口播的节奏感和情绪张力。DeepSeek 的版本明显是为口播量身定制的 (https://t.co/jmr4CFJF4M) @hylarucoder
DeepSeek 点评稿子的能力并不如 Claude @hylarucoder
对 AI 焦虑的缓解方法:尝试一下用 AI 去赚钱,不是做个 demo 展示、也不是搞一点垃圾流量,是把 AI 的产出变成银行卡余额。然后你的焦虑就会变成:为什么 AI 这么菜,到底什么时候才能实战? @dontbesilent12
**Monica 里面用的 DeepSeek 是否是新版?**如何知道我在 Monica 里面用的 DeepSeek 是不是新版 DeepSeek? 建议直接用官方啊逃 @hylarucoder
Google AI Mode 对 SEO 的影响:
- SEO 搜索不能在建立在关键词上,深度理解用户需求比以往要重要的很多
- 社交媒体 X、Youtube、LinkedIn、Reddit 比以往要更重要。利好做油管的 @hylarucoder
**AI 会毁掉一半的办公室工作吗?**CNN 认为这是炒作还是现实。科技企业家马克·库班评论,新公司和新岗位总会随 AI 的发展出现,整体就业规模最终会上升 @dotey
OpenAI 重写 Codex CLI:OpenAI 的 AI Coding Agent codex-cli 要用 rust 重写了!目的是为不同任务使用最合适的工具,实现零依赖安装、原生安全绑定、优化性能、扩展协议 @dotey
AI工具推荐:Whisper:一直想找一个替代 mac系统自带的语音输入法,这个软件总体感觉是可用的。另外他把识别的结果用大模型在纠正一遍这个思路也蛮有意思 (https://whisperkeyboard.app/) @haozes
AI 角色之间相互咨询或者 handover 的功能:下个版本,会有个不同 AI 角色之间相互咨询或者 handover 的功能 (https://t.co/FnmJkNNqkK) @gong_cn
**如何用 AI 讲故事学习?**100个AI术语变成故事,10分钟读懂高深技术。提示词和文档都共享到了Github (https://github.com/joeseesun/AI100Stories)。文章 (https://mp.weixin.qq.com/s/zy3yBE1sXuthsQmUHISDYA),电子书 (https://pan.quark.cn/s/2d6c263a165b) @vista8
独立开发与个人成长
以下是一些关于独立开发、个人成长、工作和生活方式的思考。
编程新旧时代对比:vibe coding 时代写代码更累了。旧时代像自行车,虽然慢,但可以慢慢思考和调整路线。 AI 像是一个极高性能的车,一脚油门就可以走特别远,但也需要人更快的思考速度和驾驭能力,否则就更容易翻车,写出一堆乱七八糟的代码和架构 @real_kai42
如何做选择:人啊,没选择的时候心态倒是很稳,有了选择之后反而变得患得患失。本质上这些都是生活方式的选择,核心要回答的问题不是选哪个方向,而是想要哪种生活 @itonywu
选品+社群的躺赚模式:这是去年,我在 reddit 上随手回复了一个 @screenstudio的 aff 链接之后,一年时间获得的 affiliate 分成。虽然不多,但也说明,正确的社区+正确的选品,真的是躺着也有钱 @s1ntone
- 分成大概是 15%,也就是我随口提了一句,给它带来了 363/0.15=$2420 的收益。当然,本身帖子下都是目标用户,加上产品足够优秀,才能有这个数据 @s1ntone
程序员35岁裁员:所以说正经程序员根本不用太担心35岁裁员,裁的是什么货色应该能看出来了吧? 我不是针对转码,而是根本不热爱这行,盲打不是程序员也能做到吧? 除了在公司划水的几个小时,在家根本就不看书不学习的那批人 @moeimiku
AI 时代,营销变得更难了:就因为现在人人都可以用 AI 做出"还不错"的营销内容,用户被海量的营销内容轰炸,他们看累了,看厌了。现在,想要获得关注、获得订单,你就得:比你的竞争对手更了解你的客户;坦诚真实,敢于表达独特观点;用客户的语言讲故事,不要大讲行业黑话;一旦发现有效的策略,迅速行动,扩大影响。洞察力和独特性,缺一不可 @LuoSays
关于裁员:去年躲开国内裁员然后relocate 到美国的微软员工也被裁了 而且是零赔偿。虽然但是微软应该根本就不是为了零赔偿吧。Relocate 也要花很多成本的 (https://t.co/P6s4VV3Dv9) @vikingmute
缓解 AI 焦虑的方法:尝试一下用 AI 去赚钱,不是做个 demo 展示、也不是搞一点垃圾流量,是把 AI 的产出变成银行卡余额,然后你的焦虑就会变成:为什么 AI 这么菜,到底什么时候才能实战? @dontbesilent12
从 Manus 自己的官方宣传视频来看:一些很浓重的 Bootstrap/TailwindCSS 原始样式风格丝毫不影响他们。或许只有少量的开发者,设计师等才care。投资人,普通用户可能看不出来,也并不关心 (https://t.co/7sDyDPA4Kb) @EryouHao
做事:如果做事有两个路径 1 是学习技能,跑通解决方案,比如学习如何生成某种 AI 视频 2 是发现需求,找到买家,虽然暂且不知道问题具体如何解决,最终,2 类人只需要学习如何雇佣、如何分钱、如何注册个体户,就可以把 1 类人全部变成廉价劳动力 @dontbesilent12