飞飞的AI实验室

让任意大模型真正"看"视频，这个开源工具省了九成token也挨了骂

发表于 2026-07-03 更新于 2026-07-14 分类于 AI 本文字数： 2.8k 阅读时长 ≈ 3 分钟

claude-real-video 是开源 Python 工具，用场景切换检测和滑动窗口去重让任意大语言模型基于视频画面理解，10分钟演示从约600帧压到5到15帧，token节省九成以上，全程本地不上云。社区争议集中在成本、运动信息丢失和命名三处，它真正解决的是隐私和模型无关性。

阅读全文 »

AI 自己提工单、揪出工程师漏答：我手动盯的那套运维，它一晚跑完了

发表于 2026-07-03 更新于 2026-07-14 分类于观点本文字数： 2.7k 阅读时长 ≈ 2 分钟

卡兹克让 Claude Fable 5 自主优化 AIHOT 网站 GEO：模型自己起 22 个 agent 调研、提工单、揪出工程师漏答、发现漏洞自加暗号，一整条运维链自主跑完。对照我手动盯博客 GEO 一个多月、每周手算爬虫抓取 5942 次再手改 robots，真正的变化不在 AI 会写代码，在运维正从人盯挪向人审：只读巡检可现在就交，碰线上状态和凭证的活还得自己按确定键。

阅读全文 »

大厂被 AI 账单逼着禁用最贵模型：我那本过秤账，原来一直在防这个

发表于 2026-07-02 更新于 2026-07-14 分类于观点本文字数： 2.4k 阅读时长 ≈ 2 分钟

404 Media 拿到内部资料，花旗 6 月 24 日临时禁用 Claude Opus 4.6/4.7 和 GPT-5.5，Atlassian 的 AI 月支出九个月从 500 万飙到 1500 万美元。真相不在大厂抠门，在 GitHub 们把计费从包月改按量后，无脑用最贵模型的浪费全现了原形。省钱的手不在禁掉最贵那档，在给每个活单独过一遍秤。

阅读全文 »

我给 agent 写了大半年文档才反应过来：读它的早就不是人了

发表于 2026-07-02 更新于 2026-07-14 分类于观点本文字数： 2.6k 阅读时长 ≈ 2 分钟

Simon Willison 给 shot-scraper 加录屏命令时说，他把 --help 写到 coding agent 能直接照用，就像顺手塞了个 SKILL.md。这点破了一个正在发生的变化：工具的 --help、README、接口，真正的读者正从人变成 agent。agent 会一字一句读完还照着执行，写模糊就会被乱发挥。

阅读全文 »

搭 agent 别一上来就选模型：我那本「过秤」的账，其实是在手动做路由

发表于 2026-07-02 更新于 2026-07-14 分类于观点本文字数： 2.3k 阅读时长 ≈ 2 分钟

VC Tomasz Tunguz 说搭 agent 该先设计路由再选模型，路由做对能让 70-80% 流量走本地或异步的便宜档、省 90%+ 开销。路由分三层：分类器认这是什么活、路由器定走哪个档、选择器挑档内最便宜的。我动 Opus 前先过秤、杂活切便宜模型，就是人肉路由，缺的是把它从肌肉记忆挪成自动调度。Coinbase 靠默认加路由把开销砍了近一半。

阅读全文 »

Claude Code 偷偷改了一个撇号，我更在意它为什么不明说

发表于 2026-07-01 更新于 2026-07-14 分类于工具本文字数： 3k 阅读时长 ≈ 3 分钟

Claude Code 2.1.196 和 2.1.197 都存在一套隐藏提示词标记，会用 4 种撇号、日期分隔符、147 个域名与 11 个 AI 关键词给自定义网关分类。客户端行为已经复现，后端用途仍无直接证据，真正的问题是高权限工具为何不公开说明。

阅读全文 »

我随手按了下 ←，发现 Claude Code 把后台 agents 的门槛降到了一次按键

发表于 2026-07-01 更新于 2026-07-14 分类于工具本文字数： 2.4k 阅读时长 ≈ 2 分钟

Claude Code 2.1.197 有个不起眼的改动：从一个普通前台 claude 会话里，现在按一次 ← 就能打开 Agent View，以前要按两次。它并没有把 claude 默认改成 agents 方式，默认仍是普通交互会话，进后台 agents 的正规入口还是 --bg、/bg、claude agents。但入口从要记命令降到随手一按，才是把后台并行干活从少数人技巧推向日常习惯的关键。

阅读全文 »

X 官方 hosted MCP 上线：agent 直连 X，省掉你自己搭服务器那层苦

发表于 2026-07-01 更新于 2026-07-14 分类于观点本文字数： 2.6k 阅读时长 ≈ 2 分钟

2026-06-30 X 官宣 hosted MCP server，Claude Code、Cursor、Grok 等任何 MCP 工具零配置直连 X API。它不加新能力，只是把你自己搭 MCP、host、连 API、处理 OAuth 那整层脏活替你包圆了。定价按次无月费，读一条帖约半分钱、发帖查用户约一分钱。信号是 MCP 正在成为 agent 直连各家 API 的通用插头，平台不进 MCP 就等于对 AI 助手隐形。

阅读全文 »

我写了十几个 AI Skill 才想明白：难的不是让它聪明，是让它别飘

发表于 2026-07-01 更新于 2026-07-14 分类于观点本文字数： 2.5k 阅读时长 ≈ 2 分钟

Matt Pocock 的 writing-great-skills 把写 skill 的头号目标点破了：可预测，即 agent 每次都走同一套流程。我写了十几个 skill 天天跑，踩过配图漏图、grep 误伤这些坑，总结出四招让 skill 别飘：先定 user 还是 model 触发、该确定的步骤写死、主文件瘦身细节外挂、再配一个把坑自动变规则的回路。

阅读全文 »

Nano Banana 2 Lite：4 秒三分钱一张，我那条自动配图流水线该给它分哪类活

发表于 2026-07-01 更新于 2026-07-14 分类于观点本文字数： 2.4k 阅读时长 ≈ 2 分钟

Google 在 2026-06-30 发布 Nano Banana 2 Lite（gemini-3.1-flash-lite-image），家族里最快最便宜一档，文本到图约 4 秒、每 1K 图 0.034 美元。它的意义不在画得多惊艳，在把速度和成本压到可以无脑批量出图。但它是最省那档不是最强档，我的封面门面活仍留高档，批量草稿缩略图才交给 Lite。

阅读全文 »