AI资讯日报 | 2026年5月9日 - Ring万亿参数、DeepSeek融资70亿、Claude理解为什么

⚡ 马上能用

👀 值得关注

oMLX更新强化苹果端侧AI，本地能力直逼云端精选 76

GitHub

推荐理由

端侧AI从差点意思到真可用，把Gemma 4视觉能力塞进本地，加一键接入Claude的工具链，值得每个Mac开发者立刻试一下。

Statewright：通过可视化状态机提升AI智能体可靠性精选 76

智能体

推荐理由

用状态机给AI代理上'紧箍咒'，让13B小模型也能搞定SWE-bench任务，做coding agent的应该立刻装上试试。

BenchLoop：本地大模型一键基准测试与排行榜发布精选 72

推理

推荐理由

本地模型好不好用，跑个分才知道。质量、速度、可靠性全量化，还能对比原生模式和Hermes模式，做模型选型的人该把它加进工具箱。

Hy3 预览版现已登陆 GMI Cloud 精选 76

智能体

推荐理由

腾讯混元Hy3开源且登顶OpenRouter排行榜，295B MoE架构在推理和代码上提升明显，不是小厂的刷榜产品，搞agent和coding的可以认真试试。

90%的人在白白浪费'Token'！精选 75

教程/实践

推荐理由

Karpathy这条推文把AI编程的浪费点戳穿了，10条技巧每条都能直接省下真金白银，Vibe Coding的人看完账单会沉默。

SenseNova-U1 技术报告深度发布：前沿原生多模态模型构建全指南精选 72

多模态

推荐理由

商汤把原生多模态模型的训练细节全公开了，无视觉编码器、原生MoE架构，还开源了38B-A3B权重，做多模态模型的可以直接照着技术报告复现。

Step Image Edit 2图像模型发布，性能领先且高效精选 72

图像生成

推荐理由

3.5B参数在图像编辑基准上干翻5-6倍大的模型，性价比很诱人，而且中文文字渲染准确，做批量出图的产品可以直接试。

消息称 Anthropic 正就以超 9000 亿美元投前估值筹集至少 300 亿美元谈判精选 73

Anthropic

推荐理由

Anthropic这轮融资如果完成，就是AI史上最大单笔，估值逼近万亿门槛，说明头部公司的军备竞赛还没到顶，算力烧钱才刚开始。

Claude进军法律行业精选 73

智能体

推荐理由

Claude这次在法律行业的布局很大，20+连接器和12个插件意味着它不是做表面集成，而是把律师的整套工具链都拉了进来——对律所是效率革命，对做垂直AI产品的团队则是教科书级的行业解决方案示范。

AI取代人类？各方叙事背后的利益驱动精选 74

大佬观点

推荐理由

吴恩达直接给'AI失业潮'泼冷水，把AI公司、企业和媒体的叙事套利拆得干净，但小北追问得更狠——转型阵痛到底多快多痛、落后者怎么办，这个问题没人有动力认真回答。

🔬 幕后观察

教导 Claude 理解"为什么"：Agentic Misalignment 从 96% 降到 0 精选 79

Anthropic 安全/对齐论文/研究

影响力 4.5/5

实用性 3.5/5

新颖度 4.5/5

推荐理由

Anthropic 把 Claude 的 agentic misalignment 从 96% 压到零，关键是背后那套「教模型为什么」的方法，这对整个行业解决「幻觉般的不听话」问题是个真信号。

Claude Mythos 安全评估：自主执行时长突破 16 小时精选 72

Anthropic 安全/对齐评测/基准

影响力 4.5/5

实用性 2.5/5

新颖度 4.5/5

推荐理由

模型能力逼近失控边缘的信号——自主执行 16 小时，现有评测任务都不够用了。做 AI 安全的必须盯紧这个方向。

工信部启动 AI 伦理审查先导计划，审查从口号变成实卡精选 71

政策/监管现象/趋势

影响力 4.5/5

实用性 4.0/5

新颖度 4.0/5

推荐理由

这次不是发文件而是直接落地审，会把伦理审查从口号变成产品上线的实卡。国内做 AI 应用的从业者得开始考虑合规成本了。

🤖 AI资讯日报

🎙️ AI资讯播客

⚡ 马上能用

👀 值得关注

🔬 幕后观察