Skip to the content.

From 34 items, 14 important content pieces were selected


  1. Anthropic 承诺向谷歌云支出 2000 亿美元 ⭐️ 9.0/10
  2. SGLang v0.5.11 升级推理技术栈 ⭐️ 8.0/10
  3. Valve 发布 Steam Controller CAD 文件 ⭐️ 8.0/10
  4. 职场中的表演性生产力 ⭐️ 8.0/10
  5. Google Cloud 推出 Fraud Defense 延续 reCAPTCHA ⭐️ 8.0/10
  6. Hallucinopedia 按需生成合成文章 ⭐️ 8.0/10
  7. Anthropic 提升 Claude 限制并与 SpaceX 签算力合作 ⭐️ 8.0/10
  8. 三星市值破万亿美元 韩国股指创新高 ⭐️ 8.0/10
  9. 苹果或开放第三方模型接入 ⭐️ 8.0/10
  10. DeepSeek 据称寻求首轮大额融资 ⭐️ 8.0/10
  11. 欧盟或将华为中兴禁令变为强制法规 ⭐️ 8.0/10
  12. NVIDIA、OpenAI 和微软开源 MRC 协议提升 AI 集群效率 ⭐️ 8.0/10
  13. 月之暗面估值破百亿美元 ⭐️ 8.0/10
  14. 苹果研发占比突破 10% 加速 AI 布局 ⭐️ 8.0/10

Anthropic 承诺向谷歌云支出 2000 亿美元 ⭐️ 9.0/10

Anthropic 已承诺在未来五年向谷歌云支付 2000 亿美元。与此同时,双方合作进一步加深,Alphabet 还计划以 3500 亿美元估值向 Anthropic 投资最多 400 亿美元。 这是一笔重大的 AI 基础设施支出承诺,可能改变云计算需求格局,并增强谷歌云在市场中的地位。对 Anthropic 来说,这意味着它在 AI 模型训练和推理持续需要大量算力的背景下,获得了长期稳定的算力保障。 据报道,这笔 2000 亿美元的承诺金额相当于谷歌云已披露积压订单的 40% 以上。双方今年 4 月还与博通签署了另一项协议,锁定数吉瓦的 TPU 算力,预计将从 2027 年开始陆续上线。

telegram · zaihuapd · May 6, 03:53

背景: TPU 是 Tensor Processing Unit 的缩写,是谷歌为加速机器学习工作负载而设计的自研 AI 芯片。谷歌云 TPU 针对 AI 训练和推理进行了优化,而这正是现代模型开发和部署的核心算力需求。在这种背景下,长期锁定 TPU 和云资源很重要,因为它能保障大规模 AI 系统运行所需的专用硬件供给。

参考链接

标签: #AI基础设施, #云计算, #Anthropic, #Google Cloud, #TPU


SGLang v0.5.11 升级推理技术栈 ⭐️ 8.0/10

SGLang 发布了 v0.5.11,将 SGLang、sgl-kernel 和 Docker 镜像的默认栈升级到 CUDA 13.0 和 PyTorch 2.11。此次发布还默认启用 Speculative Decoding V2,增强了预填充/解码解耦部署下的 decode 侧 radix 缓存,并加入了多个新模型的首日支持。 这对运行高吞吐 LLM 服务的团队很重要,因为它一边升级了基础平台,一边改善了常见推理路径中的延迟和 CPU 效率。新的模型支持和缓存改进也会帮助团队更快接入新模型,并更高效地运行解耦部署。 Speculative Decoding V2 采用重叠调度来隐藏 CPU 开销,从而降低 EAGLE、MTP 和 DFLASH 路径的每步 CPU 成本。此次发布还说明 decode 侧前缀缓存已经可以在 prefill/decode 解耦下工作,并引入了 DFLASH speculative decoding 和 FA3 等社区内核,与现有 FA4 方案并存。

github · Kangyan-Zhou · May 5, 21:28

背景: SGLang 是一个面向快速推理、高效批处理和高级解码能力的 LLM 服务系统。CUDA 和 PyTorch 版本升级很重要,因为它们可能解锁更新的内核并带来更好的性能,但同时也需要整个技术栈做兼容性适配。Speculative decoding 是一种通过提前生成候选 token、再由主模型验证来加速生成的技术。Prefill/decode 解耦会把提示词处理和逐 token 生成拆到不同工作进程中,从而提升扩展性,但也会让缓存复用更复杂。

参考链接

标签: #LLM serving, #CUDA, #PyTorch, #speculative decoding, #model support


Valve 发布 Steam Controller CAD 文件 ⭐️ 8.0/10

Valve 已将 Steam Controller 和 Steam Controller Puck 的 CAD 文件以 Creative Commons 许可形式发布。社区现在可以基于这些文件进行外壳修改、零件制造和定制配件开发。 这让原厂硬件设计向改装者、创客和无障碍适配开发者开放,方便他们针对具体需求定制手柄。它也可能扩大围绕 Steam 硬件的 3D 打印支架、握把和其他附件生态。 有评论指出,GitLab 仓库里包含每个设备的 STP 模型、STL 模型,以及标注关键特征和 keep-outs 的工程图。此次公开主要是外壳几何信息,而不是完整的内部硬件设计,因此最直接的用途是制造、外壳改造和配件设计。

hackernews · haunter · May 6, 15:44

背景: CAD 文件是工程师和制作人用来加工、打印或修改实体零件的数字设计文件。Creative Commons 是一种标准化的共享许可框架,具体能否改造、再发布或商用取决于所采用的具体许可类型,但它通常会让授权和再利用更清晰。Steam Controller Puck 是 Steam Controller 的磁吸配件,兼具充电底座和接收器功能,因此公开其外壳几何信息会让自制支架和固定座更容易实现。

参考链接

社区讨论: 讨论整体偏正面,很多人称赞仓库说明写得友好,并看好 3D 打印定制配件的潜力。无障碍适配被反复提到是最大亮点,但也有人批评这款手柄仍然过度依赖 Steam,担心会强化平台锁定。

标签: #Valve, #open hardware, #CAD files, #gaming peripherals, #accessibility


职场中的表演性生产力 ⭐️ 8.0/10

这篇文章认为,现代职场越来越奖励“看起来很忙”而不是实际成果。文章把文档变长、状态汇报更精致,以及 AI 辅助的管理表演视为这种变化的典型表现。 这之所以重要,是因为它揭示了组织衡量方式与真实价值创造之间的错位,尤其影响知识工作者和工程师。如果可见产出比真正有用的工作更受奖励,团队就会更倾向于优化文书和信号展示,而不是质量与效率。 文章具体提到需求文档、状态更新、复盘笔记、事故报告、设计备忘录和项目启动材料等文档,这些材料往往会不断膨胀,但新增内容未必带来更多价值。评论还显示,LLM 和 AI 工具正在被用来自动化面向管理层的“包装”,有时会掩盖过度设计或较弱的技术判断。

hackernews · diebillionaires · May 6, 16:18

背景: 这篇文章讨论的是“表演性生产力”,也就是员工花时间制作一些能展示勤奋、对齐或能力的材料。很多职场中的这类材料包括文档、演示文稿和状态报告,它们本来是为了向管理层和相关方传达进展。文章认为,当这些信号变得越来越重要时,表面上的工作就可能逐渐脱离真正解决问题的工作。

社区讨论: 讨论整体上支持文章的观点,不少评论者表示,职场材料“越写越长”的现象和自己的经历非常一致。还有人补充说,AI 和 LLM 现在可以自动化讨好管理层和制造精致信号,也有人举例称,有些人只是更会使用术语,就显得比真正做出更好技术结果的人更“专业”。

标签: #workplace culture, #productivity, #management, #AI, #Hacker News


Google Cloud 推出 Fraud Defense 延续 reCAPTCHA ⭐️ 8.0/10

Google Cloud 发布了 Fraud Defense,并将其描述为 reCAPTCHA 的下一代演进,用于验证机器人、人类和 AI 代理的合法性。此次发布把 reCAPTCHA 从传统的验证码挑战,扩展为面向“agentic web”的更广泛反欺诈平台。 这件事很重要,因为 reCAPTCHA 已经深度嵌入整个互联网,角色定位的变化可能影响网站如何大规模验证用户和识别滥用行为。它也表明 Google 认为在线安全正在转向持续性的反欺诈防护,而不只是一次性的“人机识别”。 官方描述称 Fraud Defense 旨在验证机器人、人类和 AI 代理,这表明它比传统 CAPTCHA 更像一层更广泛的信任与身份验证机制。就目前提供的材料来看,公告并未详细说明完整的技术实现,因此讨论主要集中在设备要求和访问影响上。

hackernews · unforgivenpasta · May 6, 17:59

背景: reCAPTCHA 是 Google 长期运行的反机器人系统,过去主要用于在网站上区分人类用户和自动化流量。随着网络滥用手段越来越复杂,这类检查也逐渐演变成更大的反欺诈体系的一部分。“agentic web” 指的是 AI 代理可能代表用户执行操作的网络环境,这会带来新的身份验证和滥用检测问题。

社区讨论: 评论整体上明显偏怀疑和批评。许多读者担心这种做法会把网页访问推向依赖 Google Play Services 的现代安卓设备或 iPhone/iPad,并通过设备标识带来隐私风险,同时也会给依赖音频验证码或替代安卓系统的用户制造无障碍障碍。还有人反对基于二维码的流程,认为它既不安全又不方便,并觉得这会偏向 Google 自己的生态。

标签: #Google Cloud, #reCAPTCHA, #fraud detection, #privacy, #web security


Hallucinopedia 按需生成合成文章 ⭐️ 8.0/10

Hallucinopedia 是一个 Show HN 项目,它几乎可以为任意 URL 路径生成一篇新的文章,把用户输入的路径变成幻觉式百科条目。这个演示引发了活跃的 Hacker News 讨论,很多人尝试不同的路径并分享结果。 这个项目直观展示了 LLM 如何在网页规模上生成流畅但不可靠的内容。它也凸显了一个现实风险:如果 AI 系统直接向公共互联网发布内容,虽然合成页面可能很有趣,但也可能被用于篡改页面、传播错误信息或生成有害内容。 根据评论者的说法,这个站点没有明显的搜索入口;用户只要访问一个新的路径,例如 /recursive-trolley-problem 或 /alan-turing,就会得到一篇新生成的页面。社区还指出该站点已经出现被恶意篡改的内容,这凸显了审核和治理的难度。

hackernews · bstrama · May 6, 16:37

背景: LLM 幻觉是指输出看起来合理、语气很肯定,但实际上是错误或捏造的内容。它是当前语言模型的已知局限,近期研究也指出,训练和评测机制可能会奖励“猜答案”而不是承认不确定性。在这个背景下,Hallucinopedia 直接把这种行为变成了产品本身:一个按需生成虚构文章页面的系统。

参考链接

社区讨论: 这场讨论整体上以玩笑和欣赏为主,很多人喜欢通过任意路径生成页面并分享自己最喜欢的结果。与此同时,也有评论者认真担心页面被篡改、出现反犹或性相关内容,以及 AI 生成网页的滥用风险;还有人开玩笑说,未来的 AI 搜索产品可能也会表现得差不多。

标签: #Hacker News, #LLM hallucinations, #AI-generated content, #Show HN, #web demo


Anthropic 提升 Claude 限制并与 SpaceX 签算力合作 ⭐️ 8.0/10

Anthropic 表示将提高 Claude 的使用限额,并与 SpaceX 达成算力合作。公司称这项协议将带来超过 300 兆瓦的新容量,包含超过 22 万块 NVIDIA GPU,同时还表示有意与 SpaceX 合作开发多吉瓦级的轨道 AI 算力。 这笔交易表明,Anthropic 正在积极扩张 Claude 背后的基础设施,而算力正是前沿 AI 的主要瓶颈之一。它也说明 AI 公司已经开始超越传统数据中心来思考未来,轨道算力正被视为一种长期的战略选项。 Anthropic 表示,Claude 训练和运行使用 AWS Trainium、Google TPU 和 NVIDIA GPU,而新增容量旨在让更多算力上线。关于轨道 AI 算力的表述明确只是“有意合作”,并不是已经部署的系统,因此 SpaceX 部分更像是探索性安排,而不是马上投入生产。

hackernews · meetpateltech · May 6, 16:17

背景: 像 Claude 这样的大语言模型,无论是训练还是大规模服务用户,都需要大量算力。当地需求上升时,提供方往往会根据能拿到多少硬件容量来调整使用限额。“轨道 AI 算力”指的是设想中的太空数据中心或轨道 AI 基础设施,搜索结果显示它仍然是概念阶段,并不是成熟的已部署行业。

参考链接

社区讨论: 评论者主要聚焦于这笔交易的规模,有人指出 300 兆瓦和 22 万块 GPU 的体量“令人震惊”。其他人则讨论了其战略和伦理含义,包括 Anthropic 是否真的认真看待太空算力、相关表述是否可能是协议的一部分,以及超大型数据中心建设带来的环境和电网影响。

标签: #AI infrastructure, #Anthropic, #compute capacity, #SpaceX, #LLM scaling


三星市值破万亿美元 韩国股指创新高 ⭐️ 8.0/10

三星电子市值首次突破 1 万亿美元,早盘股价一度上涨超过 12%。在 AI 硬件需求激增的推动下,韩国综合指数也首次站上 7000 点上方,创下历史新高。 这表明 AI 基础设施支出仍在重塑资本市场,尤其利好与数据中心和 AI 硬件需求密切相关的存储芯片厂商。它也说明三星电子和 SK 海力士不仅影响半导体板块,还能显著带动整个韩国股市。 三星一季度实现经营利润 57.2 万亿韩元,同比大增 756%。报道还提到,韩国综合指数盘中一度上涨超过 7%,年内累计涨幅扩大至 76%。

telegram · zaihuapd · May 6, 04:48

背景: 存储芯片是半导体产业的核心组成部分,通常包括 DRAM 和 NAND 闪存,两者承担不同的存储需求。在这轮上涨中,投资者押注 AI 硬件需求会继续推高存储芯片价格和厂商利润。三星电子和 SK 海力士是亚洲最重要的存储芯片制造商之一,因此它们的股价波动往往会影响整个韩国市场。

参考链接

标签: #三星电子, #半导体, #AI硬件, #韩国股市, #存储芯片


苹果或开放第三方模型接入 ⭐️ 8.0/10

据称,苹果计划在 iOS 27、iPadOS 27 和 macOS 27 中允许用户为 Apple Intelligence 功能选择外部 AI 模型,包括 Siri、Writing Tools 和 Image Playground。内部测试已经覆盖谷歌和 Anthropic,这意味着 ChatGPT 在 Apple Intelligence 中当前的独占第三方位置可能被打破。 如果苹果真的落地这一功能,iPhone、iPad 和 Mac 用户将把 Apple Intelligence 更像一个可切换模型的平台,而不是只依赖单一服务的功能集合。对 AI 生态来说,这将是一个重要变化,因为竞争模型厂商可以直接进入苹果的默认消费级体验。 这项能力据称名为“Extensions”,用户会在设置中选择 AI 服务提供方,随后由所选模型执行文本生成、编辑和图像创作等任务。苹果预计仍会保留自研模型,因此这更像是一次扩展调度层的升级,而不是把 Apple Intelligence 完全外包出去。

telegram · zaihuapd · May 6, 05:38

背景: Apple Intelligence 是苹果在 iPhone、iPad 和 Mac 上的一层 AI 能力,其中包括 Siri、Writing Tools 和 Image Playground 等功能。Writing Tools 可以帮助用户校对、改写和总结文本,而 Image Playground 则允许用户根据提示词和相关概念生成图片。苹果据称的这次调整,意味着这些内置体验今后可以调用用户选择的第三方模型,而不再只绑定到单一默认提供方。

参考链接

标签: #Apple, #AI模型, #Apple Intelligence, #iOS 27, #Siri


DeepSeek 据称寻求首轮大额融资 ⭐️ 8.0/10

彭博社报道称,中国国家集成电路产业投资基金正洽谈领投 DeepSeek 的首轮大规模外部融资。这轮融资对 DeepSeek 的估值可能达到约 450 亿美元。 如果这笔融资落地,将成为中国最知名 AI 公司之一的重要资本事件,也可能意味着更多国资背景资金进入核心 AI 企业。它还表明,中国仍在把战略性资本继续投向 AI 和半导体相关资产。 这被描述为 DeepSeek 的首次大规模外部融资,而不是内部融资或小规模增资。报道中的潜在领投方是国家集成电路产业投资基金,该基金与中国半导体产业政策联系紧密。

telegram · zaihuapd · May 6, 06:28

背景: DeepSeek 是一家中国 AI 公司,成立于 2023 年,由梁文锋创立;梁文锋也是量化对冲基金高瓴飞的联合创始人,并同时担任两家公司的 CEO。该公司在 2025 年 1 月推出聊天机器人和 DeepSeek-R1 模型后,迅速获得国际关注。国家集成电路产业投资基金是一只国资背景基金,主要用于支持中国半导体产业及相关战略科技目标。

参考链接

标签: #DeepSeek, #AI funding, #China tech, #valuation, #semiconductor investment fund


欧盟或将华为中兴禁令变为强制法规 ⭐️ 8.0/10

欧盟委员会据称正在考虑制定新规,要求所有成员国从电信和宽带基础设施中移除华为和中兴通讯设备。这将把欧盟在 2020 年发布的关于“高风险供应商”的非约束性建议,升级为具有法律效力的强制规定。 如果该方案获得通过,欧洲各地的电信采购和网络升级计划都可能被重塑,同时给运营商和成员国带来更大的合规压力。这也表明欧盟正进一步强化网络安全、供应链控制,并降低对中资供应商的依赖。 据报道,该提案将允许欧盟对未按时移除相关设备的国家启动违规调查并处以经济处罚。该计划还可能收紧对外基础设施资金,停止向使用华为设备的非欧盟国家提供项目贷款。

telegram · zaihuapd · May 6, 14:00

背景: 电信和宽带基础设施指的是承载语音、移动通信和互联网流量的硬件与系统,包括核心网和接入网设备。欧盟长期以来一直警告这些网络中的“高风险供应商”,但早先的指导意见对成员国并不具有法律约束力。华为和中兴是主要的中国电信设备供应商,因此任何强制淘汰措施都会对网络运营商产生广泛的运营和财务影响。

参考链接

标签: #EU regulation, #telecom infrastructure, #network security, #Huawei, #ZTE


NVIDIA、OpenAI 和微软开源 MRC 协议提升 AI 集群效率 ⭐️ 8.0/10

NVIDIA、OpenAI 和微软联合发布并开源了多路径可靠连接(MRC)协议,这是一种面向大规模 AI 训练集群的 RDMA 网络协议。该协议引入数据包喷射、多路径传输和微秒级重路由,以提升可靠性并减少因拥塞或链路故障导致的 GPU 空闲时间。 这可能显著提升超大规模 AI 基础设施的吞吐量和韧性,因为网络停顿会浪费昂贵的 GPU 算力并拖慢训练任务。将其标准化为开放的 OCP 规范,也有望减少 AI 网络栈的碎片化,并加快未来超大规模集群的落地。 MRC 建立在 RoCEv2 之上,扩展了 RC 传输,并通过显式多路径机制和路径健康监测,使端点在拥塞或故障发生时仍能保持有效吞吐量。该协议据称已在 OpenAI 和微软的数据中心等生产环境中部署,并与 NVIDIA Spectrum-X 和 Blackwell 系统相关联。

telegram · zaihuapd · May 6, 14:39

背景: RDMA(远程直接内存访问)允许一台机器直接把数据传到另一台机器的内存中,从而以更低的 CPU 开销和更低的延迟完成传输。在大型 AI 集群中,网络经常是瓶颈,因为成千上万块 GPU 在训练过程中需要交换大量数据。数据包喷射是一种负载均衡方法,会把流量分散到多条可用网络路径上,避免单条链路拥塞。

参考链接

标签: #AI infrastructure, #RDMA, #NVIDIA, #OpenAI, #cluster networking


月之暗面估值破百亿美元 ⭐️ 8.0/10

据称,月之暗面在 2 月 23 日完成了新一轮超过 7 亿美元的融资,由阿里、腾讯、五源、九安等联合领投,累计融资额已超过 12 亿美元。报道还称,该公司估值在两年多时间里突破 100 亿美元,Kimi 的收入和海外业务也在快速增长。 如果消息属实,这将是中国大模型创业公司中速度极快的估值跃升之一,也说明在竞争激烈的市场里,头部 AI 公司仍然能吸引大量资本。Kimi 来自海外用户和 API 调用的收入增长,意味着月之暗面可能比不少同行更早找到清晰的商业化路径。 报道还称,Kimi 近 20 天的累计收入已经超过其所称的 2025 年全年总额,而且海外收入已经超过国内收入。文中提到的 K2.5 模型出现在 OpenRouter 上,而 OpenRouter 是一个把多家大语言模型聚合到统一接口中的 API 平台。

telegram · zaihuapd · May 7, 00:30

背景: 月之暗面是 Kimi 背后的大模型创业公司,Kimi 是其面向用户和开发者的重要产品之一。OpenRouter 是一个把多家大语言模型聚合到同一 API 接口的平台,方便开发者在不同模型之间调用和切换。搜索结果还显示,Kimi K2.5 被描述为月之暗面的新模型,并且具有开源和多模态特征。

参考链接

标签: #AI, #LLM, #融资, #Moonshot AI, #Kimi


苹果研发占比突破 10% 加速 AI 布局 ⭐️ 8.0/10

苹果 2026 年 3 月财季研发支出占营收比例升至 10.3%,这是 30 年来首次超过 10%。在营收同比增长 17%的同时,研发支出同比增长 34%,显示公司正加大对端侧 AI、自研芯片和 Private Cloud Compute 的投入。 这表明苹果把 AI 视为平台级重塑,而不仅是功能升级,这可能改变其硬件路线图,并影响智能手机、可穿戴设备和未来新形态产品的竞争格局。若苹果推进成功,庞大的用户基础可能加速端侧 AI 普及,并抬高隐私保护型 AI 系统的行业门槛。 报道提到的重点方向包括 Siri 升级、首款折叠屏 iPhone、AI 眼镜以及带摄像头的 AirPods,这说明苹果希望将 AI 深度嵌入多条产品线。苹果还在强调自研芯片和 Private Cloud Compute,意味着其可能采用本地端侧运行与苹果自有云基础设施协同的混合 AI 模式。

telegram · zaihuapd · May 7, 01:00

背景: 端侧 AI 是指把 AI 任务直接在用户设备上处理,而不是全部发送到远程服务器,这通常有助于降低延迟并提升隐私保护。Apple Silicon 指苹果自研芯片,Neural Engine 是其中专门用于加速机器学习任务的硬件模块。Private Cloud Compute 是苹果面向 AI 任务设计的隐私优先云系统,用来处理那些无法完全在设备端运行的工作负载。

参考链接

标签: #Apple, #AI, #R&D spending, #hardware platforms, #semiconductor