Skip to the content.

From 32 items, 3 important content pieces were selected


  1. 苹果 SHARP 可通过 ONNX Runtime Web 在浏览器运行 ⭐️ 8.0/10
  2. NASA 阿尔忒弥斯二号激光链路从月球附近传回 484GB ⭐️ 8.0/10
  3. DeepSeek-V4 预览版开源 ⭐️ 8.0/10

苹果 SHARP 可通过 ONNX Runtime Web 在浏览器运行 ⭐️ 8.0/10

一位开发者将苹果的 SHARP 单图 3D 高斯泼溅预测器导出为 ONNX,并使用 onnxruntime-web 和 WebGPU 执行提供程序让它完整运行在浏览器中。这个演示支持上传图片后生成 .ply 三维结果,并可在本地预览或下载,图片不会离开浏览器标签页。 这展示了浏览器端机器学习已经开始能承载较重的视觉模型,而不只是轻量级演示。把 SHARP 放到本地运行可以提升隐私性并消除服务器往返,这对创意工具、边缘设备以及未来的客户端 AI 工作流都很重要。 作者表示导出的模型体积很大,侧边文件大约有 2.4 GB,因此在冷缓存下首次加载会比较慢,不过在较新的 Mac 上推理本身只需要几秒。苹果发布的权重仅限研究用途,演示虽然把导出的 ONNX 文件托管在 R2 上以便开箱即用,但用户也可以从上游苹果仓库自行导出并本地上传。

hackernews · bring-shrubbery · May 3, 09:14

背景: SHARP 是苹果近期推出的单目 3D 重建模型,它能把单张图片转换成 3D 高斯泼溅结果,并以场景形式渲染出来。ONNX 是一种可移植的模型格式,ONNX Runtime Web 可以在浏览器中执行这些模型,而 WebGPU 执行提供程序则让运行时能够使用客户端设备的 GPU 来处理更重的任务。3D 高斯泼溅是一种用学习得到的点状原语来表示和渲染三维场景的方法,而不是传统网格。

参考链接

社区讨论: 评论者总体上对这个 ONNX 导出的体积和技术野心感到惊讶,有人特别提到 2.4 GB 的 ONNX 文件相当夸张。也有人把这个演示与更广泛的浏览器原生 AI 趋势联系起来,尤其是保护隐私的客户端推理和创意应用,但同时指出了 WebGPU 兼容性、模型转换摩擦以及超大模型在浏览器中落地的实际限制。

标签: #ONNX Runtime Web, #WebGPU, #3D Gaussian Splatting, #Browser ML, #Computer Vision


NASA 阿尔忒弥斯二号激光链路从月球附近传回 484GB ⭐️ 8.0/10

NASA 阿尔忒弥斯二号任务的光学通信系统 O2O 已成功从月球任务中以最高 260 Mbps 的速率下传 484 GB 数据。此次传输表明,激光链路能够比传统射频更快地把大量任务数据从月球附近传回地球。 这为未来月球和火星任务所需的高带宽光通信提供了重要验证,因为载人飞船和探测器需要回传更多视频、图像和科学数据。它有望提升近实时操作能力、带来更流畅的公开视频体验,并缓解深空探索中的通信瓶颈。 O2O 模块由 MIT 林肯实验室开发,使用一台 4 英寸望远镜和两个云台将激光通信指向地球地面站。此次演示的地面基础设施包括喷气推进实验室、白沙综合设施以及澳大利亚国立大学的斯特罗姆洛山天文台,据称系统曾在不到一小时内接收 26 GB 数据。

telegram · zaihuapd · May 3, 00:50

背景: 光通信使用红外或激光束而不是射频波来传输数据,因此通常可以显著提高带宽。NASA 的阿尔忒弥斯二号是一项载人登月任务,O2O 的目标是展示激光通信能够从深空回传高清视频和高分辨率图像。这项技术也是 NASA 为支持地球轨道之外更高要求任务而推进通信系统升级的一部分。

参考链接

标签: #NASA, #laser communication, #Artemis II, #space systems, #deep-space communications


DeepSeek-V4 预览版开源 ⭐️ 8.0/10

DeepSeek 已正式上线 DeepSeek-V4 的预览版本,并同步开源。DeepSeek-V4-Pro 的 Agent 能力显著增强,而 DeepSeek-V4-Flash 则提供了更小、更便宜的 API 方案。 这很重要,因为它进一步抬高了开源 Agentic AI 的能力上限,尤其是在代码和推理任务上。如果这些评测结果成立,更多团队就能在生产级 Agent 场景中采用 DeepSeek,而不必完全依赖闭源模型。 根据给定内容和搜索结果,DeepSeek-V4-Pro 被描述为开源模型中的 Agentic Coding 先进水平,并在数学、STEM 和竞赛型代码评测中超过了已公开测试的开源模型。DeepSeek-V4-Flash 则定位为更轻量的版本,参数量和激活成本更低,因此推理更快、API 价格也更经济。

telegram · zaihuapd · May 3, 02:21

背景: Agentic AI 指的是能够更自主地规划并执行多步任务的模型,例如代码工作流或工具调用。在 AI 发布中,数学、STEM 和代码评测常被用来比较不同模型的推理能力和实际问题解决能力。开源模型发布尤其重要,因为开发者可以自行查看、运行和调整模型。

参考链接

标签: #DeepSeek, #open-source LLM, #agentic AI, #foundation models, #AI benchmarks