跳至内容
📅 2025-12-11 日报
🤖 人工智能与前沿研究
- Google DeepMind 发布事实性评估基准:DeepMind 联合 Kaggle 发布 FACTS 基准测试套件,旨在从搜索能力、参数化知识及多模态三个维度系统性评估大模型的真实性。
- Google 推出差分隐私分析框架:Google Research 介绍了一种名为 Urania 的新框架,利用差分隐私聚类和关键词提取技术,在严格保护用户隐私的前提下分析 AI 聊天机器人的使用情况。
- Apple 发布多项机器学习研究成果:
- 因果发现:提出一种多视图线性结构方程模型,在弱假设下通过利用视图间的相关性改进因果发现算法。
- 生成模型:推出 CADD 框架,通过引入连续潜在空间增强离散扩散模型,显著提升了文本、图像和代码生成的质量。
- 视觉推理:提出 Chain-of-Sketch 方法,将复杂的视觉任务分解为中间步骤,帮助大模型处理迷宫、图表等全局视觉推理任务。
- 微软开源动态提示词 UI 框架:Microsoft Research 推出 Promptions 中间件,通过动态 UI 控件帮助用户更精准地调整 AI 上下文,降低提示词工程的试错成本。
- OpenAI 加强网络安全防御:OpenAI 宣布正在投入资源评估 AI 模型在网络安全中的风险,并与安全社区合作提升模型的防御能力以应对滥用。
🛠️ 开发技术与开源生态
- Rust 正式成为 Linux 内核核心:Linux 内核维护者峰会达成共识,移除 Rust 语言的“实验性”标签,正式承认其为内核开发的核心组成部分。
- AV1 编解码器荣获艾美奖:开源视频编解码器 AV1 因其对全球视频内容传输效率的巨大贡献,被授予技术与工程艾美奖。
- Let’s Encrypt 十周年里程碑:Let’s Encrypt 成立十周年,作为全球最大的证书颁发机构,它成功推动了 HTTPS 加密在互联网的普及。
- AI 代理的“持续学习”技巧:技术文章分享了通过维护
agents.md 文件来构建 AI 代理记忆的方法,帮助开发者在不同会话中保留偏好设置以提升效率。
- Excel 实现 DBSCAN 算法:数据科学教程展示了如何在不依赖编程语言的情况下,仅用 Excel 理解并实现基于密度的聚类算法(DBSCAN)。
🚀 科学探索与生物技术
- 韦伯望远镜发现最遥远超新星:天文学家利用韦伯望远镜确认了一颗爆炸于宇宙诞生后约 7.3 亿年的超新星,刷新了人类观测到的最古老超新星纪录。
- CRISPR 成功治疗罕见病:CRISPR 基因编辑技术再获突破,成功通过定制化疗法治愈了一名患有罕见遗传性尿素循环障碍的婴儿。
- 地球工程与气候预警:以色列初创公司提出备受争议的平流层颗粒喷洒降温方案;同时数据显示 2025 年或将成为有记录以来第二或第三热的年份。
💼 科技政策与商业动态
- 苹果 AI 策略获市场认可:尽管被认为在 AI 领域进展缓慢,苹果保守的投资策略近期反而助推股价上涨,市值一度反超微软并逼近英伟达。
- 澳大利亚社交媒体禁令生效:澳大利亚针对 16 岁以下青少年的社交媒体禁令正式生效,此举引发了关于剥夺青少年数字交流权利的法律诉讼。
- 美国务院恢复旧字体标准:美国新任国务卿要求国务院内部通讯弃用便于屏幕阅读的 Calibri 字体,恢复使用更传统的 Times New Roman。