Topic

科技动态

A collection of 2366 issues

OpenAI 拟收购 AI 安全平台 Promptfoo,强化企业级智能体安全性

OpenAI 宣布拟收购 AI 安全平台 Promptfoo,旨在增强企业级 AI 智能体的安全性与合规性。收购完成后,Promptfoo 的技术将直接集成至 OpenAI Frontier 平台,为构建和运行“AI 同事”(AI coworkers)提供支持。 该平台将引入自动化的红队测试、风险修复及合规报告功能,帮助企业识别并应对提示词注入、数据泄露及工具误用等风险。OpenAI 表示,在推进 Frontier 深度集成的同时,将继续维护 Promptfoo 的开源项目。目前该交易的完成仍需满足惯例成交条件。

arXiv 论文披露 CC-BOS 框架,利用文言文实现大模型自动化越狱攻击

近日发表于 arXiv 的研究论文披露,文言文因其简洁与晦涩的特性,能有效绕过大语言模型(LLM)的现有安全约束。研究团队据此提出 CC-BOS 框架,利用生物启发式搜索算法自动生成文言文对抗性提示词,在黑盒环境下实现了高效的越狱攻击。 该框架基于多维果蝇优化算法,从角色、隐喻等 8 个维度对提示词进行迭代优化。实验数据表明,CC-BOS 的攻击效果优于现有主流方法,进一步揭示了跨语言语境下大模型安全防护的潜在漏洞。

Uber 在全美推广女性司机匹配功能以应对性侵诉讼

Uber 周一宣布在全美范围内推广“女性司机”(Women Drivers)匹配功能,覆盖纽约、费城和华盛顿特区等市场。用户可通过预约或在应用设置中开启偏好,以增加与女性司机匹配的概率。此举旨在应对全美数千起乘客性侵诉讼,此前公司曾因未能阻止一起 2023 年发生的性侵案被判赔偿 850 万美元。 目前全美约 20% 的 Uber 司机为女性,受地区性别比例差异影响,选择该功能的乘客可能面临更长的等待时间。该功能此前已在德国、法国等 6 个国家上线,其竞争对手 Lyft 已于 2024 年推出了类似服务。

澳大利亚网络年龄新规生效后

色情平台封锁本地访问,VPN 下载量激增 澳大利亚网络年龄验证新规于本周一正式生效,要求色情网站核实用户年满 18 岁,并规定 AI 聊天机器人服务须阻止未成年人访问色情、极端暴力、自残及饮食失调等内容。新规生效当日,VPN 应用下载量急升,苹果 App Store 免费榜前 15 名中有 3 款为 VPN,其中"VPN - Super Unlimited Proxy"排名超过所有社交媒体平台下载量。 总部位于加拿大、旗下运营 RedTube、YouPorn 及 Pornhub 等知名色情网站的 Aylo 公司随即封锁澳大利亚用户访问,并以英国、法国及美国多个州的年龄验证法律"低效且随意"为由,称已在上述地区也同步限制未成年的平台访问。

Meta 主张通过 BitTorrent 上传盗版书籍亦属合理使用

在作家版权诉讼案中,Meta 上周向加州联邦法院提交补充答辩,首次主张其在下载训练数据过程中通过 BitTorrent 协议向其他用户上传盗版书籍的行为同样构成合理使用。Meta 辩称,上传是 BitTorrent 协议的固有机制而非主动选择,且在 Anna's Archive 等影子图书馆中,相关数据集仅能通过种子批量获取,BitTorrent 是唯一可行途径。 原告律师随即致函主审法官 Vince Chhabria,指 Meta 自 2024 年 11 月起已知晓上传侵权指控,却从未提出该抗辩,认为此举违反了发现程序截止期限规定。Meta 反驳称,该抗辩早已在 2025 年 12 月的案件管理陈述中明确列出。此外,Meta 援引原告作者的证词指出,每位具名作者均承认未发现任何 Meta 模型输出复制其书籍内容。法官是否允许这一"技术必要性合理使用"抗辩,

Anthropic 面向全球开放 Claude 社区大使招募,提供 API 积分与活动赞助

Anthropic 正式开放 Claude Community Ambassadors 项目申请,面向全球招募愿意在本地组织 Claude 相关活动的社区建设者。入选者可获得活动经费、每月 API 积分、周边物料及 Anthropic 渠道推广支持,并有机会参与产品预发布功能测试和 Builders Council 会议,向产品团队提供社区反馈。 项目不设开发者职称门槛,申请者需具备 Claude Code 或 Claude Cowork 的实际使用经验及社区参与记录。Anthropic 表示将优先保障地域多样性,同一城市可有多名大使。申请提交后两周内回复,通过初审者将受邀参加简短筛选通话。项目不提供直接薪酬,大使资格持续有效,前提是保持活动组织与社区参与。