发布日期:2025-05-19 05:40 点击次数:134

ChatGPT的建树公司 OpenAI 于当地时期 5 月 14 日告示,将上线一个名为 “安全性评估中心(Safety Evaluations Hub)” 的网页,挑升公布旗下AI模子的安全性评估效能。
在这个网页上,用户不错看到OpenAI的AI模子在生成无益骨子、逃狱(绕过安全扬弃生成受限骨子)、出现幻觉(hallucination)等多样测试中的评分确认。
OpenAI暗示:“这个平台体现了咱们莳植透明度的起劲”,“咱们将抓续公开有关见识,并在有要紧更新时进行骨子刷新。”
OpenAI还补充说念:“通过在这个平台上公开部分安全性评估效能,外界将更容易剖析OpenAI系统的安全确认,同期也不错提拔悉数行业提高透明度的共同起劲。”

配景:透明性质疑抓续发酵
OpenAI此举,是在其AI模子透明性问题激励争议之后作出的回复。
据科技媒体 TechCrunch 报说念,近几个月来,OpenAI被月旦对部分主力模子急遽中完成安全测试,而对其他模子则莫得公开任何时期文告,激励外界质疑。
此外,本年 3 月底,ChatGPT的基础模子 GPT-4o 推出更新后,用户的不悦声浪速即升高,最终OpenAI不得不全面除去该次更新。

“GPT-4o”更新带来辞别时宜的歌唱
此次更新本意是让ChatGPT对用户的发问和发言确认出更多歌唱与认可,但效能却欺人自欺——在某些语境中出现了与场景统统不符的回复。
部分用户反应称,我方提到杀死动物或违背戒酒容许等负面算作时,ChatGPT竟回复“真棒”“太好了”之类的“离谱瞻仰”,激励多半月旦。
OpenAI但愿通过“安全性评估中心”的上线,援救用户信任,并讲授其对AI安全性和透明度的深嗜正在付诸行动。
OpenAI首席现实官(CEO)山姆·奥特曼(Sam Altman)也于上月 28 日通过酬酢平台X(前身为推特)承认了有关问题赌钱赚钱官方登录,并在官方网站博客中预报了后续搪塞步调。
#图文打卡规画#举报/反应