OpenAI破解对齐难题？超级对齐负责人Jan Leike采访实录：「可扩展监督」是良策( 五 ) _OpenAI

在某种程度上，有时你训练的模型并没有产生「不对齐」。但也许你用不符合人类偏好的函数训练它。此时，如果最终模型与你的偏好不相符，这并不奇怪。
Q9：超级对齐的目标是尽量减少日益强大的 AI 系统所带来的风险并尽量最大化它的好处。但仅仅通过超级对齐不足以实现这一目标。如何看待超级对齐背景下的人工智能治理问题？
Jan：这两者是不同的问题。它们在某些方面是重叠的。如果你能解决对齐问题，就有能帮你解决其它问题的对齐后的模型。对于开源模型来说，对齐治理问题可能也特别突出。
我们可以做出一个完全对齐的开源模型，人们也可能去掉对齐让模型做一些不安全的事情。因此，如何管理模型的使用和误用，包括开源模型，似乎是一个非常开放的问题。

OpenAI破解对齐难题？超级对齐负责人Jan Leike采访实录：「可扩展监督」是良策( 五 )

推荐阅读

杨幂|杨幂，成毅，伦，易梦玲，奚梦瑶

汽车减速只会踩刹车作为合格的车主，这3种减速方式应切换自如

职业教育|为什么在毕业五六年之后，才发现公务员是真的香？现在也不晚！

新的平底锅买回来第一次怎么用

捡到10万元钻戒以为是道具■跑车掉下10万元钻戒，拾到者以为是道具

「娱乐密探」而黑过张馨予的人，远远多过喜爱她的人。，作为明星总有会被黑的时分

「郑智」抬价开始？内马尔转会定价1.64亿，皇马参与追逐战！巴萨这下难了

中国银行保险报|年内第6家汇丰银行（中国）支行关闭

『树诚教育』全世界都一样，学习是辛苦的

声带麻痹会呼吸困难吗

时尚星闻|真的是团队的锅吗？，粉丝越管越宽？一言不合就开骂

猫眼看数码三款适合大学生的5G手机盘点用满四年无压力，价格不超3000元高通骁龙865：红米K30 Pro联发科天玑1000 Plus：iQOO Z1麒麟990 5G：荣耀V30 Pro

扬子晚报|热心群众报警疑似酒驾，司机被查后还坚称自己没开车

罗志祥@罗志祥干妈再发声，对周扬青态度360度大转变

内双眼皮如何画眼妆！内双眼皮化妆技巧

「减肥」减肥怎么吃？这样的健身食谱想不瘦都难！

立案后多久通知被告(民事诉讼立案后多久通知被告人)

8月出生的属于什么星座 8月出生的是什么星座

上大学怀念高中生活?好想念高中的日子

#育妈记#普通人很少用，为什么女明星更容易怀上双胞胎？这两个秘诀