- 主页 > 生活百科 > >
ChatGPT/InstructGPT详解( 六 )
^Radford, A., Wu, J., Child, R., Luan, D., Amodei, D. and Sutskever, I., 2019. Language models are unsupervised multitask learners. *OpenAI blog*, *1*(8), p.9. https://life-extension.github.io/2020/05/27/GPT%E6%8A%80%E6%9C%AF%E5%88%9D%E6%8E%A2/language-models.pdf ^Brown, Tom B., Benjamin Mann, Nick Ryder, Melanie Subbiah, Jared Kaplan, Prafulla Dhariwal, Arvind Neelakantan et al. “Language models are few-shot learners.” *arXiv preprint arXiv:2005.14165* (2020). https://proceedings.neurips.cc/paper/2020/file/1457c0d6bfcb4967418bfb8ac142f64a-Paper.pdf ^Wei, Jason, et al. "Finetuned language models are zero-shot learners." *arXiv preprint arXiv:2109.01652* (2021). https://arxiv.org/pdf/2109.01652.pdf ^Christiano, Paul F., et al. "Deep reinforcement learning from human preferences." *Advances in neural information processing systems* 30 (2017). https://arxiv.org/pdf/1706.03741.pdf ^Schulman, John, et al. "Proximal policy optimization algorithms." *arXiv preprint arXiv:1707.06347* (2017). https://arxiv.org/pdf/1707.06347.pdf?
推荐阅读
-
5G手机最核心的基带芯片,全球仅7大厂商掌握,中国占了四家
-
大建侃球@瓦妮莎曼巴日追思丈夫和女儿:生活实在太不公平,四年前科比退役
-
-
-
电池|内行人忠爱的两款大电池手机,最大6000mAh,最小5100mAh!
-
入坑索尼A6100,或许是最好的入门级APS-C相机
-
-
文玩|那些暴涨又暴跌的文玩,骗走多少文玩人的血汗钱
-
流年絮语|张艺凡穿无袖衣体操服,当她抬起胳膊时,看清腋窝,不敢相信眼睛
-
-
秋声带雨荷被病毒干倒无人问津,后悔为美国卖命了?曾为美国出生入死的老兵
-
-
招聘|现在的烟草局算什么性质的单位,还有编制吗?怎样算正式工?
-
电视剧|《欢乐合唱团》演员湖上失踪,剩4岁儿子在船上,她是该剧组第5个出事儿的人
-
澎湃影像|阿塞拜疆总统称正继续在纳卡地区进行军事活动
-
JOJO杂谈01,快用你无敌的白金之星想想办法,空条承太郎
-
华为首发5nm麒麟9000,华为暗示:Mate 40即将发布
-
北晚新视觉网特朗普:如果我们不做检测,病例就会变少,美国确诊病例超141万
-
经济|原创外资大举买入中国资产,中国资产为啥成了被抢购的香饽饽?
-
你不可不知的,中国56个民族,除了汉族之外,它才是最大的民族