【转帖】text-davinci-003和ChatGPT之间的不同点

text,davinci,chatgpt,之间,不同点 · 浏览次数 : 0

小编点评

**InstructGPT 与 ChatGPT 的主要区别:** | 特征 | InstructGPT | ChatGPT | |---|---|---| | 指南任务 | 人工指令 | 多任务 | | 幻觉程度 | 更少、更真实 | 更丰富 | | 生成多样性 | 相对更差 | 相对更丰富 | | 创造性 | 相对更差 | 相对更丰富 | | 训练语料清洗程度 | 较少 | 较多 | | 最终目标 | 与 API 一起使用 | 与 ChatGPT 一样成为最终产品 | | 开箱效果 | 较差 | 较好 |

正文

https://zhuanlan.zhihu.com/p/603709081

 

先看下GPT的发展时间线

InstructGPT(2022 年 1 月)是一系列 GPT-3 模型(包括 text-davinci-001、text-davinci-002 和 text-davinci-003)统称,于GPT-3相比,它的最大不同是针对人类指令(reinforcement learning with human feedback, RLHF)进行了微调 ; InstructGPT 产生的幻觉更少,更真实,但它在生成的多样性或者说创意上相对更差,因为它们试图在“对齐”的前提下,将人类偏好/价值观硬塞进原始数据模型中。

ChatGPT(2022 年 11 月)更进一步。 为了训练 ChatGPT,OpenAI 对 InstructGPT 对话模型进行了微调(马斯克在Twitter上指出openai 使用了Twitter 数据)。 这种微调在一定程度上也是可以的。 区别在于使用的policy and reward model

我们可以先看下 DeepMind 如何构建policy和reward model,然后训练出的 Sparrow 70B取得了和 ChatGPT 相同的结果。下面列出了 DeepMind 用来让聊天机器人符合研究目标的 23 条规则:

OpenAI 也在做同样的事情,他们没有发表论文,但他们博客文章中的图表非常清楚了

也就是说,每次你向 ChatGPT 提出问题或发出提示时,输出只能与类似于上述的规则对齐(除非你找到一些对抗性入口点!)

ChatGPT 的输出更符合人类(这是重点!!!)但不如两年半前(2020 年 5 月)的原始 davinci 有用。感兴趣的朋友可以自己进行比较试试:chat.openai.com (ChatGPT) vs Leta Prompt (davinci classic)

因此,总结一下,两者的主要区别如下:

  1. davinci 比 chatgpt 更开放、更具有创意性;你可以让它做更多种类的事情,但 chatgpt 在其创建的特定任务中“更聪明”——例如创建列表、表格、摘要等
  2. chatGPT也可以认为是 Davinci-3 的衍生产品,它们效果上同样好,但 davinci 使用的训练语料,清洗的程度较chatGPT更少;chatGPT会不断提醒我它的局限性,而 Davinci-003 表现更像人类一样
  3. 如果不添加“让我们逐步思考:”或类似内容,davinci-003 无法正确解决部分问题,而 ChatGPT 更好试用
  4. DaVinci 将更加灵活和通用,但是它要花钱,而且开箱即用效果不佳;DaVinci 的真正目的是与 API 一起使用来开发应用程序;它本身不像 ChatGPT 那样是最终产品。

参考:

GPT-3.5 + ChatGPT: An illustrated overview

Difference between ChatGPT and the new davinci 3 model?

Which model is smarter: ChatGPT or Davinci-003?

OpenAI InstructGPT paper (Mar/2022)

DeepMind Sparrow 70B paper (Sep/2022)

DeepMind Sparrow Dialogue model: Prompt & rules

与【转帖】text-davinci-003和ChatGPT之间的不同点相似的内容:

【转帖】text-davinci-003和ChatGPT之间的不同点

https://zhuanlan.zhihu.com/p/603709081 先看下GPT的发展时间线 InstructGPT(2022 年 1 月)是一系列 GPT-3 模型(包括 text-davinci-001、text-davinci-002 和 text-davinci-003)统称,于G

[转帖]终端下肉眼看不见的东西

https://kodango.com/hidden-text-in-terminal 假设test目录下面有a.log、b.log和c.log三个文件: # ls -1 *.log a.log b.log c.log 现在,我们想要遍历这几个文件,找到关心的信息,例如log文件中是否存在error

[转帖]阿里规范 - 五、MySQL 数据库 - (一)建表规约 - 8 - 【强制】varchar 是可变长字符串,不预先分配存储空间,长度不要超过 5000,如果存储长 度大于此值,定义字段类型为 text,独立出来一张表,用主键来对应,避免影响其它字段索 引效率。

字段类型为 text,独立出来一张表,用主键来对应,避免影响其它字段索 引效率。 1、因为mysql 是行存储模式,所以会把整行读取出来。text 储存了大量的数据。读取时,占了大量的io。所以会十分的慢。 2、每行的数据过大 行溢出 InnoDB 会将一些大对象数据存放在数据页之外的 BLOB 页

[转帖]rsar - Extract data from plain-text sar files

sar -A -t -f /tmp/sa11 >/tmp/sar11 https://github.com/ryran/rsar When dealing with sysstat sar data in a sosreport, it's almost always easier to parse

[转帖]MySQL总长字符类型优化

https://blog.csdn.net/weixin_32254411/article/details/113535526 阿里规范中有一条 varchar是可变长字符串,不预先分配存储空间,长度不要超过5000,如果存储长度 大于此值,定义字段类型为 text,独立出来一张表,用主键来对应,避

[转帖]Pepper-Box - Kafka Load Generator

https://github.com/GSLabDev/pepper-box Pepper-Box is kafka load generator plugin for jmeter. It allows to send kafka messages of type plain text(JSON,

[转帖]KingbaseES不同字符类型比较转换规则

https://www.cnblogs.com/kingbase/p/14798059.html Postgresql 常用的字符数据类型的有char、varchar和text,其中 char 固定长度类型, varchar 和 text 是可变长度类型。这三种类型在进行比较时,会进行隐含的类型转换

[转帖]

Linux ubuntu20.04 网络配置(图文教程) 因为我是刚装好的最小系统,所以很多东西都没有,在开始配置之前需要做下准备 环境准备 系统:ubuntu20.04网卡:双网卡 网卡一:供连接互联网使用网卡二:供连接内网使用(看情况,如果一张网卡足够,没必要做第二张网卡) 工具: net-to

[转帖]

https://cloud.tencent.com/developer/article/2168105?areaSource=104001.13&traceId=zcVNsKTUApF9rNJSkcCbB 前言 Redis作为高性能的内存数据库,在大数据量的情况下也会遇到性能瓶颈,日常开发中只有时刻

[转帖]ISV 、OSV、 SIG 概念

ISV 、OSV、 SIG 概念 2022-10-14 12:29530原创大杂烩 本文链接:https://www.cndba.cn/dave/article/108699 1. ISV: Independent Software Vendors “独立软件开发商”,特指专门从事软件的开发、生产、