什么是Token？为什么大模型要计算Token数 - PmDaddy

什么是Token？为什么大模型要计算Token数

token · 浏览次数 : 0

小编点评

**Token 是什么？** Token 是文本中可以被视为一个单独单位的元素的名称，例如单词、数字或符号。它通常指的是： * 文本中每个词、标点“大家”、“好”、“我”、“是”、“运营黑客”，以及中间出现的“，”和“。” **GPT 如何计算token数？** GPT token 的计算包含两部分： * 输入给 GPT 模型的 token 数 * GPT 模型生成文本的 token 数例如，你提问耗费了 100 token，GPT 根据你的输入，生成文本（也就是回答）了 200 token，那么一共消费的 token 数就是 300 。

正文

本文分享自华为云社区《【技术分享】什么是Token？为什么GPT基于Token定价》，作者：开天aPaaS小助手Tracy。

在使用LLM大模型时，我们经常会遇到一个关键词，叫：Token。

比如：

最新版 GPT-4 Turbo 模型最高支持 128k token 上下文；

曾经 GPT 最强对手 Claude-2.1 支持最高 200K token 上下文；

在 GPT 商店创建角色时，核心 Prompt 最高支持 8000 token。

1. 什么是 Token？

GPT不是直接做的“字符”的计算,而是将字符变成一个数字,也就是变成了 token 来处理。

所以Token通常指的是：文本中可以被视为一个单独单位的元素，比如单词、数字或符号。

比如：我们文章经常用到的开篇问候，“大家好，我是运营黑客。”

其中每个词、标点“大家”、“好”、“我”、“是”、“运营黑客”，以及中间出现的“，”和“。”，都可以被视作一个 Token。

对于文本类生成式AI来说，“Token”扮演着至关重要的角色。我们跟 ChatGPT 对话时，它通常分两步走：

第一步：将输入的内容分解成一个个 Token；

第二步：结合这些 Token 生成回应。

2.GPT如何计算token数？

了解Token含义后，就很容易的明白token计费逻辑。

GPT token 的计算包含两部分。输入给 GPT 模型的 token 数和 GPT 模型生成文本的 token 数。

例如，你提问耗费了 100 token，GPT 根据你的输入，生成文本（也就是回答）了 200 token，那么一共消费的 token 数就是 300 。

在实际定价的过程中，因输入和输出token所带来的成本差异，所以会区分定价。

包含GPT在内的几乎所有的LLM的API都采用了Token计费模式：

例1：

例2：

例3：

基于Token计费模式，第一符合产品对象增量属性；第二符合边际成本的增量属性；对开发者来说是最容易接受和理解的一种模式。

参考链接：

https://www.zhihu.com/question/594159910/answer/3356500890

https://www.zhihu.com/question/594159910/answer/2972923596

https://3ms.huawei.com/km/groups/3664365/blogs/details/13643749

点击关注，第一时间了解华为云新鲜技术~

与什么是Token？为什么大模型要计算Token数相似的内容：

什么是Token？为什么大模型要计算Token数

本文分享自华为云社区《【技术分享】什么是Token？为什么GPT基于Token定价》，作者：开天aPaaS小助手Tracy。在使用LLM大模型时，我们经常会遇到一个关键词，叫：Token。比如：最新版 GPT-4 Turbo 模型最高支持 128k token 上下文；曾经 GPT 最强对手

[golang]在Gin框架中使用JWT鉴权

什么是JWT JWT，全称 JSON Web Token，是一种开放标准（RFC 7519），用于安全地在双方之间传递信息。尤其适用于身份验证和授权场景。JWT 的设计允许信息在各方之间安全地、 compactly（紧凑地）传输，因为其自身包含了所有需要的认证信息，从而减少了需要查询数据库或会话存储

【Azure Developer】Azure AD 注册应用的 OAuth 2.0 v2 终结点获取的 Token 解析出来依旧为v1，这是什么情况！

问题描述使用 Azure AD 注册应用 Oauth2 v2.0的终结点(OAuth 2.0 token endpoint (v2)： https://login.partner.microsoftonline.cn//oauth2/v2.0/token ) 获取T

Spring Cloud微服务下如何配置I8n

什么是I8n 国际化（I18n）指的是设计和开发产品的过程，使得它们能够适应多种语言和文化环境，而不需要进行大量的代码更改。这通常涉及到创建一个基础版本的产品，然后通过配置和资源文件来添加对不同语言和地区的支持。这样，当产品需要在新的地理区域或语言环境中使用时，只需要添加或更新相应的资源文件，而不

【JavaScript】聊一聊js中的浅拷贝与深拷贝与手写实现

什么是深拷贝与浅拷贝？深拷贝与浅拷贝是js中处理对象或数据复制操作的两种方式。‌在聊深浅拷贝之前咱得了解一下js中的两种数据类型：

SD中的VAE,你不能不懂

什么是VAE？ VAE，即变分自编码器（Variational Autoencoder），是一种生成模型，它通过学习输入数据的潜在表示来重构输入数据。在Stable Diffusion 1.4 或 1.5 模型中，通过VAE对模型进行部分更新，以提升模型渲染眼睛的能力。通过这种更新，模型在生成图像

统计建模基础

什么是建模？问题——>数据——>模型——>结论统计建模的本质收集、分析、展示、解释数据统计问题回归：横截面数据、纵向数据分类：横截面数据、分类数据我们观测不到真值，观测到的数据一定有误差。如何确定模型？ 1.根据探索性数据分析主观确定一个参数模型或者一个算法。 2.根据已知数据训

什么是浅拷贝和深拷贝，如何用 js 代码实现？

〇、简介和对比简介浅拷贝：只复制原始对象的第一层属性值。如果属性值是值类型，将直接复制值，本值和副本变更互不影响；如果是引用数据类型，则复制内存地址，因此原始对象和新对象的属性指向相同的内存地址，改变任一值，另一变量值也会同步变更。深拷贝：递归地复制原始对象的所有层级。每一个属性值都会在

实战 k8s----初识

什么是k8s？k8s是谷歌开源的一套完整的容器管理平台，方便我们直接管理容器应用。谷歌称之为，kubernetes，[kubə’netis] ，（跟我一起读库波尔耐题思，重音在耐的音上），由于字母太多，我们简称为k8s，8代表k-->s之间的8个字母。kubernetes 译为舵手，标识是一个航海舵

OpenWrt安装配置Tailscale

什么是tailscale? Tailscale就是基于Wireguard的一个联网工具，无需公网地址，通过去中心化，实现各个节点之间点对点的连接.配置简单友好，支持的各类平台和客户端. 相比较其他组网工具的优势是什么? 对比zerotier和wireguard,tailscale更容易连上官方的中转

# 热门排行

微软 New Bing AI 申请与使用保姆级教程（免魔法） ChatGPT API使用介绍 ChatGPT开发实战一篇带你了解如何使用纯前端类Excel表格构建现金流量表手把手教你玩转 Excel 数据透视表为什么 C# 可能是最好的第一编程语言 .NET 入门到高级路线提高工作效率的神器：基于前端表格实现Chrome Excel扩展插件 React + Springboot + Quartz，从0实现Excel报表自动化用Echarts实现前端表格引用从属关系可视化