[转帖]BF16 与 FP16 在模型上哪个精度更高呢

bf16,fp16,模型,哪个,精度 · 浏览次数 : 0

小编点评

## 内容解析 **问题 1:性能加速比** BF16 的半精度精度比 FP16 高,但整数范围更小。这意味着,FP16 可以表示的整数范围比 BF16 更宽,但尾数精度更高。因此,BF16 通常用于需要快速处理整数数据的场景,例如: * 数值计算 * 循环计算 * 整数加减 **问题 2:性能加速比** 与 FP16 相似的性能加速比通常在以下情况下使用 BF16: * 需要对整数进行快速计算的场景 * 需要处理大量整数数据的场景 **总结** * BF16 比 FP16 在整数表示能力方面具有更广泛的范围,但尾数精度较低。 * FP16 的精度更高,但整数表示能力更有限。 * 在性能加速方面,BF16 通常比 FP16 更有效。 * 在 ARM 上,高端机支持 FP16 运算指令,但 BF16 运算指令只能在 V8.5 上支持。 * 这块性能和精度的具体值取决于具体架构和编译器的实现。

正文

https://zhuanlan.zhihu.com/p/449345588

 

BF16 是对FP32单精度浮点数截断数据,即用8bit 表示指数,7bit 表示小数。

FP16半精度浮点数,用5bit 表示指数,10bit 表示小数;

与32位相比,采用BF16/FP16吞吐量可以翻倍,内存需求可以减半。但是这两者精度上差异不一样,BF16 可表示的整数范围更广泛,但是尾数精度较小;FP16 表示整数范围较小,但是尾数精度较高。

那么,问题来了,两者性能加速比相似,但精度diff不一样,在哪些情况用BF16,哪些用FP16呢?

第二个问题:在ARM 上,高端机支持v8.2 指令集,提供FP16 运算指令;BF16 运算指令只能在V8.5 上支持,需要耐心等待。但现在开源框架上,有通过将FP32 数据截断方式,用int16 指令集代替BF16 计算,不知道这块性能和精度是怎样的,是否符合实际需求呢?

这些问题基于推理角度上,用FP16 和 BF16的差异

提前先感谢各位读者浏览该文章,希望大家给出自己的见解,一起相互学习

与[转帖]BF16 与 FP16 在模型上哪个精度更高呢相似的内容:

[转帖]BF16 与 FP16 在模型上哪个精度更高呢

https://zhuanlan.zhihu.com/p/449345588 BF16 是对FP32单精度浮点数截断数据,即用8bit 表示指数,7bit 表示小数。 FP16半精度浮点数,用5bit 表示指数,10bit 表示小数; 与32位相比,采用BF16/FP16吞吐量可以翻倍,内存需求可以

[转帖]

Linux ubuntu20.04 网络配置(图文教程) 因为我是刚装好的最小系统,所以很多东西都没有,在开始配置之前需要做下准备 环境准备 系统:ubuntu20.04网卡:双网卡 网卡一:供连接互联网使用网卡二:供连接内网使用(看情况,如果一张网卡足够,没必要做第二张网卡) 工具: net-to

[转帖]

https://cloud.tencent.com/developer/article/2168105?areaSource=104001.13&traceId=zcVNsKTUApF9rNJSkcCbB 前言 Redis作为高性能的内存数据库,在大数据量的情况下也会遇到性能瓶颈,日常开发中只有时刻

[转帖]ISV 、OSV、 SIG 概念

ISV 、OSV、 SIG 概念 2022-10-14 12:29530原创大杂烩 本文链接:https://www.cndba.cn/dave/article/108699 1. ISV: Independent Software Vendors “独立软件开发商”,特指专门从事软件的开发、生产、

[转帖]Redis 7 参数 修改 说明

2022-06-16 14:491800原创Redis 本文链接:https://www.cndba.cn/dave/article/108066 在之前的博客我们介绍了Redis 7 的安装和配置,如下: Linux 7.8 平台 Redis 7 安装并配置开机自启动 操作手册https://ww

[转帖]HTTPS中间人攻击原理

https://www.zhihu.com/people/bei-ji-85/posts 背景 前一段时间,公司北京地区上线了一个HTTPS防火墙,用来监听HTTPS流量。防火墙上线之前,邮件通知给管理层,我从我老大那里听说这个事情的时候,说这个有风险,然后意外地发现,很多人原来都不知道HTTPS防

[转帖]关于字节序(大小端)的一点想法

https://www.zhihu.com/people/bei-ji-85/posts 今天在一个技术群里有人问起来了,当时有一些讨论(不完全都是我个人的观点),整理一下: 为什么网络字节序(多数情况下)是大端? 早年设备的缓存很小,先接收高字节能快速的判断报文信息:包长度(需要准备多大缓存)、地

[转帖]awk提取某一行某一列的数据

https://www.jianshu.com/p/dbcb7fe2da56 1、提取文件中第1列数据 awk '{print $1}' filename > out.txt 2、提取前2列的文件 awk `{print $1,$2}' filename > out.txt 3、打印完第一列,然后打

[转帖]awk 中 FS的用法

https://www.cnblogs.com/rohens-hbg/p/5510890.html 在openwrt文件 ar71xx.sh中 查询设备类型时,有这么一句, machine=$(awk 'BEGIN{FS="[ \t]+:[ \t]"} /machine/ {print $2}' /

[转帖]Windows Server 2022 简体中文版、英文版下载 (updated Oct 2022)

https://sysin.org/blog/windows-server-2022/ Windows Server 2022 正式版,2022 年 10 月更新,VLSC Posted by sysin on 2022-10-27 Estimated Reading Time 8 Minutes