与#chinese#相关的内容 - PmDaddy

全部分类数据库前端云计算

[转帖][github]Chinese-LLaMA-Alpaca Public

`https://github.com/ymcui/Chinese-LLaMA-Alpaca#%E6%A8%A1%E5%9E%8B%E4%B8%8B%E8%BD%BD` 以ChatGPT、GPT-4等为代表的大语言模型（Large Language Model, LLM）掀起了新一轮自然语言处理领域

Llama2-Chinese项目：1-项目介绍和模型推理

Atom-7B与Llama2间的关系：Atom-7B是基于Llama2进行中文预训练的开源大模型。为什么叫原子呢？因为原子生万物，Llama中文社区希望原子大模型未来可以成为构建AI世界的基础单位。目前社区发布了6个模型，如下所示： FlagAlpha/Atom-7BFlagAlpha/Llama2

Llama2-Chinese项目：2.1-Atom-7B预训练

虽然Llama2的预训练数据相对于第一代LLaMA扩大了一倍，但是中文预训练数据的比例依然非常少，仅占0.13%，这也导致了原始Llama2的中文能力较弱。为了能够提升模型的中文能力，可以采用微调和预训练两种路径，其中：微调需要的算力资源少，能够快速实现一个中文Llama的雏形。但缺点也显而易见，

Llama2-Chinese项目：2.2-大语言模型词表扩充

因为原生LLaMA对中文的支持很弱，一个中文汉子往往被切分成多个token，因此需要对其进行中文词表扩展。思路通常是在中文语料库上训练一个中文tokenizer模型，然后将中文tokenizer与LLaMA原生tokenizer进行合并，最终得到一个扩展后的tokenizer模型。国内Chinese

Llama2-Chinese项目：2.3-预训练使用QA还是Text数据集？

Llama2-Chinese项目给出pretrain的data为QA数据格式，可能会有疑问pretrain不应该是Text数据格式吗？而在Chinese-LLaMA-Alpaca-2和open-llama2预训练使用的LoRA技术，给出pretrain的data为Text数据格式。所以推测应该pre

Llama2-Chinese项目：5-推理加速

随着大模型参数规模的不断增长，在有限的算力资源下，提升模型的推理速度逐渐变为一个重要的研究方向。常用的推理加速框架包含lmdeploy、FasterTransformer和vLLM等。一.lmdeploy推理部署 lmdeploy由上海人工智能实验室开发，推理使用C++/CUDA，对外提供pyth

Llama2-Chinese项目：6-模型评测

测试问题筛选自AtomBulb[1]，共95个测试问题，包含：通用知识、语言理解、创作能力、逻辑推理、代码编程、工作技能、使用工具、人格特征八个大的类别。 1.测试中的Prompt 例如对于问题"列出5种可以改善睡眠质量的方法"，如下所示： [INST] <>You are a helpf

Llama2-Chinese项目：7-外延能力LangChain集成

本文介绍了Llama2模型集成LangChain框架的具体实现，这样可更方便地基于Llama2开发文档检索、问答机器人和智能体应用等。 1.调用Llama2类针对LangChain[1]框架封装的Llama2 LLM类见examples/llama2_for_langchain.py，调用代码如下

Llama2-Chinese项目：8-TRL资料整理

TRL（Transformer Reinforcement Learning）是一个使用强化学习来训练Transformer语言模型和Stable Diffusion模型的Python类库工具集，听上去很抽象，但如果说主要是做SFT（Supervised Fine-tuning）、RM（Reward

Llama2-Chinese项目：4-量化模型

一.量化模型调用方式下面是一个调用FlagAlpha/Llama2-Chinese-13b-Chat[1]的4bit压缩版本FlagAlpha/Llama2-Chinese-13b-Chat-4bit[2]的例子： from transformers import AutoTokenizerfro

Llama2-Chinese项目：3.2-LoRA微调和模型量化

提供LoRA微调和全量参数微调代码，训练数据为data/train_sft.csv，验证数据为data/dev_sft.csv，数据格式为"Human: "+问题+"\nAssistant: "+答案。本文主要介绍Llama-2-7b模型LoRA微调以及4bit量化的实践过程。

Llama2-Chinese项目：3.1-全量参数微调

提供LoRA微调和全量参数微调代码，训练数据为data/train_sft.csv，验证数据为data/dev_sft.csv，数据格式如下所示： "Human: "+问题+"\nAssistant: "+答案举个例子，如下所示： Human: 用一句话描述地球为什么是独

[转帖]使用Transformers推理

https://github.com/ymcui/Chinese-LLaMA-Alpaca/wiki/%E4%BD%BF%E7%94%A8Transformers%E6%8E%A8%E7%90%86 Pages 32 中文文档模型合并与转换在线模型合并与转换（Colab）手动模型合并与转换模

Jenkins + SVN

安装插件 Localization: Chinese (Simplified) Subversion 配置国内源 http://mirror.tuna.tsinghua.edu.cn/jenkins/updates/update-center.json 全局工具配置 Maven 配置 JDK 配置

vue上通过krpano.js实现360全景图

首先贴出一些XML对应的函数，文件内容都有注释说明，前端代码读取xml文件代码 // 初始化 window.embedpano({ xml: 0, target: 'pano', html5: 'only', mobilescale: 1.0, passQueryParameters: 'star

【c#版本Openfeign】Net8 自带OpenFeign实现远程接口调用

引言相信巨硬，我们便一直硬。Net版本到现在已经出了7了，8也已经在预览版了，相信在一个半月就会正式发布，其中也有很多拭目以待的新功能了，不仅仅有Apm和Tap的结合，TaskToAscynResult，以及UnsafeAccessor用来获取私有变量，性能比反射,EMIT更高，还有针对Async

【源码解读(一)】EFCORE源码解读之创建DBContext查询拦截

引言在网上很少看到有关于系统讲解EFCore源码的，可能大概也许是因为EFCore的源码总体是没有asp.net web的源码流程清晰，正如群友所说，EFCore的源码大致看起来有点凌乱，与其说凌乱，不如说是没有一个好的方向；然后昨天在群里有一个朋友再说，EfCore的拦截器如何注入Web的服务，

【单片机入门】(二)应用层软件开发的单片机学习之路-----点灯大师

引言在上一博客中，我们正式开始了单片机的学习之路，讲了单片机的概念，以及我们使用的ESP32系列的单片机的IO引脚，讲了什么是GPIO，以及相关的总线通讯概念（UART,IIC,SPI），脉冲调制概念(PWM),以及信号数字互转的(ADC和DAC),板子自带的一些功能，在今天的博客中，我会带你们正

【单片机入门】(三)应用层软件开发的单片机学习之路-----UART串口通讯和c#交互

引言在第一章博客中，我们讲了Arduino对Esp32的一个环境配置，以及了解到了常用的一个总线通讯协议，其中有SPI,IIC,UART等，今天我为大家带来UART串口通讯和c#串口进行通讯的一个案例，以及什么是中断，中断的作用和实践，话不多说，让我们正式开始。 UART 在第一篇博客中，我们讲了

【单片机入门】(四)应用层软件开发的单片机学习之路-----ESP32开发板PWM控制电机以及中断的使用

引言各位大佬，晚上好啊，在上一篇博客中，我们讲了什么是UART串口通讯，以及使用USB转TTL使得单片机可以和c#上位机做一个串口通讯，接下来，为大家带来PWM的概念原理，以及实际案例，使用PWM对电机进行速度调制，因为本课程的最后是做一个红外遥控的智能小车，所以是需要电机四个，驱动四个，轮胎四个

首页
上一页
1
2
下一页
尾页

# 热门排行

微软 New Bing AI 申请与使用保姆级教程（免魔法） ChatGPT API使用介绍 ChatGPT开发实战一篇带你了解如何使用纯前端类Excel表格构建现金流量表手把手教你玩转 Excel 数据透视表为什么 C# 可能是最好的第一编程语言 .NET 入门到高级路线提高工作效率的神器：基于前端表格实现Chrome Excel扩展插件 React + Springboot + Quartz，从0实现Excel报表自动化用Echarts实现前端表格引用从属关系可视化