Hugging Face ZeroGPU 计划正式发布—提供价值一千万美元的免费共享 GPU

hugging,face,zerogpu,gpu · 浏览次数 : 0

小编点评

**ZeroGPU** 是 Hugging Face Spaces 平台的一种新型硬件集成,提供免费 GPU 访问,以推动人工智能创新。 **Key Features:** * 为 Spaces 应用提供免费 GPU 访问 * 支持多个 GPU 并提高性能和效率 * 动态系统,根据需求分配 GPU * 采用强大的 Nvidia A100 GPU,每个设备提供 40GB 的显存 * 与大多数基于 PyTorch 的 GPU Spaces 兼容,特别是 Hugging Face 库如 transformers 或 diffusers **Usage:** 1. 创建 Space 项目 2. 选择 Gradio SDK 3. 选择 Zero NVIDIA A100 GPU 4. 在 Space 中设置 GPU 支持函数 **Benefits:** * 可访问性更普遍,更多开发者可以参与人工智能研究 * 性能和效率提升 * 优化资源使用 **Community Support:** * Hugging Face 鼓励用户提供反馈 * 可托管自己的 ZeroGPU Spaces

正文

在人工智能技术领域,GPU 资源一直是推动研究和应用的关键因素。然而,GPU 的成本和可用性对于许多研究人员和开发者来说却是一个显著的障碍。

在 Hugging Face,我们希望人工智能技术可以更加普惠化,更多开发者可以参与其中共同探索,在人工智能技术浪潮中创造出让更多人受益的产品。

为此,我们计划提供 1000 万美元的免费共享 GPU,借以推动下一波的人工智能创新。

什么是 ZeroGPU?

ZeroGPU 是 Hugging Face 的 Spaces 平台的一种新型硬件集成,设计有两个主要目标:

  1. 为 Spaces 应用提供免费的 GPU 访问;
  2. 允许 Space 应用在多个 GPU 上运行,提高性能和效率。

通过一个动态系统实现,Space 应用可以根据需要高效地持有和释放 GPU,而不受限于单个 GPU。ZeroGPU 采用强大的 Nvidia A100 GPU,每个设备提供 40GB 的显存,确保复杂工作负载的高性能。

兼容性和使用

ZeroGPU Spaces 旨在与大多数基于 PyTorch 的 GPU Spaces 兼容,尤其是 Hugging Face 库如 transformers 或 diffusers。然而,由于其使用较新的架构,ZeroGPU Spaces 可能比传统的 GPU Spaces 遇到更多的错误。目前,ZeroGPU 仅兼容 Gradio SDK,并推荐使用以下版本以确保最佳性能:

  • Gradio: v4+ 版本
  • PyTorch: 2.0.0 至 2.2.0 版本
  • Python: 3.10.13

要集成 ZeroGPU,需要在要使用 ZeroGPU 处理的 Python 函数前使用 @spaces.GPU 这个 decorator (装饰器) 。

这个装饰器确保函数执行期间分配 GPU,并在执行完毕后立即释放。以下是如何在 Space 中设置 GPU 支持函数的示例:

import spaces
from diffusers import DiffusionPipeline

pipe = DiffusionPipeline.from_pretrained(...)
pipe.to('cuda')

@spaces.GPU
def generate(prompt):
    return pipe(prompt).images

gr.Interface(
    fn=generate,
    inputs=gr.Text(),
    outputs=gr.Gallery(),
).launch()

这种设置不仅优化了资源使用,还简化了 AI 模型的部署。

增强的可访问性

ZeroGPU 对所有用户开放,PRO 用户还可以托管自己的 ZeroGPU Spaces。为了帮助开发过程,Hugging Face 鼓励用户通过社区标签提供反馈,并探索已经可用的 ZeroGPU Spaces列表。

对于需要较长执行时间的函数,开发者可以在 @spaces.GPU 装饰器中指定持续时间参数,将GPU分配时间延长到最多 120 秒,以适应更密集的计算需求。

开始使用

注册用户可以在 Spaces 页面选择创建 Space,选择使用 Gradio SDK,Space Hardware 选择 Zero NVIDIA A100 即可。

期待反馈

我们希望开发者们可以将这个消息分享给身边的朋友,如果有任何反馈,请随时在文章里留言让我们知道!

与Hugging Face ZeroGPU 计划正式发布—提供价值一千万美元的免费共享 GPU相似的内容:

Hugging Face ZeroGPU 计划正式发布—提供价值一千万美元的免费共享 GPU

在人工智能技术领域,GPU 资源一直是推动研究和应用的关键因素。然而,GPU 的成本和可用性对于许多研究人员和开发者来说却是一个显著的障碍。 在 Hugging Face,我们希望人工智能技术可以更加普惠化,更多开发者可以参与其中共同探索,在人工智能技术浪潮中创造出让更多人受益的产品。 为此,我们计

使用 Hugging Face 推理终端搭建强大的“语音识别 + 说话人分割 + 投机解码”工作流

Whisper 是当前最先进的开源语音识别模型之一,毫无疑问,也是应用最广泛的模型。如果你想部署 Whisper 模型,Hugging Face 推理终端 能够让你开箱即用地轻松部署任何 Whisper 模型。但是,如果你还想叠加其它功能,如用于分辨不同说话人的说话人分割,或用于投机解码的辅助生成,

Hugging Face 全球政策负责人首次参加WAIC 2024 前沿 AI 安全和治理论坛

Hugging Face 全球政策负责人艾琳-索莱曼 ( Irene Solaiman )将参加7月5日在上海举办的WAIC-前沿人工智能安全和治理论坛,并在现场进行主旨演讲和参加圆桌讨论。具体时间信息如下: 主旨演讲:开源治理的国际影响 时间 | 7月5日下午15:35 - 15:50 圆桌讨论:

Hugging Face Accelerate 两个后端的故事:FSDP 与 DeepSpeed

社区中有两个流行的 零冗余优化器(Zero Redundancy Optimizer,ZeRO) 算法实现,一个来自 DeepSpeed,另一个来自 PyTorch。Hugging Face Accelerate 对这两者都进行了集成并通过接口暴露出来,以供最终用户在训练/微调模型时自主选择其中之一

Hugging Face x LangChain: 全新 LangChain 合作伙伴包

我们很高兴官宣发布 langchain_huggingface ,这是一个由 Hugging Face 和 LangChain 共同维护的 LangChain 合作伙伴包。这个新的 Python 包旨在将 Hugging Face 最新功能引入 LangChain 并保持同步。 源自社区,服务社区

Hugging Face 与 Wiz Research 合作提高人工智能安全性

我们很高兴地宣布,我们正在与 Wiz 合作,目标是提高我们平台和整个 AI/ML 生态系统的安全性。 Wiz 研究人员 与 Hugging Face 就我们平台的安全性进行合作并分享了他们的发现。 Wiz 是一家云安全公司,帮助客户以安全的方式构建和维护软件。 随着这项研究的发布,我们将借此机会重点

Ryght 在 Hugging Face 专家助力下赋能医疗保健和生命科学之旅

本文是 Ryght 团队的客座博文。 Ryght 是何方神圣? Ryght 的使命是构建一个专为医疗保健和生命科学领域量身定制的企业级生成式人工智能平台。最近,公司正式公开了 Ryght 预览版 平台。 当前,生命科学公司不断地从各种不同来源 (实验室数据、电子病历、基因组学、保险索赔、药学、临床等

聊聊Hugging Face

## 概述 HuggingFace是一个开源社区,提供了开源的AI研发框架、工具集、可在线加载的数据集仓库和预训练模型仓库。HuggingFace提出了一套可以依照的标准研发流程,按照该框架实施工程,能够在一定程度上规避开发混乱、开发人员水平不一致的问题,降低了项目实施的风险及项目和研发人员的耦合度

Google 发布最新开放大语言模型 Gemma 2,现已登陆 Hugging Face Hub

Google 发布了最新的开放大语言模型 Gemma 2,我们非常高兴与 Google 合作,确保其在 Hugging Face 生态系统中的最佳集成。你可以在 Hub 上找到 4 个开源模型(2 个基础模型和 2 个微调模型)。发布的功能和集成包括: Hub 上的模型 Hugging Face T

用 KV 缓存量化解锁长文本生成

很高兴和大家分享 Hugging Face 的一项新功能: KV 缓存量化 ,它能够把你的语言模型的速度提升到一个新水平。 太长不看版: KV 缓存量化可在最小化对生成质量的影响的条件下,减少 LLM 在长文本生成场景下的内存使用量,从而在内存效率和生成速度之间提供可定制的权衡。 你是否曾尝试过用语