HuggingFace Model Cache
HuggingFace Model Cache (简称 “HFMC”) 是一款“小而美”的工具,旨在帮助用户更快、更容易地使用HuggingFace上的模型。HFMC 可以帮助用户完成下面的工作:
- 和其他 HFMC 节点之间共享模型文件,避免从 hf.co 原站重复下载同一个模型;
- 自动从局域网、镜像网站、hf 源站之间选择最佳下载方式;
- 实现模型下载的断点续传,减少由于网络不稳定而浪费的网络流量和宝贵时间;
- 快速查看、增、删本地模型文件,让模型管理变得更加容易;
HFMC 的功能
模型共享
在同一个局域网中,使用 HFMC 的两个节点之间可以通过局域网共享模型。比如节点 Pegasus 已经下载了 meta-llama-3.1-8B 模型,当节点 Cygnus 想要下载 meta-llama-3.1-8B 的时候,HFMC 会通过局域网从节点 Pegasus 下载模型,这比从 huggingface.co 下载更快速、更稳定、更便宜。
通过这种方式,同一个实验室或者办公室里的同事可以快速分享模型,用户还可以通过 HFMC 在一个GPU集群中快速分发模型。
多源下载
HFMC 整合了多个下载源为用户提供模型下载功能。具体说来,如果用户通过 HFMC 下载模型,HFMC 会依次尝试从局域网(来自其他 HFMC 的节点),hf 镜像网站(如 hf-mirror.com),和 hf 源站下载目标模型。
断点续传
相比通过浏览器手动下载 HuggingFace 上的模型,HFMC 提供了断点续传功能。HFMC 具备“跨源断点续传”功能,比如,在局域网上中断的下载可以无缝切换到镜像网站继续完成模型下载。
模型管理
HFMC 提供命令行工具帮助用户浏览、下载、删除本地的模型文件。模型文件的大小、数量、路径等信息可以通过一个命令一览无余。
安装 HFMC
HFMC 支持 3.8+ 版本的 Python,并可在 Windows,MacOS,Linux 上运行。
使用下面的命令即可以安装 HFMC.
pip install hfmc