目录

在本地部署-DeepSeek-R1-模型,包含电脑和手机,附带硬件和模型版本

在本地部署 DeepSeek-R1 模型,包含电脑和手机,附带硬件和模型版本

本文将引导您完成在本地机器上设置和运行 DeepSeek-R1 模型的全过程,涵盖硬件要求、必要工具的安装以及客户端的使用。

DeepSeek 的 R1 模型因其先进的功能和成本效益而备受关注。在本地运行此模型将是有益的体验,能够深入了解最先进的 AI 技术。

1、DeepSeek-R1 模型各个版本说明和硬件需求

DeepSeek-R1 提供多种版本,每个版本都有特定的硬件要求,下面分别列出:

全参数的模型

这是 R1 的原始版本,包含大量的参数,精度高,但需要大量计算资源;

https://i-blog.csdnimg.cn/img_convert/6518575a3a8e956e813bfba0019a4a16.png

参数为 671B,需要显存为 1342GB。

两个模型都要求使用多 GPU,比如 NVDIA-A100 80GB 显卡一共 16 张。

不支持单独的 Mac 电脑,但是支持 Mac 电脑集群。

https://i-blog.csdnimg.cn/img_convert/39a76422a2766956f4b5eabc9a39c532.png

https://i-blog.csdnimg.cn/img_convert/04ad39652afc7f231c5521637e275473.png

蒸馏模型

蒸馏模型是“老师教学生”,通过知识蒸馏,教小的模型学会复制较大模型的行为,扩充性能,减少资源需求。

https://i-blog.csdnimg.cn/img_convert/6eae8291bead02c783217c83794a10ef.png

可以看到蒸馏模型对显存的需求相比全参数模型来说可以忽略不计了。

其中 7B 和 8B 模型可以用于 32GB 的 Mac 算是性能和参数平衡后最佳选择。

Quantized Models (4-bit) 精度为 4bit 的模型

https://i-blog.csdnimg.cn/img_convert/8c06efa4a93db3935ba5ffff51cc29f9.png

在了解什么 Quantized Models 前,我们先了解以下几个关键点:

https://i-blog.csdnimg.cn/img_convert/c47f64aaa1f5a6ed148ec2ccbf638713.png

2、电脑安装推荐 Ollama:安装指南

Ollama 是一款流行的在本地运行大模型的工具。

https://i-blog.csdnimg.cn/img_convert/0e24f93f5a8f9aebd3cf0cb6c78fcd44.png

现在不论是 macOS 还是 Windows 都可以直接下载客户端安装。

注意:安装 Ollama 后,操作一般是在终端中操作。

https://i-blog.csdnimg.cn/img_convert/76f3c41d6eb4ea722c3fd26c06c8eb18.png

通过命令运行 Ollama,比如在 Ollama 官网搜索DeepSeek

https://i-blog.csdnimg.cn/img_convert/8a3483b1a0318282576d62091e67634d.png

https://i-blog.csdnimg.cn/img_convert/bdca660d520fd666fe9a98bae0677ea5.png

安装后,一般就会在本地的 11434 端口开启服务了。

你可以在终端实时体验,但是要获得像官网一样的体验,还是需要额外的套壳 UI 客户端

3、开源大模型 UI 客户端

关于套壳 UI 有很多可以选择,可以根据喜好自行选择。

我这里推荐两个。

一个是 Open WebUI

Open WebUI 可以使用 Docker 部署,简单方便。

https://i-blog.csdnimg.cn/img_convert/758379e587227f90cb8f2b4862824432.png

一个是 Chatbox

Chatbox可以使用各种模型的 api,也可以使用本地 Ollama 11434 端口的服务。

https://i-blog.csdnimg.cn/img_convert/7293ed231c0749c1e22c00cab8b3841a.png

4、安卓手机部署

手机目前的话推荐使用安卓部署本地模型。

推荐 MNN 框架。

https://i-blog.csdnimg.cn/img_convert/2152c876a45ca6cb4707f7f2aff17c59.png

可以直接下载目前打包好的 apk-MNN 大模型 Android App

https://i-blog.csdnimg.cn/img_convert/6d3a9d3cb48a721791b968fb165bebb3.png

下载安装后,可以在模型列表里下载 DeepSeek-R1-1.5B-Qwen-MNN

https://i-blog.csdnimg.cn/img_convert/9793e0a974599d4e9d5c6109ca21b8cc.jpeg

https://i-blog.csdnimg.cn/direct/0b5c5a12ffe7460e8f163ff3bf58ee58.jpeg#pic_center

如何学习AI大模型?

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

https://i-blog.csdnimg.cn/blog_migrate/26837cac94c3b677bad169b26a9e1e46.png

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

https://i-blog.csdnimg.cn/blog_migrate/542f58910ba9a5939dc266222e08e2ce.jpeg#pic_center

👉学会后的收获:👈

• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

https://i-blog.csdnimg.cn/blog_migrate/c400d99382638099028a1e0493884952.jpeg#pic_center

***1.AI大模型学习路线图

2.100套AI大模型商业化落地方案

3.100集大模型视频教程

4.200本大模型PDF书籍

5.LLM面试题合集

6.AI产品经理资源合集***

👉获取方式:

😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

https://i-blog.csdnimg.cn/blog_migrate/3c3a284aea75af128b0d778ce659e582.jpeg#pic_center