教程

发布日期: 2025-06-26

更新日期: 2026-04-19

文章字数: 1.2k

阅读时长: 4 分

阅读次数:

最新 Arc A770 Ollama WebUI 部署教程（Vulkan 原生加速版）

在 Windows 上利用 Arc A770 16G 运行 Ollama 大语言模型的极简终极指南。

第一部分：简介 - 告别繁琐，拥抱原生支持

英特尔锐炫 Arc A770 16G 显卡凭借其 16GB 的海量显存，一直是本地运行大语言模型（LLM）的极佳性价比选择。

过去，为了让标准版 Ollama 能够调用英特尔 GPU，用户不得不下载专用的“英特尔 IPEX-LLM”优化版并配置复杂的依赖环境。那种方法不仅安装极其繁琐，而且遇到问题难以排查，软件更新也严重滞后于 Ollama 官方。

好消息是，这一切都成为了历史。 从 0.12.11 版本开始，Ollama 官方已经通过 Vulkan 原生支持了 Intel GPUs。这意味着我们现在可以直接使用官方标准版 Ollama，仅需通过环境变量的方式进行简单配置，就能完美激活 Arc A770 强大的算力。

本指南将带您使用最简化的现代流程完成所有部署。

第二部分：基础设置 - 系统环境准备

2.1. 更新英特尔 Arc 显卡驱动

虽然 Ollama 已经原生支持，但底层依然依赖于良好的图形驱动。

访问英特尔官方下载中心。
下载适用于 Arc A770 的最新 WHQL 认证驱动程序。
建议在安装时选择“清洁安装”，以避免旧驱动残留导致蓝屏或不稳定。

2.2. 安装官方标准版 Ollama

如果您电脑上还有之前安装的“英特尔特供版/便携版”Ollama，请先将其彻底删除。

访问官网下载最新版的 Windows 安装程序：https://ollama.com/download
直接双击安装即可。 *(注：您也可以使用 Scoop 等包管理器进行安装管理，例如安装 v0.17.5 等最新版本)*。

第三部分：核心引擎 - 一键开启 GPU 加速

这是整个教程中最关键的一步。默认情况下，部分设备可能仍会优先调用 CPU 或无法正确分配 GPU 资源。我们需要强制 Ollama 使用 Vulkan 后端。

3.1. 配置 Vulkan 环境变量

我们需要在系统中增加一个全局环境变量，以显式开启对英特尔显卡的支持。

按下 Win + S 打开 Windows 搜索，输入“环境变量”，选择“编辑系统环境变量”。
在弹出的“系统属性”窗口中，点击右下角的“环境变量…”按钮。
在弹出的窗口中，找到“系统变量”或“用户变量”区域，点击“新建”。
变量名：填写 OLLAMA_VULKAN
变量值：填写 1
点击“确定”保存所有设置。

3.2. 重启并验证 Ollama

配置完环境变量后，请务必执行以下操作：

彻底关闭所有终端窗口以及系统托盘中正在运行的 Ollama 图标。
重启启动终端（Windows Terminal 或 PowerShell）。
运行以下命令确保服务器启动：

PowerShell
```
ollama serve
```

配置正确后，Ollama 在启动或拉取模型推理时，便会开始使用显卡。

第四部分：前端界面搭建 - 安装 Open WebUI

Ollama 本身只提供命令行交互，为了获得类似 ChatGPT 的使用体验，我们需要安装 Open WebUI。

4.1. 准备 Python 环境

强烈建议将前端运行在独立的 Python 虚拟环境中（您可以继续使用原来的 Miniforge/Conda 或原生的 Python venv）。

使用 Conda 的示例：

PowerShell

conda create -n open-webui python=3.11 -y
conda activate open-webui

4.2. 安装并启动 WebUI

在激活的虚拟环境中，执行：

PowerShell

pip install open-webui

安装完成后，启动前端服务：

PowerShell

open-webui serve

启动后，浏览器会自动打开 http://localhost:8080。首次使用请注册一个管理员账号，它会自动连接到在 11434 端口运行的 Ollama。

第五部分：验证与性能测试

现在，让我们见证奇迹的时刻。

打开浏览器访问 http://localhost:8080。
在顶部选择框中输入想要下载的模型，例如 deepseek-r1:14b（Arc A770 16G 跑 14B 模型非常轻松）。
模型下载完成后，向大模型发送一条问题。
打开 Windows 任务管理器 (Ctrl+Shift+Esc)。
切换到“性能”选项卡，点击你的 Intel Arc GPU。

观察结果：

在没有配置 OLLAMA_VULKAN=1 之前，加载大模型后，任务管理器中的 GPU 使用率可能仅显示为 7% 左右（基本可忽略不计，实际算力仍为 CPU）。
配置完毕后，当模型正在生成回答时，您在任务管理器可以看到 GPU 使用率暴增，且模型的专用显存（VRAM）占用会大幅度上升。

0xdadream

https://0xdadream.github.io/2025/06/26/arc-a770-ollama-webui-jiao-cheng/

本博客所有文章除特別声明外，均采用 CC BY 4.0 许可协议。转载请注明来源 0xdadream !

在WSL中将python3命令别名为python

2025-06-26 教程

python

代理加速游戏教程

2025-06-21 教程

net

Arc A770 Ollama WebUI 教程

最新 Arc A770 Ollama WebUI 部署教程（Vulkan 原生加速版）

第一部分：简介 - 告别繁琐，拥抱原生支持

第二部分：基础设置 - 系统环境准备

2.1. 更新英特尔 Arc 显卡驱动

2.2. 安装官方标准版 Ollama

第三部分：核心引擎 - 一键开启 GPU 加速

3.1. 配置 Vulkan 环境变量

3.2. 重启并验证 Ollama

第四部分：前端界面搭建 - 安装 Open WebUI

4.1. 准备 Python 环境

4.2. 安装并启动 WebUI

第五部分：验证与性能测试

你的赏识是我前进的动力