Windows下Ollama优先使用GPU解决内存不足问题

学习笔记作者：admin日期：2025-06-10点击：179

摘要：本文介绍了如何在Windows系统下配置Ollama，使其优先使用NVIDIA显卡来解决内存不足的问题，并提供了详细的环境变量设置步骤。

Ollama优先使用GPU配置指南

在Windows操作系统中运行Ollama时，如果遇到内存不足的提示，可以通过调整环境变量来优先利用NVIDIA显卡的GPU资源。以下是具体步骤：

确保您的系统已安装最新版本的NVIDIA驱动程序。您可以访问NVIDIA官方网站下载并安装最新的驱动。

打开系统属性 -> 高级系统设置 -> 环境变量，在系统变量部分新建或修改以下变量：

例如，在命令行中可以执行以下命令：

setx TORCH_USE_CUDA 1
setx CUDA_VISIBLE_DEVICES 0

完成上述设置后，请重新启动Ollama服务以应用更改。

运行以下Python脚本验证CUDA是否可用：

import torch
print(torch.cuda.is_available())

如果输出为True，则表示Ollama成功使用了GPU。

通过正确配置环境变量，Ollama能够有效利用NVIDIA GPU的计算能力，避免内存不足的情况发生。