Ollama

Ollama 是一款用于在本地运行大语言模型（LLM）的轻量级工具，定位类似“本地版推理引擎”。它支持在个人电脑上快速部署和管理模型，如 LLaMA、Mistral 等，无需依赖云服务即可完成推理任务。

其核心特点包括：一是通过简单命令（如 ollama run）即可拉取并运行模型，降低使用门槛；二是支持模型版本管理和自定义 Modelfile，便于构建私有模型；三是提供本地 API 服务，可与后端系统（如 Java/Spring Boot）集成；四是数据完全本地化，适用于对隐私和数据安全要求较高的场景。

总体来看，Ollama 更偏向工程化落地，适合开发者在本地进行 AI 能力集成与测试。