Ollama
Ollama 是一款用于在本地运行大语言模型(LLM)的轻量级工具,定位类似“本地版推理引擎”。它支持在个人电脑上快速部署和管理模型,如 LLaMA、Mistral 等,无需依赖云服务即可完成推理任务。
其核心特点包括:一是通过简单命令(如 ollama run)即可拉取并运行模型,降低使用门槛;二是支持模型版本管理和自定义 Modelfile,便于构建私有模型;三是提供本地 API 服务,可与后端系统(如 Java/Spring Boot)集成;四是数据完全本地化,适用于对隐私和数据安全要求较高的场景。
总体来看,Ollama 更偏向工程化落地,适合开发者在本地进行 AI 能力集成与测试。