Ollama

开源

开发者：Ollama

Ollama是一个开源工具，让你在本地电脑上轻松运行各种大语言模型。

AI编程 AI 内容生成 AI 开发者工具 AI 招聘工具 AI 角色 AI 音乐生成器大语言模型 (LLMs)

Ollama是一个开源的本地大语言模型运行工具，让你能在自己的电脑上轻松下载、运行和交互各种开源大模型，如Llama 3、Mistral等。它就像你的私人AI管家，把复杂的模型配置和硬件优化打包成简单的命令行操作，无需联网就能使用，彻底保护你的数据隐私，是开发者追求AI自主可控的绝佳利器。

只需一条命令，如`ollama run llama3`，就能自动下载并运行模型，省去繁琐的环境配置。它支持多种主流开源模型，让上手体验变得极其流畅。

Ollama在本地启动一个兼容OpenAI格式的API接口，你可以像调用ChatGPT一样，将自己开发的应用无缝连接到本地模型上，方便进行二次开发。

支持通过Modelfile文件自定义系统提示词、调整模型参数，并能对模型进行量化以降低资源消耗，让你在性能与效果之间找到最佳平衡点。

完美支持macOS、Linux和Windows系统，并能自动检测并利用NVIDIA、AMD GPU或Apple Silicon的算力进行加速，榨干你的硬件性能。

不仅能跑纯文本模型，还支持llava等视觉多模态模型，允许你在终端里直接分析图片内容，拓展了本地AI的应用边界。

Ollama是一个完全开源免费的工具，代码托管在GitHub上。你可以无限制地免费下载和使用其所有功能，只需承担自己电脑的电费和硬件成本。

离线代码助手：在没有网络的环境下，为开发者提供代码补全、解释和调试建议，保障核心项目代码的绝对隐私安全。

敏感文档分析：在本地处理公司机密合同、法律文书或医疗记录，利用AI进行摘要和关键信息提取，杜绝数据上传至第三方服务器。

低成本原型验证：创业团队或个人开发者可在本地快速搭建AI应用原型，测试模型效果，无需支付昂贵的API调用费用，降低试错成本。

个性化学习伴侣：学生或研究人员可以加载特定领域的微调模型，打造一个能解答专业问题、且不受审查限制的私人导师。

本地化智能家居大脑：将其集成到Home Assistant等系统中，作为纯本地的语音助手后端，控制智能设备时无需担心隐私泄露。

Ollama需要什么硬件配置？
最低8GB内存即可运行7B参数模型，推荐16GB以上内存。使用GPU加速效果更佳，但纯CPU也能跑，只是速度较慢。
Ollama支持哪些模型？
支持Llama 3、Mistral、Gemma、Phi-3、Qwen等几乎所有主流开源模型，你可以在其官网模型库中一键获取最新版本。
使用Ollama真的完全不需要联网吗？
下载模型时需要联网，但一旦下载完成，后续的运行和对话完全在本地进行，断网环境也能正常使用。
如何在我的应用中调用Ollama？
Ollama默认在本地11434端口提供HTTP API，兼容OpenAI格式，你可以直接用curl命令或任何编程语言的HTTP库进行调用。
Ollama和LM Studio有什么区别？
Ollama更偏向命令行和开发者工具，轻量且易于集成；LM Studio则提供更友好的图形界面，适合喜欢点击操作的用户。

学AI用AI，51智学网