鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

视频课免费课排行榜短视频直播课软考学堂

全部课程软考华为认证厂商认证 IT技术 PMP项目管理免费题库

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

AI.x社区

登录/注册
51CTO

中国优质的IT技术网站

51CTO博客

专业IT技术创作平台

51CTO学堂

IT职业在线教育平台

Ollama，本地运行大模型最强工具，轻松上手

发布于 2024-9-27 13:51

浏览

0收藏

1 Ollama

Ollama是一个开源平台，帮助开发者便捷地在本地计算机上设置和运行大型语言模型（LLM）。这个平台简化了下载、安装和使用LLM的流程。

想要开始使用Ollama，首先需要下载它。你可以点击这里进行下载Ollama

下载完成后，打开终端，输入以下命令来运行模型phi3：

ollama run phi31.

或者，这样，模型phi3的各个层就会被下载到你的电脑上。如果你想先下载模型再运行，可以使用：

ollama pull phi3
ollama run phi31.
2.

这样，模型phi3的各个层就会被下载到你的电脑上。

Ollama还提供了REPL（读取-求值-打印循环）环境，这是一个交互式的编程界面，可以在这里输入代码，立即看到执行结果，并继续输入新的代码。

Ollama，本地运行大模型最强工具，轻松上手-AI.x社区

下载模型后，Ollama的REPL就会等待你的指令。

Ollama，本地运行大模型最强工具，轻松上手-AI.x社区

如果想查看所有可用的命令，可以在REPL中输入/?。

Ollama，本地运行大模型最强工具，轻松上手-AI.x社区

要退出REPL，只需输入/bye。

/? shortcuts获取快捷方式列表。

Ollama，本地运行大模型最强工具，轻松上手-AI.x社区

此外，ollama ls命令可以列出你已经下载的所有模型。

Ollama，本地运行大模型最强工具，轻松上手-AI.x社区

如果想要删除某个模型，可以使用ollama rm <modelname>命令。

Ollama，本地运行大模型最强工具，轻松上手-AI.x社区

可以通过这个链接（https://ollama.com/library）查看Ollama提供的所有模型，并了解其详细信息，比如模型的大小和参数。

运行不同大小的模型需要不同量的内存：7B模型至少需要8 GB RAM，13B模型需要16 GB，而33B模型则需要32 GB。Ollama支持GPU加速，如果你没有GPU，Ollama也可以在CPU上运行，只是速度会慢一些。

Ollama，本地运行大模型最强工具，轻松上手-AI.x社区

模型列表

你还可以在Ollama中设置新的系统提示。例如，运行ollama run llama3后，使用/set system命令可以向系统发出指令，比如让系统像对小学生解释概念一样来解释术语。设置完成后，使用/save forstudent保存设置，然后输入/bye退出REPL。之后，你可以通过/ollama run forstudent来运行刚才保存的设置。

以上就是使用Ollama的基本步骤和一些实用命令。如果你想了解更多，可以访问Ollama的官方文档。

Ollama，本地运行大模型最强工具，轻松上手-AI.x社区

2 LangChain

我们可以使用LangChain与Ollama交互。

`ollama pull llama3`1.

`pip install langchain langchain-ollama ollama`1.

from langchain_ollama import OllamaLLM

model = OllamaLLM(model="llama3")

response = model.invoke(input="What's up?")

print(response)

Not much! Just an AI, waiting to chat with you. How about you? What's new and exciting in your world?1.
2.
3.
4.
5.
6.
7.
8.
9.

让我们构建一个简单的对话：

from langchain_ollama import OllamaLLM
from langchain_core.prompts import ChatPromptTemplate

template = """
User will ask you questions. Answer it.

The history of this conversation: {context}

Question: {question}

Answer: 
"""

model = OllamaLLM(model="llama3")
prompt = ChatPromptTemplate.from_template(template)
chain = prompt | model

def chat():
    context = ""
    print("Welcome to the AI Chatbot! Type 'exit' to quit.")
    while True:
        question = input("You: ")
        if question.lower() == "exit":
            break
        response = chain.invoke({"context":context, "question": question})
        print(f"AI: {response}")
        context += f"\nYou: {question}\nAI: {response}"

chat()

Welcome to the AI Chatbot! Type 'exit' to quit.
me -> What's up?
AI: Not much, just getting started on my day. How about you?
me -> Who are you?
AI: My name is Human, nice to meet you!
me -> I'm Okan.
AI: Nice to meet you too, Okan!
me -> What's my name?
AI: Okan!
me -> exit1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.

3 AnythingLLM

AnythingLLM是一个全能的AI智能体和RAG工具，运行在本地计算机上。

ollama pull llama3:8b-instruct-q8_01.

Ollama，本地运行大模型最强工具，轻松上手-AI.x社区

在 AnythingLLM 偏好设置屏幕中选择 Ollama。

Ollama，本地运行大模型最强工具，轻松上手-AI.x社区

为工作区命名

让我们试试这个模型：

Ollama，本地运行大模型最强工具，轻松上手-AI.x社区

4 打开WebUI

可以通过按照这里安装说明进行安装。

Ollama，本地运行大模型最强工具，轻松上手-AI.x社区

本文转载自 AI科技论谈，作者： AI科技论谈

标签

赞

收藏

回复

举报

回复

相关推荐

轻松上手的LangChain学习说明书

381972426 • 4344浏览 • 0回复
当下最容易上手的大模型微调工具是谁？LLamaFactory或是其中之一

Syrupup • 1.2w浏览 • 0回复
五个简单好用的本地运行大模型的方法

51CTO技术栈 • 5070浏览 • 0回复
你想在本地部署大模型吗？本地部署大模型的三种工具

AI探索时代 • 4540浏览 • 0回复
国内八大AI模型无障碍使用，教你如何轻松上手

ermulong • 2348浏览 • 0回复
GraphRAG + Ollama 本地部署全攻略：避坑实战指南

玄姐聊AGI • 9151浏览 • 0回复
利用LlamaIndex和本地PDF文档，轻松打造知识图谱GraphRAG

小虎哦哦 • 3406浏览 • 0回复
基于Llama 3、Ollama、Milvus、LangChain，快速搭建本地RAG

小虎哦哦 • 4211浏览 • 0回复
GraphRAG + Ollama 本地部署全攻略：避坑实战指南

玄姐聊AGI • 5970浏览 • 0回复
颠覆传统OCR轻松搞定复杂PDF的工具

恰似惊鸿 • 3095浏览 • 0回复
如何借助Cortex运行本地LLM

51CTO内容精选 • 1639浏览 • 0回复
使用Llama 3.2-Vision大模型，搭建本地Ollama OCR应用

AI科技论谈 • 6876浏览 • 0回复
大模型压缩后可在24GB显存GPU上本地运行！！

老蛀虫 • 2271浏览 • 0回复
如何在安卓手机上本地安装和运行LLM?

51CTO内容精选 • 7004浏览 • 0回复
CAG 通过键值缓存让 RAG 轻松上手

凝固的雨_1 • 2448浏览 • 0回复
Deepseek AI模型本地部署步骤简记：ollama + deepseek-r1 + 本地AI模型的Web UI

lintoms • 2229浏览 • 0回复
Deepseek AI模型本地部署步骤简记：ollama + deepseek-r1 + 本地AI模型的Web UI

parson2000 • 1466浏览 • 0回复
基于浏览器运行的 Ollama WEB客户端开源发布

V0ne • 1329浏览 • 0回复
AI大模型本地化方案：Xinference 本地运行大模型

风云2002_1 • 1584浏览 • 0回复

穿越时空111

LV.3

这个用户很懒，还没有个人简介

觉得TA不错？点个关注精彩不错过

28

帖子

280

声望

1

粉丝

关注

最近发布

只需5分钟，教你用Python搭建MCP Server 7天前发布
免费使用DeepSeek-V3–0324大模型，Cursor编程更上一层楼 2025-03-28 00:02:26发布

热门推荐

只需5分钟，教你用Python搭建MCP Server 0回复

王炸！MCP 架构设计深度剖析 & 使用 Spring AI + MCP 四步教你实现 Agent 智能体开发 0回复

实操干货！MCP 全解析，手把手教你基于 MCP 开发 Agent 0回复

Dify从入门到高阶系列二：手把手教学！超详细的Dify知识库配置全攻略 0回复

从 Manus 到 DeepSearcher，2025年最值得关注的十大 Agent 智能体架构设计 0回复

上一篇：轻松解析本地PDF表格，基于LlamaIndex和UnstructuredIO打造RAG

下一篇：优化文本嵌入，大幅提升RAG检索速度

社区精华内容

目录

1 Ollama
2 LangChain
3 AnythingLLM
4 打开WebUI

Copyright © 2005-2025 51CTO.COM 京ICP证060544版权所有未经许可请勿转载