GLM-4-Flash宣布免费,Agentic RAG体验,让我觉着,真香! 精华

发布于 2024-8-28 15:12
浏览
0收藏

​一、RAG问答

将RAG过程应用于问答的一个代表性实例。主要由3个步骤组成。

  • 索引,文档被分割成块,编码成向量,并存储在向量数据库中。
  • 检索,根据语义相似性检索与问题最相关的前k个块。
  • 生成,将原始问题和检索到的块一起输入到大型语言模型(GLM-4-Flash)中,生成最终答案。

原生RAG问答流程(GLM-4-Flash)

GLM-4-Flash宣布免费,Agentic RAG体验,让我觉着,真香!-AI.x社区

从RAG问答常见的三种问答类型为例:

  • 事实类
  • 总结类
  • 拒绝回答

【案例说明】

多问题事实类型Query:  药明康德2022-2024年归母净利润预测分别是多少?

GLM-4-Flash回答:答案正确、溯源正确(来源于参考资料5)

根据已知信息,药明康德(603259)2022-2024年的净利润预测分别为:


- 2022年:80.29亿元
- 2023年:99.05亿元
- 2024年:127.56亿元


这些预测来源于参考材料[5]。

输入:

GLM-4-Flash宣布免费,Agentic RAG体验,让我觉着,真香!-AI.x社区

归纳总结类型Query: 三七互娱未来公司在海外市场的发展战略是什么?

GLM-4-Flash回答:回答全面且具有概括性

三七互娱未来公司在海外市场的发展战略包括以下几点:


1. **持续发行优质游戏**:三七互娱将继续推出更多自研和代理游戏,如《云上城之歌》、《斗罗大陆:魂师对决》、《叫我大掌柜》等,以提升海外市场的知名度和收入。


2. **突破增长**:公司致力于在MMO、SLG、卡牌以及模拟经营四大赛道中深耕,以实现品类创新和迭代。


3. **储备更多游戏**:三七互娱海外发行储备了16款游戏,包括自研和代理产品,预计这些产品将助力公司未来在海外市场的持续增长。


4. **元宇宙布局**:公司正积极布局元宇宙,通过投资元宇宙上下游优质标的,与相关企业合作,并上线全国首个元宇宙游戏艺术馆,探索数字藏品与元宇宙社交领域的创新玩法。


5. **区域拓展**:未来,三七互娱将继续在日本、韩国等地发行游戏,扩大其海外市场覆盖范围。


6. **技术创新**:在流量经营核心优势上加码自研,进行品类创新迭代,以适应海外市场变化。


总体来看,三七互娱在海外市场的发展战略是多元化游戏发行、深耕特定游戏品类、布局元宇宙、持续技术创新以及区域市场拓展。

输入:

GLM-4-Flash宣布免费,Agentic RAG体验,让我觉着,真香!-AI.x社区

归纳总结类型Query: 兴齐眼药在眼科医疗领域的竞争对手有哪些?

GLM-4-Flash回答:参考资料无答案,按着指令要求回答了“未知”

未知

输入:

GLM-4-Flash宣布免费,Agentic RAG体验,让我觉着,真香!-AI.x社区

GLM-4-Flash使用指南

pip install --upgrade zhipuai


from zhipuai import ZhipuAI
client = ZhipuAI(api_key="") # 填写您自己的APIKey
response = client.chat.completions.create(
    model="glm-4-flash",  # 填写需要调用的模型编码
    messages=[
        {"role": "user", "content": "作为一名营销专家,请为智谱开放平台创作一个吸引人的slogan"},
        {"role": "assistant", "content": "当然,为了创作一个吸引人的slogan,请告诉我一些关于您产品的信息"}
    ],
)
print(response.choices[0].message)

二、Agentic RAG

RAG问答还常常遇到一些多跳推理问题,例如Query=“与第五交响曲创作于同一世纪的交通工具是什么?”,大模型(GLM-4-Flash)需要分两个子问题来解决:

  • 第五交响曲是在哪个世纪创作的?
  • 19世纪发明的交通工具

GLM-4-Flash宣布免费,Agentic RAG体验,让我觉着,真香!-AI.x社区


【案例说明】

多跳推理Query:  与第五交响曲创作于同一世纪的交通工具是什么?

GLM-4-Flash回答:工具识别正确、且参数提取正确

第一轮回答:
Function(arguments='{"search_term": "第五交响曲创作年份"}', name='get_timeline_explorer')
tool_answer: 第五交响曲是由德国作曲家路德维希·范·贝多芬创作的,完成于1808年。


第二轮回答:
Function(arguments='{"time_period": "1808"}', name='transportation_evolution_archive')
tool_answer: 
19世纪初,以下是一些重要的交通工具发展:


1. 马车:虽然马车在19世纪初仍然普遍使用,但这一时期也见证了马车技术的改进,例如蒸汽动力马车的出现。


2. 蒸汽机车(蒸汽火车):1825年,乔治·斯蒂芬森设计的“旅行者号”蒸汽机车在斯托克顿和达灵顿铁路上进行了首次商业运行,标志着铁路运输时代的开始。


3. 蒸汽船:19世纪初,蒸汽船开始取代帆船,成为更高效的水上交通工具。例如,克莱门特·阿特金斯设计的“萨凡纳号”蒸汽船在1830年完成了从纽约到英国的航行。

输入:

tools = [
    {
        "type": "function",
        "function": {
            "name": "get_timeline_explorer",
            "description": "通过输入年份或世纪,用户可以获取该时期内的重大历史发展,包括科学、技术、艺术和社会变革等方面的信息",
            "parameters": {
                "type": "object",
                "properties": {
                    "search_term": {
                        "description": "用户输入的关键词,用于在历史时间线中搜索相关事件",
                        "type": "string"
                    }
                },
                "required": [ "search_term"]
            },
        }
    },
    {
        "type": "function",
        "function": {
            "name": "transportation_evolution_archive",
            "description": "交通工具发展数据库",
            "parameters": {
                "type": "object",
                "properties": {
                    "time_period": {
                        "description": "用户可以指定一个年份,以查找该时间内发展的交通工具",
                        "type": "string"
                    }
                },
                "required": [ "time_period"]
            },
        }
    },
]
messages = []
messages.append({"role": "user", "content": "以下对话优先使用工具"})
messages.append({"role": "user", "content": "与第五交响曲创作于同一世纪的交通工具是什么?"})
response = client.chat.completions.create(
    model="glm-4-flash",  # 填写需要调用的模型名称
    messages=messages,
    tools=tools,
)
print(response.choices[0].message)

三、问答生成微调

在大模型企业落地的时候经常会遇到有客户用RAG对一些客服场景的FAQ数据集进行问答,这里一个更好的选择是用大模型微调固定的QA对,刚好GLM-4-Flash也支持私域数据微调。​

GLM-4-Flash微调的4个主要步骤:


GLM-4-Flash宣布免费,Agentic RAG体验,让我觉着,真香!-AI.x社区

GLM-4-Flash训练完成:


GLM-4-Flash宣布免费,Agentic RAG体验,让我觉着,真香!-AI.x社区

GLM-4-Flash部署完成:

GLM-4-Flash宣布免费,Agentic RAG体验,让我觉着,真香!-AI.x社区

【案例说明】

微调后,GLM-4-Flash可以正确回答。

药明康德2022-2024年归母净利润预测分别是86.21亿元、94.29亿元、116.27亿元。

微调前,GLM-4-Flash因为训练数据时效性,是无法回答该问题的。​

本文转载自​PaperAgent​,作者: PaperAgent ​​

收藏
回复
举报
回复
相关推荐