企业项目管理、ORK、研发管理与敏捷开发工具平台

网站首页 > 精选文章 正文

工程落地实践|基于 ChatGLM2-6B + LangChain 搭建专属知识库

wudianyun 2025-01-07 16:19:28 精选文章 32 ℃

经过前期的探索和准备,我们终于迈出了第一步:使用 ChatGPT 和 LangChain这些强大的工具,初步完成了专属知识库的搭建。


01


继昨天部署 ChatGLM2-6B 成功后,工程落地实践|国产大模型 ChatGLM2-6B 阿里云上部署成功,今天继续向“专属知识库”的目标前进。


在成功部署 ChatGPT 模型的基础上,用咱们国产的大模型 ChatGLM ,以及 LangChain 开源框架搭建“个人专属知识库”。


LangChain:是现在最流行围绕大语言模型构建的框架,可用于聊天机器人、生成式问答 (GQA)、摘要等。


朋友们可以上传自己感兴趣的文章、资料到这个知识库中。之后,大模型就可以根据这些个人资料,利用其强大的推理能力,回答朋友们提出的相关问题。


例如:收集某位喜欢的公众号或博主的文章,上传到自己的知识库。当您对这些内容有任何疑问时,知识库就可以为您提供解答。这就像拥有一个私人的、基于自身兴趣的问答专家。


因为之前经历过一次次踩坑填坑的过程,这次搭建过程还算顺利,没过多久,Web 界面就成功启动了。




02


  1. 系统支持直接和大模型聊天对话,和知识库对话。
  2. 支持切换后面支持的大模型:ChatGLM,Chatyuan,Vicuna,Bloom,Baichuan,Ggml,FastChat,OpenAI-ChatGPT。
  3. 和知识库对话需要新建知识库(不支持中文名字知识库名),再上传知识文件/文件夹,等待后台将知识文件的内容向量化后,就可以向知识库提问。

您已进入知识库测试模式,您输入的任何对话内容都将用于进行知识库查询,并仅输出知识库匹配出的内容及相似度分值和及输入的文本源路径,查询的内容并不会进入模型查询。

知识相关度 Score 经测试,建议设置为 500 或更低,具体设置情况请结合实际使用调整。3. 使用"添加单条数据"添加文本至知识库时,内容如未分段,则内容越多越会稀释各查询内容与之关联的score阈值。

单条内容长度建议设置在100-150左右。

用一个问题试试知识库:

最近发表
标签列表