目录

大模型2024开源项目汇总

大模型:2024开源项目汇总

当大模型成本逐渐降低,可靠性提升后,这意味着越来越多的业务应用将会与 LLM 结合,为了让这种结合更加顺畅,需要有与现有 基础设施相兼容的工具和框架 来支撑 LLM 应用开发的快速开发

通用大模型 性能评测参见:

  • github:
  • 在线报告:

一、应用开发平台Maas


1.1 阿里:

  • 应用构建工具: 插件中心, 流程编排, Prompt工程, RAG, Agent
  • 模型开发工具: 训练数据管理, 模型调优, 模型评测, 模型部署

1.2 百度:

  • 数据管理: 数据集、 数据标注、 数据处理、 数据回流
  • 应用工具: 插件编排[对话类、生成类、编排类]、 RAG、 Prompt模板、 Prompt优化、 Prompt评估
  • 模型调优: 模型精调【精调样板,Post-PreTrain, SFT, DPO, RLHF】、模型评估、模型压缩
  • :组件编排

1.3 字节跳动:

  • Bots、插件、工作流、知识库
  • 文档地址:

对比说明可参考:

二、应用开发平台开源


**2.1 Dify:**开源的 LLM 应用开发平台。其直观的界面结合了 AI 工作流、RAG 、Agent、模型管理、可观测性功能等,让您可以快速从原型到生产。以下是其核心功能列表:

  • github:
  • 应用工具: AI 工作流、Prompt IDE、RAG、Agent、后端即服务(Dify 的功能都带有相应的 API)
  • 模型工具:LLMOps、全面的模型支持
  • https://i-blog.csdnimg.cn/blog_migrate/86a221f58bb51f5720c7390e33bee6b7.png
  • 原腾讯云 CODING DevOps 团队的核心成员倾力打造

2.2 FastGPT:一个基于 LLM 大语言模型的知识库问答系统,提供开箱即用的数据处理、模型调用等能力

  • github:
  • 应用工具:RAG、应用编排
  • 模型工具:多模型支持( )

2.3 bisheng(毕昇):一款领先的开源大模型应用开发平台,赋能和加速大模型应用开发落地,帮助用户以最佳体验进入下一代应用开发模式。

  • github:
  • 应用工具:RAG
  • 模型工具:模型微调(待验证)

—— 完整度的顺序 Dify > FastGPT > 毕昇

2.5 其它

  • :【网易有道】是致力于支持任意格式文件或数据库的本地知识库问答系统,可断网安装使用
  • :是一个高效、可定制、开源的企业级文档聊天机器人解决方案。
  • :基于 ChatGLM 等大语言模型与 Langchain 等应用框架实现,开源、可离线部署的检索增强生成(RAG)大模型知识库项目。
  • : 构建了一个完全可控的知识库问答平台,支持docker部署,用法也比较简单,定义知识库,上传文档,问答时选定知识库即可
  • :拖放式界面构建定制化LLM流程

:**通过实现缓存来提高基于LLM的应用程序的效率和速度


:**是一个 API 管理和分发系统,支持几乎所有主流 API 服务。OneAPI 通过简单的配置允许使用一个 API 密钥调用不同的服务,实现服务的高效管理和分发。

三、智能文档解析


**3.1 RAGFlow:**是一款基于深度文档理解构建的开源 RAG 引擎。

  • github:
  • RAGFlow 的最大特色,就是多样化的文档智能处理 ,它没有采用现成的 RAG 中间件,而是完全重新研发了一套智能文档理解系统,确保数据 Garbage In Garbage Out 变为 Quality In Quality Out,并以此为依托构建 RAG 任务编排体系。
  • 对于用户上传的文档,它会自动识别文档的布局,包括标题、段落、换行等,还包含图片和表格等。
  • RAGFlow 的 DeepDoc 模块提供了对多种不同格式文档的深度解析。

**3.2 Unstructured:**是一个灵活的Python 库,专门用于处理非结构化数据

  • github:
  • 它可以处理各种文档格式,包括 PDF、CSV 和 PPT 等。该库被多个项目用于非结构化数据的提取,如网易有道的QAnything、Dify 等。

**3.3 PaddleOCR:**是由百度推出的 OCR 开源项目,旨在提供全面且高效的文字识别和信息提取功能

  • github:
  • PaddleOCR 提供了版面分析、表格识别和文字识别等多种功能。PaddleOCR的应用场景广泛,包括金融、教育、法律等多个行业,其高效的处理速度和准确率使其成为业界领先的 OCR 解决方案之一

3.4 :使用很友好的OCR服务

四、BI与DB


**4.1 :**是一个开源的数据库领域大模型框架。目的是构建大模型领域的基础设施,通过开发多模型管理、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作等多种技术能力,让围绕数据库构建大模型应用更简单,更方便。

  • github:
  • RAG、GBI、微调框架、Multi-Agents框架、数据工厂、数据源
  • 由蚂蚁集团、阿里巴巴、京东、美团等公司的研究人员共同开发

4.2 Chat2DB: 阿里开源智能的通用数据库SQL客户端和报表工具

  • github:

4.3 DefogAI SQLCoder :SQLCoder 是 Defog 团队推出的一款前沿的大语言模型,专门用于将自然语言问题转化为 SQL 查询,这是一个拥有150亿参数的模型。

  • github:

4.4 BIRD-SQL:由多位作者联合创作,一作是港大,二作是阿里达摩院

  • github:

4.4 闭源项目参考:

  • 九章云极推出的数据分析,机器学习智能体
  • :Kyligence发布一站式指标平台的 AI 数智助理,支持对话式指标搜索,异动归因等等
  • PingCap产品,text2sql 相比以上两位支持更自然的文本指令,以及更复杂的数据分析类的sql生成
  • :网易数帆发布ChatBI对话数据分析平台
  • :Text2SQL一个由AI驱动的自然语言到SQL代理

4.5 其它

  • (4K):一个通用的AI开发和部署框架,直接与您现有的数据库相连而设计
  • (6K):使用人工智能(AI)的工具,可以让您更轻松地与数据库进行交互。该工具可用于SQL Server和PostgreSQL数据库,它使用自然语言处理技术,使您能够使用英语命令来查询和更新数据库。

五、本地部署工具


**5.1 ollama:**Ollama 是一个开源框架,专门为在本地机器上便捷部署和运行大型语言模型(LLM)而设计

  • github:
  • 功能齐全:Ollama将模型权重、配置和数据捆绑到一个包中,定义成Modelfile。它优化了设置和配置细节,包括GPU使用情况,从而提高了模型运行的效率
  • 轻量级:Ollama的代码简洁明了,运行时占用资源少。这使得它能够在本地高效地运行,不需要大量的计算资源。此外,它还支持热加载模型文件,无需重新启动即可切换不同的模型,这使得它非常灵活多变
  • 易用性:Ollama提供了多种安装方式,支持Mac和Linux平台,并提供了Docker镜像。用户只需按照安装指南进行操作即可完成安装,无需具备专业的技术背景

**5.2 OpenLLM:**OpenLLM 于 2023 年 6 月开源,是一个用于部署大语言模型的框架。其最初的口号是通过一行代码或相对轻松地在不同的大语言模型之间切换,为个人用户提供方便。

  • github:
  • 简化部署:自动生成 LLM 服务器 Docker 镜像或通过 BentoCloud 部署为无服务器端节点
  • 自由构建:对 LangChain、BentoML 和 Hugging Face 具有一级支持,可以通过将 LLM 与其它模型和服务组合来轻松创建自己的 AI 应用程序

**5.3 LM Studio:**LM Studio提供了一个简单的可视化LLM安装程序,用户只需几个简单的步骤就可以轻松安装和运行

  • 下载地址:
  • 对各种模型的广泛支持。它不仅支持所有公开发布的大型语言模型,而且不需要用户进行额外的编译或微调

**5.4 Xinference:**Xorbits Inference(Xinference)是一个性能强大且功能全面的分布式推理框架。通过 Xorbits Inference,你可以轻松地一键部署你自己的模型或内置的前沿开源模型。

  • github:
  • 模型推理,轻而易举 :大语言模型,语音识别模型,多模态模型的部署流程被大大简化。一个命令即可完成模型的部署工作。
  • 开放生态,无缝对接: 与流行的三方库无缝对接,包括 LangChain,LlamaIndex,Dify,以及 Chatbox。

六、推理服务框架


LLM推理有很多框架,各有其特点,下表中七个框架的关键点如下图

https://i-blog.csdnimg.cn/blog_migrate/5d266bec7160959a33d207a609c7aab3.png

**6.1 :**适用于大批量Prompt输入,并对推理速度要求高的场景

**6.2 :**依赖HuggingFace模型,并且不需要为核心模型增加多个adapter的场景

6.3 :可在CPU上进行推理

**6.4 :**为核心模型添加adapter并使用HuggingFace Agents,尤其是不完全依赖PyTorch;

**6.5 :**稳定的Pipeline和灵活的部署,它最适合更成熟的项目

**6.6 :**可在客户端(边缘计算)(例如,在Android或iPhone平台上)本地部署LLM

**6.7 :**使用DeepSpeed库来部署LLM

6.8 : 是一个纯 C/C++ 实现的模型量化推理工具,具有极高的性能,可以同时在 GPU 和 CPU 环境下运行

七、大模型微调


**7.1 LlamaFactory:**北航发布LlamaFactory,零代码大模型微调平台,一键快速实现大模型训练/微调/评估

  • Github:
  • 论文地址:

八、大模型聚合平台


8.1 Hugging Face :Hugging Face 是一个开源的机器学习平台,该平台目前托管了超过320,000个模型和50,000个数据集,成为全球机器学习社区合作开发模型、数据集和应用程序的主要集合地。

  • 地址:
  • 开源精神:Hugging Face秉承开源精神,与社区一起构建机器学习工具的基础

九、开发库与工具



😗*对于 LLM 应用开发入门者来说,这是一个必选的工具

  • :这是一个数据框架,它可以轻松地将大型语言模型连接到你的自定义数据源,方便你进行数据的存储、查询和索引
  • :这是微软开源的一套开发工具,旨在简化基于 LLM 的应用的开发周期。它让提示工程变得更加容易,并帮助你构建具有生产质量的 LLM 应用
  • :这是一个无代码编排工具,许多平台都在使用它,可以帮助你轻松地将不同的模块拼接起来,让它们协同工作
  • :一键免费部署你的私人 ChatGPT 网页应用

十、向量数据库


  • 参考Vector DB Comparison:

十一、参考学习文章


  • 全栈学习资料:
  • 思维导图

如何系统的去学习大模型LLM ?

作为一名热心肠的互联网老兵,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。

但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将 重要的 AI大模型资料 包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来

😝有需要的小伙伴,可以V扫描下方二维码免费领取🆓

https://i-blog.csdnimg.cn/direct/994b2e746da04a579fe5182094f7c8bb.gif#pic_center

一、全套AGI大模型学习路线

AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!

https://i-blog.csdnimg.cn/blog_migrate/88364745a21655bfcd37f027c18079f5.png

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

https://i-blog.csdnimg.cn/blog_migrate/65b8d4a2456d7e87091dd30dd77b9506.png

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

https://i-blog.csdnimg.cn/blog_migrate/f24835641125fd8514ca947213ceb376.png

https://i-blog.csdnimg.cn/blog_migrate/07ad636353ea67f1b425bf4becfe48b3.jpeg

四、AI大模型商业化落地方案

https://i-blog.csdnimg.cn/blog_migrate/f0f3a6d06d3f05c037af554a955041ee.png

阶段1:AI大模型时代的基础理解

  • 目标 :了解AI大模型的基本概念、发展历程和核心原理。
  • 内容
    • L1.1 人工智能简述与大模型起源

    • L1.2 大模型与通用人工智能

    • L1.3 GPT模型的发展历程

    • L1.4 模型工程

      • L1.4.1 知识大模型

      • L1.4.2 生产大模型

      • L1.4.3 模型工程方法论

      • L1.4.4 模型工程实践

    • L1.5 GPT应用案例

阶段2:AI大模型API应用开发工程

  • 目标 :掌握AI大模型API的使用和开发,以及相关的编程技能。
  • 内容
    • L2.1 API接口

      • L2.1.1 OpenAI API接口

      • L2.1.2 Python接口接入

      • L2.1.3 BOT工具类框架

      • L2.1.4 代码示例

    • L2.2 Prompt框架

      • L2.2.1 什么是Prompt

      • L2.2.2 Prompt框架应用现状

      • L2.2.3 基于GPTAS的Prompt框架

      • L2.2.4 Prompt框架与Thought

      • L2.2.5 Prompt框架与提示词

    • L2.3 流水线工程

      • L2.3.1 流水线工程的概念

      • L2.3.2 流水线工程的优点

      • L2.3.3 流水线工程的应用

    • L2.4 总结与展望

阶段3:AI大模型应用架构实践

  • 目标 :深入理解AI大模型的应用架构,并能够进行私有化部署。
  • 内容
    • L3.1 Agent模型框架

      • L3.1.1 Agent模型框架的设计理念

      • L3.1.2 Agent模型框架的核心组件

      • L3.1.3 Agent模型框架的实现细节

    • L3.2 MetaGPT

      • L3.2.1 MetaGPT的基本概念

      • L3.2.2 MetaGPT的工作原理

      • L3.2.3 MetaGPT的应用场景

    • L3.3 ChatGLM

      • L3.3.1 ChatGLM的特点

      • L3.3.2 ChatGLM的开发环境

      • L3.3.3 ChatGLM的使用示例

    • L3.4 LLAMA

      • L3.4.1 LLAMA的特点

      • L3.4.2 LLAMA的开发环境

      • L3.4.3 LLAMA的使用示例

    • L3.5 其他大模型介绍

阶段4:AI大模型私有化部署

  • 目标 :掌握多种AI大模型的私有化部署,包括多模态和特定领域模型。
  • 内容
    • L4.1 模型私有化部署概述
    • L4.2 模型私有化部署的关键技术
    • L4.3 模型私有化部署的实施步骤
    • L4.4 模型私有化部署的应用场景

学习计划:

  • 阶段1 :1-2个月,建立AI大模型的基础知识体系。
  • 阶段2 :2-3个月,专注于API应用开发能力的提升。
  • 阶段3 :3-4个月,深入实践AI大模型的应用架构和私有化部署。
  • 阶段4 :4-5个月,专注于高级模型的应用和部署。
这份完整版的大模型 LLM 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【 保证100%免费

😝有需要的小伙伴,可以Vx扫描下方二维码免费领取🆓

https://i-blog.csdnimg.cn/direct/994b2e746da04a579fe5182094f7c8bb.gif#pic_center