LLM [6]
【问答】第2章-词元和嵌入 (图解大模型:生成式AI原理与实战)
第2章 词元和嵌入 Q9:大模型的分词器和传统的中文分词有什么区别?对于一个指定的词表,一句话是不是只有一种唯一的分词方式? A9: 大模型的分词器(Tokenizer)与传统的中文分词在目标、方法和结果上都有显著区别。 传统中文分词: 目标: 主要目标是将连续的汉字序列切分成具有明确语义的词语单元
【问答】第1章 大模型简介 (图解大模型:生成式AI原理与实战)
第1章 大模型简介 Q1:Transformer 中的编码器和解码器有什么区别,只有编码器或者只有解码器的模型是否有用? A1: Transformer 中的编码器(Encoder)和解码器(Decoder)在结构和功能上有所不同: 编码器(Encoder): 作用:主要负责理解输入序列的上下文信息
揭秘AI革命:大语言模型的基本概念与技术
揭秘AI革命:大语言模型的基本概念与技术 本文是《揭秘AI革命》系列的第一篇,基于清华大学计算机系马少平教授的《计算机是如何实现智能的》系列讲座整理 引言:AI的新纪元 近年来,人工智能领域迎来了一场革命性的变革,这场变革的核心推动力就是大语言模型(Large Language Model,简称LL
嵌入模型、向量数据库与RAG技术详解:从原理到实践
摘要:本文深入解析嵌入模型(Embedding)、向量数据库(Vector Database)与检索增强生成(RAG)的技术原理,结合完整流程图与代码示例,揭示现代语义搜索与生成系统的核心架构。 一、嵌入(Embedding):语义理解的数学基石 1.1 什么是嵌入? 嵌入是将非结构化数据(文本、图
解析 PockerFlow 源码
https://github.com/The-Pocket/PocketFlow/blob/main/pocketflow/__init__.py 你好!这个 Python 文件 实现了一个灵活的任务流程编排框架,其中包含同步和异步的节点和流程。对于初学者来说,理解这个文件可以帮助你掌握很多 Pyt
在 Windows 11 上部署 Deepseek-R1 1.5B 模型:基于 Ollama 和 Open WebUI 的本地私有化 LLM 实践
一、环境说明 宿主机:Windows 11 虚拟机:VMware 虚拟化环境(推荐 Ubuntu 22.04 或同类 Linux 发行版) 核心工具: Ollama:本地大语言模型管理框架 Deepseek-R1 1.5B:轻量级开源模型(模型卡片) Open WebUI:类 ChatGPT 的交互