【问答】第2章-词元和嵌入 (图解大模型:生成式AI原理与实战)
第2章 词元和嵌入 Q9:大模型的分词器和传统的中文分词有什么区别?对于一个指定的词表,一句话是不是只有一种唯一的分词方式? A9: 大模型的分词器(Tokenizer)与传统的中文分词在目标、方法和结果上都有显著区别。 传统中文分词: 目标: 主要目标是将连续的汉字序列切分成具有明确语义的词语单元
【问答】第1章 大模型简介 (图解大模型:生成式AI原理与实战)
第1章 大模型简介 Q1:Transformer 中的编码器和解码器有什么区别,只有编码器或者只有解码器的模型是否有用? A1: Transformer 中的编码器(Encoder)和解码器(Decoder)在结构和功能上有所不同: 编码器(Encoder): 作用:主要负责理解输入序列的上下文信息
揭秘AI革命:大语言模型的基本概念与技术
揭秘AI革命:大语言模型的基本概念与技术 本文是《揭秘AI革命》系列的第一篇,基于清华大学计算机系马少平教授的《计算机是如何实现智能的》系列讲座整理 引言:AI的新纪元 近年来,人工智能领域迎来了一场革命性的变革,这场变革的核心推动力就是大语言模型(Large Language Model,简称LL
Python高级语法指南:从LangGraph项目中学习
在本文中,我们将通过分析一个基于LangGraph的项目,深入探讨Python中的一些高级语法特性。这些特性在现代Python应用开发中非常常见,尤其是在使用Pydantic、FastAPI和LangGraph等框架时。 目录 Pydantic模型 BaseModel基础 Field函数 不同的Fi
为什么需要 Prometheus + Alertmanager + Grafana?
由 Gemini 2.5 Flash Preview 05-20 生成 概述:为什么需要 Prometheus + Alertmanager + Grafana? 想象一下你的 Kubernetes 集群是一个繁忙的城市,里面有无数的建筑物(Pod)、车辆(Deployment/Service)和居
嵌入模型、向量数据库与RAG技术详解:从原理到实践
摘要:本文深入解析嵌入模型(Embedding)、向量数据库(Vector Database)与检索增强生成(RAG)的技术原理,结合完整流程图与代码示例,揭示现代语义搜索与生成系统的核心架构。 一、嵌入(Embedding):语义理解的数学基石 1.1 什么是嵌入? 嵌入是将非结构化数据(文本、图
解析 PockerFlow 源码
https://github.com/The-Pocket/PocketFlow/blob/main/pocketflow/__init__.py 你好!这个 Python 文件 实现了一个灵活的任务流程编排框架,其中包含同步和异步的节点和流程。对于初学者来说,理解这个文件可以帮助你掌握很多 Pyt
【初学者指南】使用 MCP 协议快速开发智能天气查询应用
在本文中,我将详细介绍如何使用 MCP(Model Context Protocol)协议开发一个智能天气查询应用。这个示例非常适合初学者,通过简单易懂的步骤,你将学习如何将大型语言模型(LLM)与专用的天气查询服务相结合,让用户能够使用自然语言查询天气信息。 什么是 MCP? MCP(Model
基于 Docker 的 PostgreSQL 数据库部署与运维指南
一、Docker Compose 配置优化 1.1 最终版配置 version: '3.8'
services:
postgres:
image: postgres:16-alpine
container_name: postgres # 标准容器命名
restart
通过 WireGuard 实现云服务器与家庭 NAS 的安全互联:完整教程
一、背景需求 你是否遇到过以下问题? 想在外网安全访问家中 NAS 的 SSH、Web 服务或私有 GitLab? 云服务器有公网 IP,但家庭宽带没有固定公网 IP? 直接暴露 NAS 端口到公网存在安全隐患? WireGuard 的解决方案: 通过轻量级 VPN 打通云服务器与家庭 NAS,所有