思维链(Chain-of-Thought)

1 思维链的基本概念 1.1 什么是思维链 思维链(Chain-of-Thought)是一种让AI模型像人类一样展示思考过程的技术。当我们解数学题时,老师通常要求我们写出解题步骤,而不仅是答案。思维链正是让AI也这样做——在给出最终答案前,先展示它是如何一步步思考和推理的。 这种技术让AI的决策过程

Administrator Administrator 发布于 2026-01-11

上下文学习(ICL)

1. 什么是上下文学习 1.1 基本概念 上下文学习(In-Context Learning, ICL)是一种让大语言模型通过特定提示(Prompt)理解并学习新任务的方法。想象你正在教一个朋友做一道新菜,你不需要让他去上烹饪学校,而是给他看几个做菜的步骤示例,他就能学会。上下文学习就是这个原理——

Administrator Administrator 发布于 2026-01-10

Prompt 工程简介

1. 什么是Prompt工程 Prompt工程是指通过精心设计输入提示(Prompt),引导大语言模型产生高质量、符合预期输出的技术和方法。它就像给AI助手写一份清晰的"指令说明书",让AI准确理解我们的需求并给出恰当回应。 想象一下,你要教一个外国朋友使用筷子。如果你只说"用这个吃饭",他可能会困

Administrator Administrator 发布于 2026-01-09

语言模型的解码艺术:从概率到文本

1. 为什么需要不同的解码方法? 在自然语言处理中,语言模型的核心任务是预测下一个词的概率分布。然而,如何将这些概率转化为最终的文本输出,却是一门精妙的艺术。这个将概率分布转化为实际文本的过程,被称为解码或采样。 想象一下,语言模型就像一位作家,它知道每个词出现的可能性,但如何选择合适的词来构成流畅

Administrator Administrator 发布于 2025-12-29

Frp 实现公网访问内网 Halo 服务

背景 我在家里的飞牛 nas 上搭建了 halo 服务(个人博客),但是没有公网ipv4,只能ipv6公网访问,刚好手里有一台阿里云服务器,想着通过frp实现公网访问 方案 经过和大模型多轮沟通和反复验证,最终的技术方案如下: 服务器配置

Administrator Administrator 发布于 2025-12-28

从零理解Transformer语言模型

1. 什么是Transformer?先从一个例子说起 想象你在阅读这句话: "厨师把盐放得太少了,这道菜尝起来很____。" 你可能会不假思索地填上"淡"字。为什么你能做到这一点? 因为你理解上下文 - 你看到了"盐放得太少",知道盐是调味品,少了会让食物不够咸,所以味道会"淡"。 Transfor

Administrator Administrator 发布于 2025-12-27

循环神经网络(RNN):让AI记住你说过的话

想象你正在和一个朋友聊天。如果你的朋友完全不记得你刚才说了什么,每次回复都像是第一次见面,这样的对话会多么奇怪!同样,要让AI理解人类语言,它也需要"记住"上下文。这就是循环神经网络(RNN)的用武之地。 1. 什么是RNN?它和普通神经网络有什么区别? 1.1 前馈神经网络:健忘的助手

Administrator Administrator 发布于 2025-12-26

语言的概率世界:统计方法如何理解我们的语言

1. 什么是语言模型? 想象一下,当你听到"下雨天,我带了___"这句话时,你的大脑可能会自动补上"伞"这个词。这背后其实是一个预测过程——你的大脑根据已有的语言经验,预测下一个最可能出现的词。 语言模型 就是让计算机学会这种预测能力的工具。它通过分析大量文本数据(我们称之为"语料库"),学习语言的

Administrator Administrator 发布于 2025-12-26