prompt工程 #COT

思维链（Chain-of-Thought）

1 思维链的基本概念 1.1 什么是思维链思维链（Chain-of-Thought）是一种让AI模型像人类一样展示思考过程的技术。当我们解数学题时，老师通常要求我们写出解题步骤，而不仅是答案。思维链正是让AI也这样做——在给出最终答案前，先展示它是如何一步步思考和推理的。这种技术让AI的决策过程

Administrator 发布于 2026-01-11

prompt工程 #ICL

上下文学习（ICL）

1. 什么是上下文学习 1.1 基本概念上下文学习（In-Context Learning, ICL）是一种让大语言模型通过特定提示（Prompt）理解并学习新任务的方法。想象你正在教一个朋友做一道新菜，你不需要让他去上烹饪学校，而是给他看几个做菜的步骤示例，他就能学会。上下文学习就是这个原理——

Administrator 发布于 2026-01-10

prompt工程 #prompt

1. 什么是Prompt工程 Prompt工程是指通过精心设计输入提示（Prompt），引导大语言模型产生高质量、符合预期输出的技术和方法。它就像给AI助手写一份清晰的"指令说明书"，让AI准确理解我们的需求并给出恰当回应。想象一下，你要教一个外国朋友使用筷子。如果你只说"用这个吃饭"，他可能会困

Administrator 发布于 2026-01-09

1. 为什么需要不同的解码方法？在自然语言处理中，语言模型的核心任务是预测下一个词的概率分布。然而，如何将这些概率转化为最终的文本输出，却是一门精妙的艺术。这个将概率分布转化为实际文本的过程，被称为解码或采样。想象一下，语言模型就像一位作家，它知道每个词出现的可能性，但如何选择合适的词来构成流畅

Administrator 发布于 2025-12-29

背景我在家里的飞牛 nas 上搭建了 halo 服务（个人博客），但是没有公网ipv4，只能ipv6公网访问，刚好手里有一台阿里云服务器，想着通过frp实现公网访问方案经过和大模型多轮沟通和反复验证，最终的技术方案如下：服务器配置

Administrator 发布于 2025-12-28

1. 什么是Transformer？先从一个例子说起想象你在阅读这句话： "厨师把盐放得太少了，这道菜尝起来很____。" 你可能会不假思索地填上"淡"字。为什么你能做到这一点？因为你理解上下文 - 你看到了"盐放得太少"，知道盐是调味品，少了会让食物不够咸，所以味道会"淡"。 Transfor

Administrator 发布于 2025-12-27

语言模型基础 #RNN

想象你正在和一个朋友聊天。如果你的朋友完全不记得你刚才说了什么，每次回复都像是第一次见面，这样的对话会多么奇怪！同样，要让AI理解人类语言，它也需要"记住"上下文。这就是循环神经网络(RNN)的用武之地。 1. 什么是RNN？它和普通神经网络有什么区别？ 1.1 前馈神经网络：健忘的助手

Administrator 发布于 2025-12-26

语言模型基础 #n-grams

1. 什么是语言模型？想象一下，当你听到"下雨天，我带了___"这句话时，你的大脑可能会自动补上"伞"这个词。这背后其实是一个预测过程——你的大脑根据已有的语言经验，预测下一个最可能出现的词。语言模型就是让计算机学会这种预测能力的工具。它通过分析大量文本数据（我们称之为"语料库"），学习语言的

Administrator 发布于 2025-12-26