1.

机器学习分为监督学习，无监督学习，强化学习

深度学习：

大模型的训练三个阶段：

预训练 =>SFT(监督微调)=>以及RLHF(基于人类反馈的强化学习)

预训练就是知识的一个压缩压缩进神经网络中，什么都有但是不精通

deepseek拉低了大模型的入门门槛，之前门槛是非常高

大模型的分类：

1.大语言模型(LLM) =》专注于NLP

2.多模态模型（计算机视觉模型音频处理模型）

transformer谷歌最早用来做翻译

大模型工作流程：

分词化 token与词表映射

通义法睿=》法律法规垂直模型

2

提示词（prompt）

AI Agent

Agents:

基于LLM能自主理解，自主规划决策，执行复杂任务的智能体

设计目的是为了处理那些简单的语言模型可能无法直接解决的问题，尤其是这些任务涉及多个步骤或者需要外部数据源的情况

planning:

智能体会把大型任务分解为子任务，并规划执行任务的流程。智能体会对任务执行的过程进行思考和反思，从而决定是继续执行任务，或判断任务完结并终止运行。

智能体最重要的是让LLM具备子任务分解和反思思考能力

子任务分解=》24点算法

思维链(Chain of thoughts,Cot) =>多条链（自洽性）

思维树(Tree of thought,Tot) =>广度优先或者深度优先遍历

反思与思考

ReAct框架

tools:function call

智能体的记忆功能

长期记忆

短期记忆=》存入容器中（任务完成后会被清空）

tools

AI Agent

langchain =》llm

提示模版：

输出解析器：json格式

内置RAG：

加载文档 =〉切分=》灌库

plan-and-Execute

侧重于先规划一系列行动，然后执行

Self-Ask

项目

工具	特点
Pinecone	全托管、易用性强，适合中小规模生产环境。
Milvus	开源、支持分布式，适合需要高度自定义的大规模场景。
Weaviate	内置多模态和语义搜索，支持GraphQL查询。
FAISS	Facebook开源库，需自建服务，适合研究或嵌入式使用。

huggingface

gradio做ui

拆分分词有专业网站，比如openai可以看得出来

多轮对话：

1.把所有历史记录在下一轮对话中带上，放在message中。缺点就是token随着轮数增加变多，很贵

textembedding

根据openai句向量召回相似文本步骤：

1.查询语句向量化

2.备选文本向量化

3.计算欧式距离

大模型

作者littlepudding

1.