1.

机器学习分为监督学习,无监督学习,强化学习

深度学习:

大模型的训练三个阶段:

预训练 =>SFT(监督微调)=>以及RLHF(基于人类反馈的强化学习)

预训练就是知识的一个压缩 压缩进神经网络中,什么都有但是不精通

deepseek拉低了大模型的入门门槛,之前门槛是非常高

大模型的分类:

1.大语言模型(LLM) =》专注于NLP

2.多模态模型(计算机视觉模型 音频处理模型)

transformer谷歌最早用来做翻译

大模型工作流程:

分词化 token与词表映射

通义法睿=》法律法规 垂直模型

2

提示词(prompt)

AI Agent

Agents:

基于LLM能自主理解,自主规划决策,执行复杂任务的智能体

设计目的是为了处理那些简单的语言模型可能无法直接解决的问题,尤其是这些任务涉及多个步骤或者需要外部数据源的情况

planning:

智能体会把大型任务分解为子任务,并规划执行任务的流程。智能体会对任务执行的过程进行思考和反思,从而决定是继续执行任务,或判断任务完结并终止运行。

智能体最重要的是让LLM具备子任务分解和反思思考能力

子任务分解=》24点算法

思维链(Chain of thoughts,Cot) =>多条链(自洽性)

思维树(Tree of thought,Tot) =>广度优先 或者深度优先遍历

反思与思考

ReAct框架

tools:function call

智能体的记忆功能

长期记忆

短期记忆=》存入容器中(任务完成后会被清空)

tools

AI Agent

langchain =》llm

提示模版:

输出解析器:json格式

内置RAG:

加载文档 =〉切分=》灌库

plan-and-Execute

侧重于先规划一系列行动,然后执行

Self-Ask

项目

暂时无法在iChery文档外展示此内容

huggingface

gradio做ui

作者 littlepudding

奇瑞汽车,车载智能语音开发

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注