1.
机器学习分为监督学习,无监督学习,强化学习
深度学习:
大模型的训练三个阶段:
预训练 =>SFT(监督微调)=>以及RLHF(基于人类反馈的强化学习)
预训练就是知识的一个压缩 压缩进神经网络中,什么都有但是不精通
deepseek拉低了大模型的入门门槛,之前门槛是非常高
大模型的分类:
1.大语言模型(LLM) =》专注于NLP
2.多模态模型(计算机视觉模型 音频处理模型)
transformer谷歌最早用来做翻译
大模型工作流程:
分词化 token与词表映射
通义法睿=》法律法规 垂直模型
2
提示词(prompt)
AI Agent
Agents:
基于LLM能自主理解,自主规划决策,执行复杂任务的智能体
设计目的是为了处理那些简单的语言模型可能无法直接解决的问题,尤其是这些任务涉及多个步骤或者需要外部数据源的情况
planning:
智能体会把大型任务分解为子任务,并规划执行任务的流程。智能体会对任务执行的过程进行思考和反思,从而决定是继续执行任务,或判断任务完结并终止运行。
智能体最重要的是让LLM具备子任务分解和反思思考能力
子任务分解=》24点算法
思维链(Chain of thoughts,Cot) =>多条链(自洽性)
思维树(Tree of thought,Tot) =>广度优先 或者深度优先遍历
反思与思考
ReAct框架
tools:function call
智能体的记忆功能
长期记忆
短期记忆=》存入容器中(任务完成后会被清空)
tools
AI Agent
langchain =》llm
提示模版:
输出解析器:json格式
内置RAG:
加载文档 =〉切分=》灌库
plan-and-Execute
侧重于先规划一系列行动,然后执行
Self-Ask
项目
暂时无法在iChery文档外展示此内容
huggingface
gradio做ui