1.

机器学习分为监督学习,无监督学习,强化学习
深度学习:
大模型的训练三个阶段:
预训练 =>SFT(监督微调)=>以及RLHF(基于人类反馈的强化学习)
预训练就是知识的一个压缩 压缩进神经网络中,什么都有但是不精通
deepseek拉低了大模型的入门门槛,之前门槛是非常高
大模型的分类:
1.大语言模型(LLM) =》专注于NLP
2.多模态模型(计算机视觉模型 音频处理模型)
transformer谷歌最早用来做翻译
大模型工作流程:
分词化 token与词表映射
通义法睿=》法律法规 垂直模型

2

提示词(prompt)
AI Agent
Agents:
基于LLM能自主理解,自主规划决策,执行复杂任务的智能体
设计目的是为了处理那些简单的语言模型可能无法直接解决的问题,尤其是这些任务涉及多个步骤或者需要外部数据源的情况

planning:

智能体会把大型任务分解为子任务,并规划执行任务的流程。智能体会对任务执行的过程进行思考和反思,从而决定是继续执行任务,或判断任务完结并终止运行。
智能体最重要的是让LLM具备子任务分解和反思思考能力
子任务分解=》24点算法
思维链(Chain of thoughts,Cot) =>多条链(自洽性)
思维树(Tree of thought,Tot) =>广度优先 或者深度优先遍历
反思与思考
ReAct框架
tools:function call
智能体的记忆功能
长期记忆
短期记忆=》存入容器中(任务完成后会被清空)

tools

AI Agent

langchain =》llm

提示模版:
输出解析器:json格式
内置RAG:
加载文档 =〉切分=》灌库

plan-and-Execute

侧重于先规划一系列行动,然后执行
Self-Ask

项目

工具 特点
​​Pinecone​​ 全托管、易用性强,适合中小规模生产环境。
​​Milvus​​ 开源、支持分布式,适合需要高度自定义的大规模场景。
​​Weaviate​​ 内置多模态和语义搜索,支持GraphQL查询。
​​FAISS​​ Facebook开源库,需自建服务,适合研究或嵌入式使用。
huggingface
gradio做ui
拆分分词有专业网站,比如openai可以看得出来
多轮对话:
1.把所有历史记录在下一轮对话中带上,放在message中。缺点就是token随着轮数增加变多,很贵
textembedding
根据openai句向量召回相似文本步骤:
1.查询语句向量化
2.备选文本向量化
3.计算欧式距离
 

作者 littlepudding

奇瑞汽车,车载智能语音开发

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注