思考=模型=知识。泛化:举一反三的能力是泛化。语言,给我们带来最根本的能力,是零样本泛化能力,用来沟通只是语言的副产品。人类有了语言,所以才有第二系统,才能思考。
三位一体结构演化模式:感知(信息系统)→ 思考(模型系统) → 实现(行动系统)
LLM 大模型笔记
这个手册是我在进行AI大模型学习和相关工作时的笔记,不断更新中。
简介
大型语言模型是人工智能领域的一大突破,它们通过吸收和压缩世界级的知识库,赋予了机器类似于人类的常识和逻辑推理能力。这种能力使得机器在处理语言的复杂性时,能够展现出更人性化、更智能化的表现。
这手册是我的大模型开发学习笔记,主要涉及以下方面:
- 大模型底层原理、概念。
- 开发层面,大模型相关的开发工具、架构、工程。
- 应用层面,大模型带来对用户交互、应用场景、商业机会的革新思考。
大模型原理
大模型的工作原理基于深度学习中的神经网络架构,尤其是变换器(Transformer)结构,它通过自注意力(Self-Attention)机制来处理输入数据的序列。这使得模型不仅能理解单个单词的含义,还能把握整个句子乃至文章的上下文关系。在经过海量数据的训练后,这些模型能够压缩和内化复杂的世界知识,从而具备了常识推理能力。
- 阅读更多 关于 LLM 大模型笔记
- 登录或注册以发表评论