Thinking = Model = Knowledge
Definition of knowledge: An expression of information that can be used to solve multiple tasks.
Generalization: The ability to infer from one instance to another is generalization. Language brings us the fundamental ability, which is zero-shot generalization. Communication is just a by-product of language. Humans have language, hence they have a second system and think.
Tripartite evolution mode: Perception (information system) → Thinking (model system) → Implementation (action system)
LLM Notebook
这个手册是我在进行AI大模型学习和相关工作时的笔记,不断更新中。
简介
大型语言模型是人工智能领域的一大突破,它们通过吸收和压缩世界级的知识库,赋予了机器类似于人类的常识和逻辑推理能力。这种能力使得机器在处理语言的复杂性时,能够展现出更人性化、更智能化的表现。
这手册是我的大模型开发学习笔记,主要涉及以下方面:
- 大模型底层原理、概念。
- 开发层面,大模型相关的开发工具、架构、工程。
- 应用层面,大模型带来对用户交互、应用场景、商业机会的革新思考。
大模型原理
大模型的工作原理基于深度学习中的神经网络架构,尤其是变换器(Transformer)结构,它通过自注意力(Self-Attention)机制来处理输入数据的序列。这使得模型不仅能理解单个单词的含义,还能把握整个句子乃至文章的上下文关系。在经过海量数据的训练后,这些模型能够压缩和内化复杂的世界知识,从而具备了常识推理能力。
- Read more about LLM Notebook
- Log in or register to post comments