大语言模型打卡学习DAY1
目录
大语言模型打卡学习DAY1
学习目标:
- 语言模型的发展历程
- 大模型的技术基础
学习内容:
1. 语言模型的发展历程
`语言模型通常是指能够建模自然语言文本生成概率的模型,从语言建模到任务求解,这是科学思维的一次重要跃升。`
2. 大语言模型技术基础
定义:通常是指具有超大规模参数的预训练语言模型
架构: 主要为Transformer架构
训练:预训练(base model)、后训练(instruct model)
2.1 大语言模型与训练(Pre-training)
定义:使用与下游任务无关的大规模数据进行模型参数的初始训练