ChatGPT的技术基础分析*
钱力,刘熠,张智雄,李雪思,谢靖,许钦亚,黎洋,管铮懿,李西雨,文森

An Analysis on the Basic Technologies of ChatGPT
Qian Li,Liu Yi,Zhang Zhixiong,Li Xuesi,Xie Jing,Xu Qinya,Li Yang,Guan Zhengyi,Li Xiyu,Wen Sen
表2 对话微调语料在各微调阶段的体量和分布(单位:Token数量)[7]
Table 2 The Distribution of the Conversational Fine-Tuning Corpus at Each Fine-Tuning Stage (Unit:Number of Tokens)
SFT Data RM Data PPO Data
语料划分 语料来源 语料数量 语料划分 语料来源 语料数量 语料划分 语料来源 语料数量
训练集 标注工 11 295 训练集 标注工 6 623 训练集 用户 31 144
训练集 用户 1 430 训练集 用户 26 584 验证集 用户 16 185
验证集 标注工 1 550 验证集 标注工 3 488
验证集 用户 103 验证集 用户 14 399