ChatGPT中文性能测评与风险应对*
|
张华平,李林翰,李春锦
|
ChatGPT Performance Evaluation on Chinese Language and Risk Measures
|
Zhang Huaping,Li Linhan,Li Chunjin
|
|
表6 机器阅读理解任务的输入输出示例
|
Table 6 An Input/Output Example of MRC Task
|
|
CMRC2018 DRCD | Prompt | 阅读文章:{Context}\n问:{Question}\n答: | Context | 《战国无双3》()是由光荣和ω-force开发的战国无双系列的正统第三续作。本作以三大故事为主轴…… | Question | 《战国无双3》是由哪两个公司合作开发的? | 标注 | 光荣和ω-force | ChatGPT输出 | 《战国无双3》是由光荣和ω-force合作开发的。 | C3 | Prompt | 阅读文章:{Context}\n问:{Question}\n以下选项中正确的答案是:\n{Choices} | Context | 梅兰芳是中国著名的京剧演员。有一次,在他表演的时候…… | Question | 梅兰芳是一个什么样的人? | Choices | 他是一位年纪大的老人\n他是喜欢看京剧的人\n他是一个很虚心的人\n他是一个没礼貌的人\n | 标注 | 他是一个很虚心的人 | ChatGPT输出 | 梅兰芳是一个很虚心的人。 |
|
|
|