数据分析与知识发现

Advanced Search

基本情况

首页 > 行业动态

人工智能可以进行类似儿童的语言学习

GPT-4等人工智能系统可以学习和使用人类语言，但它们是从海量的语言输入中学习到的，远远超过儿童在学习语言时所获得的真实的语料输入。如果人工智能模型不是基于海量的网络数据，而仅仅是基于单个孩子接收的输入语料，那么模型能够学习到什么呢？近日，发表在Science上的一项研究中，纽约大学的研究人员训练了一个基于单个孩子接受收到的语料输入的人工智能模型。研究结果显示，该模型可以使用孩子所经历的有限片段来学习大量的单词和概念。

研究人员通过一个孩子的眼睛和耳朵训练了一个多模态人工智能系统，使用从孩子6个月到25个月之间头戴摄像头所捕捉的第一人称视角的视频记录，研究了人工智能模型是否可以学习儿童日常经验中存在的单词和概念。这些视频包含大约25万个单词实例（交流的单词数量，其中许多是重复的），这些实例与儿童在说出这些单词时所看到的视频帧相关联，并且包括整个发展过程中的各种不同活动，包括进餐、阅读书籍和玩耍。虽然这些视频只捕捉到孩子清醒时间的1%左右的时长内容，但这对于真正的语言学习来说已经足够。

研究人员训练了具有两个独立模块的多模态神经网络：一个接收单个视频帧（视觉编码器），另一个接收转录的儿童导向语音（语言编码器）。这两个编码器被组合并使用一种称为对比学习的算法进行训练，该算法旨在学习有用的输入特征及其跨模态关联。例如，当父母对孩子说些什么时，所使用的一些词语很可能指的是孩子可以看到的东西，这意味着通过链接视觉和语言线索可以获得理解。

研究人员使用用于测量婴儿单词学习的相同类型的评估方式对模型进行测试，研究人员向模型展示目标单词和4组不同图像，并要求模型选择与目标单词相匹配的图像。结果表明，该模型能够学习儿童日常经验中存在的大量单词和概念，而且，模型还能够将学习的一些单词推广到与训练中看到的截然不同的视觉实例中。

该研究结果表明：将人工智能算法与一个孩子自然获得的体验相结合，有可能重塑人们对人类早期语言和概念习得的理解。

（编译自：https://www.sciencedaily.com/releases/2024/02/240201212821.htm）

（本刊讯）

发布时间: 2024-04-12 浏览： 36