腾博会官网
研究所概况
- 研究所简介
- 所长致辞
- 现任领导
- 历任领导
- 科技布局
- 专家顾问委员会
- 学术委员会
- 学位评定委员会
- 科学研究伦理委员会
- 科研道德工作委员会
- 知识产权委员会
- 组织结构图
- 开展历程
- 研究所风貌
- 核心价值体系
- 形象标识
组织设置
- 科研部门
  - 认知科学与心理健康全国重点实验室
  - 健康与遗传心理学研究室
  - 认知与开展心理学研究室
  - 社会与工程心理学研究室
- 管理部门
  - 党建工作办公室
  - 综合办公室
  - 科研业务处
  - 人事处
  - 财务处
  - 应用开展部
  - 学生工作处
- 支撑部门
  - 一级支撑部门
    - 应用转化与服务专项工作（善后）
  - 二级支撑部门
    - 公共技术中心
    - 信息中心
    - 学会期刊办公室
研究队伍
- 院士专家
- 杰出青年
- 研究员
- 青年特聘研究员
- 副研究员
- 助理研究员
- 教授
- 副教授
- 高级工程师
- 工程师
- 博士后
- 客座人员
- 人才招聘
科研成果
- 获奖概况
- 科技奖励
- 科研论文
- 专著
- 专利
- 软件著作权
- 作品著作权
实验平台
- 公共技术中心
- 其他专业（特色）实验室
- 磁共振成像研究中心
- 心理科学信息中心
- 网络信息平台
- 动物实验中心
学生培养
- 概况
- 招生信息
  - 硕士招生
  - 博士招生
- 留学生
  - 招生信息
  - 管理规定
  - 奖学金
- 同等学力
- 所友录
- 中国科学院大学心理学系
学术期刊
- 心理学报
- 心理科学进展
- PsyCh Journal
党群园地
科学传播
信息公开
- 信息公开规定
- 信息公开指南
- 信息公开目录
- 依申请公开
- 信息公开年度报告
- 信息公开联系方式

腾博会官网
研究所概况
- 研究所简介
- 所长致辞
- 现任领导
- 历任领导
- 科技布局
- 专家顾问委员会
- 学术委员会
- 学位评定委员会
- 科学研究伦理委员会
- 科研道德工作委员会
- 知识产权委员会
- 组织结构图
- 开展历程
- 研究所风貌
- 核心价值体系
- 形象标识
组织设置
- 科研部门
  - 认知科学与心理健康全国重点实验室
  - 健康与遗传心理学研究室
  - 认知与开展心理学研究室
  - 社会与工程心理学研究室
- 管理部门
  - 党建工作办公室
  - 综合办公室
  - 科研业务处
  - 人事处
  - 财务处
  - 应用开展部
    - 知识产权办公室
  - 学生工作处
- 支撑部门
  - 一级支撑部门
    - 应用转化与服务专项工作（善后）
  - 二级支撑部门
    - 公共技术中心
    - 信息中心
    - 学会期刊办公室
研究队伍
- 院士专家
- 杰出青年
- 研究员
- 青年特聘研究员
- 副研究员
- 助理研究员
- 教授
- 副教授
- 高级工程师
- 工程师
- 博士后
- 客座人员
- 人才招聘
科研成果
- 获奖概况
- 科技奖励
- 科研论文
- 专著
- 专利
- 软件著作权
- 作品著作权
实验平台
- 公共技术中心
- 其他专业（特色）实验室
- 磁共振成像研究中心
- 心理科学信息中心
- 网络信息平台
- 动物实验中心
学生培养
- 概况
- 招生信息
  - 硕士招生
  - 博士招生
- 留学生
  - 招生信息
  - 管理规定
  - 奖学金
- 同等学力
- 所友录
- 中国科学院大学心理学系
学术期刊
- 心理学报
- 心理科学进展
- PsyCh Journal
党群园地
科学传播
信息公开
- 信息公开规定
- 信息公开指南
- 信息公开目录
- 依申请公开
- 信息公开年度报告
- 信息公开联系方式
新闻动态
- 应用服务
- 党建动态
- 科研进展
- 综合新闻
- 学术活动
心理援助
- 心理援助规章制度
- 心理援助自助方法
- 心理援助会议
- 潍坊洪水灾后心理援助
- 九寨沟地震灾后心理援助
- 阜宁风灾后心理援助
- 天津滨海爆炸事故灾后心理援助
  - 工作动态
  - 媒体报道
- 鲁甸地震灾后心理援助
  - 工作动态
  - 工作日志
  - 媒体报道
- 昆明暴恐事件后心理援助
- 抚顺洪水灾后心理援助
- 芦山地震灾后心理援助
  - 工作动态
  - 工作日志
  - 媒体报道
- 彝良地震灾后心理援助
- 盈江地震灾后心理援助
- 舟曲泥石流灾后心理援助
- 玉树地震灾后心理援助
- 汶川地震灾后心理援助
应用服务
专题专栏
相关链接

您当前的位置：

科研进展

腾博会官网发布首个基于大规模自发言语的汉语学前儿童词汇数据库

发布时间：2026-02-04 作者：李甦研究组【小中大】【打印】【关闭】

词汇数据库是心理语言学和认知神经科学研究的重要基础工具。然而，现有多数汉语词汇数据库主要来源于成人文本、儿童读物或动画等输入性材料，难以真实反映学前儿童在自然研讨中“能说什么”以及“如何说”。学前阶段是词汇快速增长的关键时期，但儿童的表达性词汇与理解性词汇在规模和分布上存在显著差异。因此，构建基于儿童真实口语产出的专门数据库，对于深入探究儿童语言开展与认知机制具有重要价值。

近期，中国科学院心理研究所李甦研究组发布了汉语学前儿童口语词汇数据库（Chinese Preschool Children’s Spoken Lexical Database，CPCSLD）。该数据库基于648名北京地区3–6岁儿童在同伴对话情境中的自发言语构建，语料涵盖旅行、玩具、图书、动画、机器人和游乐园等贴近儿童日常生活的主题。整个语料库共包含约120万词次、21372个不同词条、1147个带声调音节和400个不带声调音节，并分别构建了幼儿园小班（K1）、中班（K2）和大班（K3）三个年龄段的子数据库。

图1. 词汇数据库的构建流程

该数据库系统性地给予了词汇层面和音节层面的多维信息，涵盖词频、词长、词类、音节频率（带声调/不带声调）等多种指标，可用于精细刻画学前儿童口语词汇的结构特征和开展变化。分析结果显示，随着年龄增长，儿童自发言语中多音节词比例逐渐增加，词汇结构日趋复杂；不同词类在表达性语言中的分布也呈现出鲜明的开展特征。

图2. 词频和音节频率的分布

A) 总词汇库的词频分布和各年龄组词频分布；B）带声调音节的总词汇库频率分布和各龄组分布；C)不带声调音节的总词汇库频率分布和各年龄组分布

为检验数据库的心理语言学效度，研究团队进一步将 CPCSLD 与多个已有汉语词汇数据库进行比较，并用于预测学前儿童在语义判断任务和图片命名任务中的表现。结果表明，CPCSLD 在预测图片命名反应时和正确率方面表现出显著优势，优于基于成人语料或输入性儿童语料构建的数据库；而在以词汇理解为主的语义判断任务中，其优势则相对有限。这一结果表明：基于儿童自发言语构建的词汇数据库，更能捕捉学前儿童言语产生过程中的关键统计特征。

该数据库是首个专门面向汉语学前儿童表达性词汇、以自然口语产出为基础的汉语词汇数据库，为儿童语言开展与言语产生研究给予了新的工具。CPCSLD 不仅可用于研究学前儿童词汇和言语产生的开展机制，也可服务于儿童语言评估、语言障碍早期筛查以及教育干预研究。同时，该数据库为探索儿童心理词汇表的组织结构、开展轨迹，及其神经基础给予了重要的数据支撑。

现在，CPCSLD 数据库及相关分析代码已在国家科学数据中心平台公开共享（http://www.scidb.cn/en/s/Vb6vIb），供国内外研究者免费使用。研究团队希望该数据库能够有助于学前儿童语言开展研究的深入召开，并为儿童语言教育与干预实践给予科学依据。

该研究得到了国家自然科学基金（31571140）和中国科学院腾博会官网自主部署项目（Y5CX052003）的支持。

研究论文已在线发表于Behavior Research Methods。腾博会官网助理研究员冯臣为论文第一作者，李甦研究员为论文通讯作者。腾博会官网研究助理王嵩为论文共同作者。

论文信息：Feng, C., Wang, S., & Li, S. (2026). CPCSLD: A lexical database of Chinese preschool children’s spoken words. Behavior Research Methods, 58(2), 54. DOI: http://doi.org/10.3758/s13428-025-02931-9

附件下载：

腾博会官网研究发现行为振荡的Theta节律存在于跨通道刺激冲突与反应冲突加工中

腾博会官网合作研究揭示连接青少年期神经发育偏离与成年期病理性拖延间的共享神经遗传架构