世界新动态:中科院团队发布国际最大规模汉语同步多模态神经影像数据集
(资料图片)
神经影像实验数据采集流程。 中科院自动化所 供图
中新社北京10月9日电 (记者 孙自法)中国科学院自动化研究所(中科院自动化所)9日向媒体发布信息说,该所自然语言处理研究组历时近两年,采集处理完成迄今国际上规模最大、包含信息最丰富的汉语同步多模态神经影像数据集,并于近日正式对外发布。
该数据集覆盖了近万个汉语词汇,是当前国际上最大规模的用于脑语言处理机制研究的多模态同步神经影像数据集。其相关研究成果论文已在《自然》(Nature)旗下专业学术期刊《科学数据》(Scientific Data)发表。
据中科院自动化所自然语言处理研究组介绍,大脑在加工语言时,需要实时调动多个脑区的神经元进行协同工作。构建高时空分辨率的神经影像数据可以帮助人们更好地了解各个脑区以及脑区之间的协同合作,对于研究大脑的语言加工机制至关重要。
当前已有的开源数据主要针对英文采集,只包括单一模态的神经影像数据,如高空间分辨率的功能核磁共振(fMRI)或高时间分辨率的脑磁图(MEG),并且大多使用1小时以内的实验材料,数据规模有限,无法借助数据需求量大的计算模型进行更全面、更深入的大脑语言加工机制探索。
为突破上述问题,该研究组历时近两年采集处理完成目前国际上规模最大、包含信息最丰富的汉语同步多模态神经影像数据集,针对12个被试收听约6个小时故事时的功能核磁共振(fMRI)、脑磁图(MEG)、每个被试的T1/T2加权结构像、扩散磁共振成像(diffusion MRI)和静息态核磁共振(resting MRI)数据采集整理而成。为了便于利用计算模型进行脑语言处理机制的研究,所有故事材料都由人工标注了句法结构树,计算了文本中每个词汇对应的音频时间点、词频以及多种不同字和词汇的向量。同时,所有测试指标均超越或可比于已有的同类数据集,具有充分的质量保证。
实验材料对应的标注信息。 中科院自动化所 供图
中科院自动化所自然语言处理研究组表示,目前国际最大规模汉语同步多模态神经影像数据集的公开发布,可以为全方位研究大脑在真实场景下理解词汇、短语和句子时如何调动不同脑区以及不同脑区之间如何协同工作等科学问题提供重要支撑。
特别值得注意的是,该数据集覆盖了近万个汉语词汇,这不仅对于研究大脑理解汉语的认知机理具有重要意义,而且将在探索自然语言计算模型与人脑语言处理机制之间的关系,研究如何利用神经影像数据提升现有语言计算模型的性能,从而构建新一代受脑启发的神经语言模型等一系列工作中发挥显著作用。
相关阅读
-
10-09
推荐阅读
-
-
世界新动态:中科院团队发布国际最大规模汉语同步
中新社北京10月9日电(记者孙自法)中国科学院自动化研究所(中科院自动化所)9日向媒体发布信息说,该所自然语言处理研究组历时近两年,采集处理更多
2022-10-09 21:53:10
-
-
世界快讯:英国最古老雪盖6年内第4次消融,研究者
斯芬克斯是英国境内最古老的雪盖,位于苏格兰高地上凯恩戈姆山脉间一块三面环山、后壁陡峻的半圆形洼地内。由于常年背阳且积雪容纳量较大,该更多
2022-10-09 19:43:37
-
-
【独家】中国太阳探测卫星为何被命名为“夸父一号
今天,我国成功发射先进天基太阳天文台卫星。这颗综合性太阳探测卫星被命名为“夸父一号”。今年7月,中科院国家空间科学中心向全国征名,其中更多
2022-10-09 17:57:05
-
-
每日热闻!中外科学家借助大数据揭示地球大气氧化
大气氧化过程和机制是宜居星球形成的关键。早期地球大气几乎无氧,经过至少两次主要增氧事件后,才达到现今宜居的大气氧气水平。重建高精度大更多
2022-10-09 16:54:39
-
-
前沿资讯!十战十捷,长二丁成功将先进天基太阳天
2022年10月9日7时43分,长征二号丁运载火箭在酒泉卫星发射中心成功将先进天基太阳天文台(简称ASO-S)卫星送入预定轨道,发射任务取得圆满成功更多
2022-10-09 16:02:04
-
-
环球信息:专家解读:阿尔茨海默治疗曙光初现,A&b
澎湃新闻记者陈竹沁更多
2022-10-09 15:47:00
-
-
重点聚焦!远望3号船圆满完成海上测控任务安全返航
今天(9日),圆满完成“中星1E”卫星海上测控任务的我国第二代航天远洋测量船远望3号,平安返回停靠母港。今天上午8点,累计航行了15000多海更多
2022-10-09 15:54:24
-
-
【世界快播报】土卫二海洋可能已集全生命六大基本
自古以来,人们仰望星空,好奇地球之外是否有其他生命?这也是科研人员孜孜不倦追求的目标。近日,中国科学技术大学地球和空间科学学院研究员更多
2022-10-09 15:56:20
科技热图
热门标签
精彩放送
-
10-09
-
今日必看
- 世界最新:Chrome成2022年漏洞最多的浏览器 数量将近Edge3倍!
- 每日速看!仙剑原名逍遥侠客行上热搜 姚仙:新名包含四大主角
- 焦点要闻:文旅部:米哈游入选文化和旅游数字化创新实践案例
- 每日快讯!《守望先锋:归来》皮肤太贵?玩家发现集齐雾子全皮肤要肝5年
- 天天快播:师太喂养十余年的独臂猴走红 住持称:它与寺庙有缘
- 今日关注:“红豆泥私密马赛” 日本一家游戏公司推出道歉姿势写真集
- 【天天聚看点】给美女点赞一般是手滑?喜欢下班有福了的囧图
- 世界头条:B社《星空》概念图像公布:史诗级的太空科幻美学!
- 实时焦点:刘昊然、沈腾《四海》台版海报 12月2日台湾地区上映
- 全球新消息丨曝:《恶霸鲁尼2》将在《GTA6》之后推出
-
精彩话题
-
最新见闻
- 世界新动态:中科院团队发布国际最大规模汉语同步多模态神经影像数据集
- 世界最新:Chrome成2022年漏洞最多的浏览器 数量将近Edge3倍!
- 每日速看!仙剑原名逍遥侠客行上热搜 姚仙:新名包含四大主角
- 焦点要闻:文旅部:米哈游入选文化和旅游数字化创新实践案例
- 每日快讯!《守望先锋:归来》皮肤太贵?玩家发现集齐雾子全皮肤要肝5年
- 世界快讯:英国最古老雪盖6年内第4次消融,研究者:原因之一是气候变化
- 天天快播:师太喂养十余年的独臂猴走红 住持称:它与寺庙有缘
- 今日关注:“红豆泥私密马赛” 日本一家游戏公司推出道歉姿势写真集
- 【天天聚看点】给美女点赞一般是手滑?喜欢下班有福了的囧图
- 世界头条:B社《星空》概念图像公布:史诗级的太空科幻美学!
- 实时焦点:刘昊然、沈腾《四海》台版海报 12月2日台湾地区上映
- 全球新消息丨曝:《恶霸鲁尼2》将在《GTA6》之后推出
- 【独家】中国太阳探测卫星为何被命名为“夸父一号”?
- 当前热议!《守望先锋:归来》奥丽莎标枪没皮肤引玩家不满:暴雪又在偷懒
- 世界速读:玩家买XSS开机就被Ban 网友:难道是美版零元购?
- 每日热闻!中外科学家借助大数据揭示地球大气氧化过程
- 世界热讯:《假面骑士BLACK SUN》新预告公开 写实风格很黑暗
- 全球微动态丨《魔兽世界》怀旧服巫妖王之怒版本战场挂机升级不能再用 有封号风险
- 全球速递!新表情来了?腾讯申请新狗头图形商标
- 每日消息!NVIDIA GeForce Experience推新版:RTX 40系显卡获8K录制支持