1
大模型训练数据专题
构筑AI时代的基石——科学数据
洪学海*
深成侵入岩类不平衡岩石图像数据集PlutonicRocks-13
陈忠良*,胡召齐,郑超杰
江西九江地区洪涝无人机高分辨率影像数据集
李雪林,岳焕印*,戴琪,郝丽娜,贺洪波,杜冰,肖祥
XBMU-bo-Lhasa31:藏语拉萨话语音识别数据集
马立克,李冠宇*,谢晨宇,孙倩,郭玉豪
XBMU-AMDO31:藏语安多方言语音识别数据集
谢晨宇,李冠宇*,马立克,孙倩,郭玉豪
BodSUM-6000:生成式藏文文本摘要数据集
夏吾吉,黄鹤鸣*,贡保杰布
XBMU-MC:多语言平行语料库
严琦栋,马宁*,巴桑珠扎,白玛曲扎,艾科拜·依米提,麦迪那木·吾斯曼,木巴热克·阿布力克木,苏日娜,阿力娅
面向甘肃旅游大模型的知识注入数据集
陈敏,朱登赟,万福成*,于洪志,卢保青
AMCK:面向大语言模型微调的汽车维护与保养知识数据集
吴文社,王有齐,南哲,马宁*
面向类案检索的法律大模型评测数据集
王怡文,戚肖克*,赵小兵,马传连,陈波
面向法律问答领域的大模型微调数据集
黄子键,史士彪,欧阳旭,孟祥和,朱皓天,单瑞磊,郝敬斌,高远博,蒋文豪,何向真*
MPCCD-MLF:医疗、法律与金融领域多轮专业咨询对话数据集
罗淙飞,严琦栋,王德杰,马宁*
面向大语言模型指令微调的寓言故事数据集
万福成*,杨登辉,雷鑫鹏,朱登赟
DRD:面向大语言模型监督微调的中文外交辞令数据集
李毅杰,朱骏旭,高睿環,庄文浩,孙媛*
VAD:面向大语言模型指令微调的价值观对齐数据集
李英杰,严琦栋,吴文社,王德杰,马宁*
MTR-QA:多类型推理问答数据集
王强,姜程林,马宁*,李英杰,吴文社
面向推理大模型的数学难题数据集SD1K
朱丹浩*,黄菲
MDD-TD:大语言模型文本来源及内容真伪检测数据集
李硕,马宁*
2
黄土高原生态环境专题
黄河流域高分辨率地下水储量变化量数据集(2003–2023年)
谢怡铭,曹艳萍*,刘丹丹
2000–2024年黄土高原地区逐月温度植被干旱指数数据集
石磊,杨亮彦*,王昆,花东文,张猛,范鸿建,夏利恒
延河流域高分辨率光学卫星遥感影像耕地样本数据集(2022–2023)
石磊,王昆*,杨亮彦,何俐蓉,范鸿建,夏利恒
秦岭山地和关中平原交汇处大气中粉尘元素数据集(2022–2023一年期)
王锦,王启元*,冉伟康,李常艳
渭河盆地咸礼凸起南缘地下岩层特性数据集
胡建刚,郭佳鹏,罗龙平,姚晓亮*,丁雅丹,佘芳涛,张涛
2024年中国西北地区光伏板阵列空间数据集
魏亚宁,姚晓军*
3
黄河流域生态保护与高质量发展专题
2012–2020年黄河三角洲盐沼湿地生态系统碳通量观测数据集
魏思羽,初小静,张孝帅,宋维民,王晓杰,赵明亮,韩广轩*
4
青藏高原雪、冰和环境数据集专题
2023年青藏高原冰湖编目数据集
田志娟,姚晓军*,常辉,段红玉
5
中国生态系统研究网络(CERN)专题
2000–2020年广东鼎湖山森林土壤微量元素和重金属元素含量数据集
邓云轩,褚国伟,张倩媚*,张德强,俞梦笑,刘世忠,孟泽,李跃林,刘菊秀,闫俊华
2017–2023年西双版纳4种典型森林生态系统枯枝落叶层含水量数据集
罗艳*,秦海浪,赵蓉,邓云,陈辉,卢华正,林露湘
6
生态系统国家野外站历史数据整编专题
2013–2017年大兴安岭站兴安落叶松天然林碳水通量观测数据集
郝帅,张秋良*,王冰,张恒,宝乐尔其木格,王飞
7
“两山”理念专题
中国森林生态系统主要服务功能评估数据集
迮子涵,牛香*,王兵,宋庆丰,郭珂
8
农业信息高质量图谱数据专题
面向智慧果园机器视觉的不同成熟度毛桃果实图像数据集
陈万志*,姜衣彤,袁航,李壮,尹龙
2015–2023年大安市农膜覆盖农田遥感数据集
唱隽逸,杨倩*,陶锋,柴源,陈立文,肖扬
9
岩石显微图像专题
四川盆地西北部中泥盆统观雾山组岩石薄片显微图像数据集
周嘉桐,杨雪飞*,唐浩,廖子超,谢国锦,肖昌君,张绪鑫,葛银梅,黄韵竹
10
其他数据论文
高分辨率SAR车辆目标识别数据集
王威,张会强,范红旗*,吴中杰,回丙伟,刘天鹏,吴舒捷,项德良,卫朝富,马营兵
基于多源数据的青海省夏季地表水分布数据集(2019–2023)
冯心熠,肖正洁,夏兴生*,周强,陈琼,潘耀忠
三峡库区白家包滑坡观测库数据集
张国栋,陈烽领,李铮,卢书强*,张亚鑫,黄海峰*,易庆林
华南热带地区繁殖家燕(Hirundo rustica)种群的迁徙、繁殖及体征数据集
田丽,余建梅,郑铭鹏,陈柱坚,刘宇*,张正旺
内蒙古乌拉特梭梭林-蒙古野驴国家级自然保护区植被和土壤调查数据集(2021、2023)
李其顺,陈峰,苏俊,吕文兵,徐有杰,王景圆,王少昆*
广西山口红树林保护区无人机影像与人工修复典型要素监测数据集(2023–2024年)
漆首令,韦杰,赖泳锟,凌进新*,田琛琛
VGOS-INT-A强化型观测数据解算dUT1数据集(2024)
马慧斌*,江丹,秦文振,杨一,耿昌亮,马赟
适用于高效第一性原理计算的数值原子轨道数据
张文帅,林霈泽,陈默涵,何力新*
工程车EECU曲轴凸轮轴传感器激励信号数据集
杨旭,葛永琪*,郑兴建
矿井遮挡人员跟踪数据集
高丽铄,路洋*,董立红,叶鸥,韩冷雨,张立智,郗晨阳
面向OCR的满文古籍单词数据集
孙海鹏,陶文豪,毕晓君*
基于科技信息的多模态实体链接数据集SI-MEL
王芳,王少煌,胡明昊*,耿国桐,白晓颖*
维吾尔族大学生汉语普通话发音语料库
阿布都外力·阿力木,李冠宇*
吐蕃王朝时期青藏高原人口密度数据集
石雅楠,陈琼*,刘峰贵,周强,吴致蕾
胃肠镜息肉目标检测数据集
陈劭彬,陈佳辉*,陈宏伟,陈涛,陈昱澍,张静远
山西省某三甲医院心理门诊青少年心理健康多维评估及家庭环境数据集
焦璐,张达明*,崔俊强,牛怡,张云巧,崔佳彬,白晓瑛,霍璐瑶,牛亮,李一江,胡先明,陶塑,崔慧敏
新疆昌吉市冬小麦种植区10米分辨率分布数据集(2019–2025年)
曹良中,袁坚磊,方霞*,朱士华,涂作莹,侯晓杰,赵冬梅,陈曦
2012–2018年基于HP滤波法的西红柿批发价格波动统计数据集
孔汇鑫,韩昀,胡林,曹姗姗*,孔繁涛*
2012–2022年中国黄瓜批发市场交易价格调查统计数据集
安民,刘婷婷,孔繁涛,曹姗姗*,韩昀*
2011–2022年中国牛肉市场批发价格统计数据集
梁泽,刘婷婷,孔繁涛,曹姗姗*,孙伟*
2011–2022年全国生猪批发价格分析数据集
王亿,孔繁涛,满芮,孙伟*,古丽米拉•克孜尔别克*
2012–2018年北京市青椒批发市场交易价格调查统计数据集
胡啸琦,曹姗姗,安民,孔繁涛,孙伟*,刘婷婷*
2012–2022年北京市鸡蛋批发价格数据集
王亿,孙伟,卫培刚,孔繁涛*,古丽米拉•克孜尔别克*
2012–2020年云贵地区韭菜批发市场交易价格调查统计数据集
安民,孔繁涛,曹姗姗,孙伟*,刘继芳*