每天,北京,8月14日(记者Yang XI),州议会信息办公室将举行一系列新闻发布会主题,以在“第14五个计划”期间介绍数字中国的建设和开发。国家数据局国家发展与改革委员会的成员刘·列和州在会议上说,作为人工智能的三个主要要素之一,数据在促进“人工智能 +”,尤其是高质量数据集的构建方面发挥了关键作用。 Liu Liehong提出,在人工智能期间,令牌(单词元素)是文本处理的最小数据单元,因为每个人在Internet期间都称其为“流量”。在2024年初,我国家的平均太阳消费量为1000亿。到今年6月底,代币的平均阳光消费超过300万亿,一年半内增加了300次以上,这反映了人工使用人工智能的人工应用快速增长。 Liu Liehong强调,我国人工智能的快速发展与我国对数据工作的高度关注密切相关。我的国家是第一个将数据用作劳动力因素的国家,并采取许多步骤来促进数据资源的开发和使用。在“人工智能+”行动进行的情况下,高质量数据集的构建和进步将进行。我的国家努力地促进了高质量数据的供应,向高质量集数据的构建发布了相关文件,并共同促进了许多部门的相关活动。 Liu Liehong提出,到今年6月底,我的国家建造了超过35,000个质量的数据集,总数量超过400%(1pb可以存储近5亿张照片,高度定义为2MB,总价值为400%,是数字国家的总数近140倍国家图书馆的Al图书馆)。人工智能模型的实践还鼓励了对数据交易需求的增加。到今年6月底,不同地区的高质量数据集的综合量约为40亿元人民币,数据贸易机构列出的高质量数据集的总规模达到246%。以北京数字交易所为例,MGA质量数据集的总交易比例从去年的10%跃升至今天的近80%。上海,天津,安海(Anhui)和其他领域提交了新的模型,例如“数据语料库估值和投资”,商业指南,将优质数据集转换为股权并投资于相关业务。同时,高质量数据集的开发需要支持数据标签行业。奠定了七个数据标记基础,包括成都,雪阳和Hefei,以帮助建立高质量的数据集。 “在下一步中,我们将继续建立H通过系统的布局进行IGE质量数据集,并加速了主要领域的数据高地的创建,例如具体智能,低空经济和生物制造。我们还将维护整个Lipunan,以提高对数据元素的价值的认识,加快数据量数据的创建,并培养市场同意以付款以付费高数据数据。刘·莉汉说。