人机交互的数据库搭建过程
截至数据库发布当天,徐明团队用7个月时间得到了4132个单元过程数据。“超过某些国际知名数据库10年的数据搜集量。”徐明说。
效率之所以高,是因为团队利用国内AI基础模型,开发了专门适用天工数据库建设的大语言模型应用工具,在数据库搭建过程中实现人机交互。
AI提升数据检索效率。徐明团队成员、清华大学环境学院助理研究员齐剑川以对二氧化碳的检索举例说:“如果没有大语言模型应用工具,团队在检索二氧化碳时,可能需要输入‘二氧化碳’‘CO2’‘carbon dioxide’等其不同语言和形式的名称,才能检索完备。而在大语言模型工具的帮助下,我们只需输入上述名称中的任何一个,就能把想找的所有内容检索出来,大幅提升了效率。”
AI提升数据检验效率。徐明介绍,每名团队专家按照预先制定的标准搜集数据后,会有另外两名专家对数据质量进行交叉检验。同时,大语言模型应用工具作为第三名“专家”可查找出其检验能力范围内的问题。
齐剑川表示,大语言模型应用工具可以将团队成员搜集的单元过程数据自动转换成搭建数据库所需的ILCD数据格式,进一步提升数据库建设效率。
“我们还在不断升级大语言模型应用,扩展人机交互边界,目标是把重复性、机械性的劳动都交给机器来做,让团队专家专注于贡献增量知识。”齐剑川说。
本`文-内.容.来.自:中`国^碳`排*放*交^易^网 ta np ai fan g.com
产品碳足迹不以排放主体而以产品为抓手来衡量减排水平
【版权声明】本网为公益类网站,本网站刊载的所有内容,均已署名来源和作者,仅供访问者个人学习、研究或欣赏之用,如有侵权请权利人予以告知,本站将立即做删除处理(QQ:51999076)。