10.22 基于NLP的商务文本数据清洗关键技术研究项目招标公告

从中国电力集采招标网(www.dljczb.com)了解到:中国水利电力物资集团有限公司基于NLP的商务文本数据清洗关键技术研究项目招标公告

项目名称:基于NLP的商务文本数据清洗关键技术研究项目招标-2019年11月中国水利电力物资集团有限公司项目

招标编号:CWEME-1910ZSWZ-2J039

招 标 人:中国水利电力物资集团有限公司

招标方式:国内公开招标

所属地区:北京

所属行业:能源电力受中国水利电力物资集团有限公司的委托,就基于 NLP 的商务文本数据清洗关键技术研究项目招标-2019 年 11 月中国水利电力物资集团有限公司项目进行国内公开招标,欢迎满足资质要求的单位参加。

项目简介:

中国水利电力物资集团有限公司(以下简称“物资集团”)是中国大唐集团公司全资子公司,注册资本10.12亿元。主要经营招标代理、进出口代理、管道及油料供应、工程技术咨询、备品配件、设备监理、工程物资管理、碳资产开发、安全性评价、煤化工综合服务、电子商务等业务。

本项目结合物资公司关于从海量文档中提取有价值信息的现实需求,以物资公司历年积累的商务文本数据作为研究对象,内部数据包括采购计划、物资采购、工程建设、合同履约、供应商和用户综合管理数据,结合外部环境数据包括行业已购买的第三方商务通用供应商数据,通过研究机器学习和知识图谱的文档预处理,文本分类(聚类)、抽取、清洗、转换、存储和推理等数据处理关键技术,采集文本中蕴含的潜在相关因素,发现主要原因和次要原因,寻找普遍的模式和规律等(如计划规划分析、价格趋势、设备参数、供应商行为分析、用户采购行为分析以及风险预警等)的方法与技术,并开发相应原型系统。具体研究需求包括:

1.1文本数据挖掘关键理论与技术研究

基于机器学习的海量文档预处理方法研究

文本分类与聚类方法研究

基于机器学习的文本信息抽取方法研究

基于知识图谱的文档知识存储和推理研究

1.2商务文本数据清洗原型系统开发

实现商务文档的清洗、分析功能。提供对文本的词频、词云分析,且提供至少两种以上算法供选择,并能比较不同算法的效果;能自动生成文本的结构树、摘要;提供核心词汇的权值分布分析功能。

商务文件内容的关联查询。通过知识图谱技术的应用,实现文本内容的关联查询,即自动将相关信息推荐给用户。

1.3商务文本数据挖掘原型系统实证测试

商务文本数据挖掘原型系统实证测试:基于物资公司的商务文本数据对原型系统进行实证测试。

1.4研究成果交付

项目形成的研究报告

基于NLP的商务文本数据清洗关键技术研究报告

项目形成的论文(级别、数量、时间)

项目研究周期内发表学术论文不不低于1篇(EI检索或中文核心)

项目形成的专利(级别、数量、时间)项目研究周期内申请国家发明专利不低于1项

项目形成的原型系统

开发基于NLP的商务文本数据清洗原型系统,技术成熟度达到TRL4。

项目形成的测试报告原型系统的测试报告

项目研究过程中形成的其他技术文档

其他包括但不限于系统概要设计、详细设计、汇报材料和测试报告、成果评审等相关文档材料。

招标范围:

中国水利电力物资集团有限公司“基于NLP的商务文本数据清洗关键技术研

究”项目招标。

具体工作内容以招标文件为准。


分享到:


相關文章: