人才画像项目Pro


  • 简介
  • 目录大纲
  • 最新文档

    读取au_af信息补充

    待整合进项目文档中 ``` 专利采用: 发明人及申请人字段 发明人对应au 申请人对应af 注意申请人为模糊匹配 采用SCOD库 注意其特殊性 期刊采用: 作者及作者单位字段 作者对应au 作者单位对应af 注意作者单位为模糊匹配 采用CFLQ库 标准采用: 起草人及起草单位 起草人对应au 起草单位af 注意起草单位为模糊匹配 采用...……

    zhy@@ldy - 2023年1月8日 21:30


    问题汇总

    前期 问题一:作者次序问题 问题二:全部 *** 数量(去重) 问题三:署名次序 问题四:撤回文件怎么处理 待咨询: “全部合作作者总数量/成果总数” -- 成果还是所有的文献? “署名次序总和/成果总数” -- 是否合适? “人才画像建模的系统设计” -- 需不需要深入到每一篇文章(摘要)来分析语句特征? (自然语言)处理模型(选择) “其中各基础数据表中的主题须从标题、摘要...……

    cdcdcd - 2023年1月6日 18:39


    项目文档_v0.1

    项目概览 我们这个项目分为两大部分: (一):数据收集和分析: 使用爬虫从知网爬取相关数据(已认证人才的发文,包括“期刊”、“会议”、“专利”、“标准”、“成果”等信息); 并将数据池清洗整理,包括自然语言处理等方法 (二):构建人才画像:使用第一步的数据集进行训练(采用适当的模型),训练得出人才认定标准 作者:小A、小B 作者单位:A大、B大 文献类别:甲、乙、丙、丁、戊 例如:...……

    cdcdcd - 2023年1月6日 18:36



    cdcdcd , zhy@@ldy , zhytest1
    稳定的ai助手