岗位职责:
1、负责特定领域数据提取,主要为业务提供关键数据
2、负责大规模文本数据库处理,包括生文本预处理、过滤,语言模型生成,未登录词识别等,语料库维护
岗位要求:
1、自然语言处理方向研究或工作经验,如分词、词性标注、实体识别、情感分析;
2、熟悉NLP方向国际上的一些研究方向和热点;
3、熟悉机器学习算法,熟悉文本语义分析算法;熟悉中文分词标注、文本分类、语言模型、知识库挖掘等NLP相关算法;
4、精通python或Java,数据结构,良好的沟通和团队合作能力;
5、有NLP方向系统工作经验;从事过实际爬虫开发、内容提取工作经验者优先;