岗位职责:
1、主导面向自然语言处理(NLP)大模型、多模态融合模型(包含计算机视觉、语音处理与自然语言处理的结合)、语音降噪和增强算法等方向的前沿应用技术研究。重点探索深度学习技术在语音降噪和增强中的应用,特别是在复杂噪声环境下提升语音信号质量,为语音识别和方言识别等后续应用提供高质量输入。
2、深入研究自然语言处理中的方言识别技术,利用深度学习模型(如Transformer架构)和大规模方言语料库,开发高效的方言识别系统,支持多种中国方言的准确识别和转换,推动方言保护与应用的创新。
3、研究计算机视觉领域的目标检测、图像分割、视频分析等技术,结合自然语言处理能力,实现图像内容的精准描述与理解,以及视频中关键信息的提取与语义化表达,推动多模态数据融合的创新应用。
4、结合政务服务、企业办公、工业生产等垂直领域,构建基于自然语言处理大模型与深度学习算法的行业知识库系统。在计算机视觉方面,优化图像、视频等视觉数据的处理流程,包括特征提取、数据标注等,为知识图谱构建提供丰富的视觉信息;在语音处理方面,完善语音数据的降噪、增强与转录,特别是针对中国方言的语音数据,确保语音知识的准确入库。
5、优化知识图谱构建过程中的深度学习算法,提高知识关联的准确性与知识更新的及时性;利用深度学习模型优化向量存储与检索效率,实现多模态数据(文本、图像、语音,包括方言语音)的快速检索;基于自然语言处理技术动态生成精准的提示词,支持多场景企业级知识库的高精度问答与内容生成。
6、跟踪自然语言处理、计算机视觉、语音处理(包括方言识别)、深度学习等领域的国际技术演进,关注最新的算法突破、模型架构创新、应用场景拓展等信息,如Transformer架构在自然语言处理和方言识别中的新变体、语音降噪的深度学习新方法等,推动团队技术视野的持续扩展。
任职要求:
1、博士学位,计算机科学、人工智能、自然语言处理、计算机视觉、语音信号处理或相关领域。编程基础扎实,熟悉掌握但不限于C/C++/Python/Java等编程语言中的一种或数种。
2、熟练掌握具备深度学习与机器学习能力:精通深度学习框架(如TensorFlow、PyTorch)和机器学习算法,具备丰富的模型设计、训练和调优经验;熟悉Transformer架构及其在自然语言处理和方言识别中的应用。
3、熟练掌握自然语言处理(NLP)能力:深入理解自然语言处理的核心技术,包括文本预处理、词嵌入、序列标注、机器翻译、文本生成等;具备开发和优化NLP模型的经验,特别是在方言识别和语音识别方面。
4、具备计算机视觉处理算法经验优先:熟练掌握计算机视觉技术,包括目标检测、图像分割、视频分析等;有将计算机视觉与自然语言处理相结合的经验,能够实现图像内容的精准描述与理解。
5、具备语音处理算法经验优化:熟悉语音信号处理的基本原理和方法,包括语音降噪、语音增强、语音识别等;有处理复杂噪声环境下的语音信号的经验,能够提升语音信号质量以支持后续应用。
6、具备多模态数据融合经验优先:有将计算机视觉、语音处理和自然语言处理相结合的经验,能够实现多模态数据的有效融合和创新应用。
7、具备知识图谱与知识库经验优先:熟悉知识图谱的构建和优化,能够利用深度学习算法提高知识关联的准确性和知识更新的及时性;有构建和优化企业级知识库的经验,能够实现多模态数据的快速检索和高精度问答。
8、具备跨学科沟通能力,能够将复杂技术问题转化为业务价值,并与产品、市场团队高效协作;具备自我驱动与抗压能力及独立开展研究的能力,能够提出具有行业前瞻性的技术方向并推动落地。