岗位职责
1.模型研究与选型
深入研究国内外大语言模型的技术发展趋势,结合项目特性和业务需求,精准评估并筛选适配的模型和算法,为项目提供技术支持。
2.开发实践与落地
根据公司项目要求,灵活运用大模型API接口,完成从开发到实现的完整流程,确保方案的功能性和落地效果。
3.数据处理
精细清洗和处理用于大语言模型训练的数据集,严谨分析数据的可用性和数据质量。持续优化数据管控流程,提供高质量的数据支持,确保模型训练效果达到行业领先水平。
4.本地知识库构建与维护
运用RAG(Retrieval-Augmented Generation)相关技术,解析和整合公司内部文档,构建高效、可扩展的本地知识库,为企业知识管理和智能化应用提供技术支撑。
5.团队协作
与团队成员保持高效沟通,积极参与技术讨论,攻克关键技术难题。
职位要求
1.硕士及以上学历,人工智能/计算机/自动化/通信电子等相关专业;
2.编程基础扎实,掌握Python/shell等,熟悉常用训练框架和主流开源基座大模型;
3.具备NLP技术基础,熟悉常见的NLP任务如文本分类、文本匹配、文本生成、序列标注等;
4.具有良好的团队合作意识、学习能力及英文文献阅读能力,性格开朗,善于沟通。