1、负责通用大模型、行业垂直大模型的全流程算法开发、迭代优化与落地应用,独立参与模型预训练、增量训练、微调、模型蒸馏、量化部署等核心开发工作。
2、聚焦大模型核心能力优化开发,针对上下文窗口拓展、长文本理解、逻辑推理能力升级、知识增强、多轮对话稳定性优化等方向开展技术研发,输出可落地的开发优化方案。
3、跟踪行业前沿大模型技术及论文成果,结合实际业务场景完成技术适配与二次开发,针对性解决模型幻觉、输出精度低、推理速度慢、落地适配性差等核心开发痛点问题。
4、负责大模型训练数据集的筛选、清洗、预处理工作,制定数据标注与优化规范,通过数据迭代优化模型训练效果,支撑模型版本持续升级。
1、本科及以上学历,计算机、人工智能、机器学习、自然语言处理、大数据等相关专业;
2、精通机器学习、深度学习基础理论,熟练掌握Transformer核心架构,深刻理解大模型预训练、微调、对齐等核心开发原理,具备扎实的大模型底层开发认知;
3、熟练使用PyTorch/TensorFlow主流开发框架,有LLaMA、Qwen、ChatGLM等开源大模型二次开发、改造、微调实战经验;
4、熟悉NLP核心基础任务,具备完整的大模型训练、微调、优化、落地上线全流程项目开发经验,可独立完成模型迭代优化;
5、具备扎实的数学基础和极强的逻辑思维,擅长攻坚大模型开发过程中的技术难题,自主学习能力、技术创新能力和工程落地能力突出。
6、有行业垂直大模型定制开发、模型轻量化部署、知识增强大模型落地项目经验者优先。
在求职过程中如果遇到扣押证件、收取押金、提供担保、强迫入股集资、解冻资金、诈骗传销、求职歧视、黑中介、人身攻击、恶意骚扰、恶意营销、虚假宣传或其他违法违规行为。请及时保留证据,立即向平台举报投诉,必要时可以报警、起诉,维护自己的合法权益。
