岗位职责
1、负责构建多模态的出行LLM,使用端到端的模型,将语音和图像数据直接输入到LLM中,让LLM在语音和图像的特征空间中进行建模,实现对语音和图像数据的识别和分类;
2、负责利用AIGC技术,收集和分析各种广告创意视频/图片数据,针对不同人群,生成比人工创意更好的视频,提高广告效果和转化率;
3、负责跟踪和评估算法的效果和性能,不断优化和改进算法,解决算法中存在的问题和挑战;
任职要求
1、优秀的分析问题和解决问题的能力,对解决具有挑战性问题充满激情。
2、非常期望自己能安安静静在AGI方面做一件厉害的事情。且已经在某些点上拿到了一些具体结果。
3、实际做过百亿参数以上超大模型的训练和优化。
4、或者,就是认为自己特别适合,能做好这件事情。
工作职责:
1、 承担基于GPT系列或者其他开源大模型的开发和调优工作,包括Pretrain,指令微调、Prompt工程以及面向下游任务的效果优化等
2、 完成大规模预训练模型在多种AI业务场景中的应用落地,支持业务目标提升
3、 紧跟业界大模型进展,探索前沿技术,包括LLM、SFT、强化学习等
4、 与其他团队密切合作,包括数据工程师、前后端工程师、产品经理等,实现高质量的产品和解决方案
任职要求:
1、 有大语言模型(LLM)预训练/微调经验,熟悉相关技术细节和优化策略,如大规模语料收集、模型调优优化、自弱监督学习、强化学习等
2、 具有扎实的算法理论基础,熟练掌握自然语言主要算法模型,如实体识别、知识抽取等。熟悉主流大模型,如ChatGPT/T5/PaLM/LLaMA/GLM/BaiChuan等,对模型背后的原理和各自适用场景有深入的理解
3、 有基于Tensorflow、PyTorch等深度学习框架的实战项目经验
4、 熟悉DeepSpeed或Megatron等框架的性能优化原理,了解其实现
5、 具备较强的团队协作能力和沟通能力,有较强的学习能力和业务分析及问题解决能力
6、 良好的paper阅读习惯和实现能力
加分项 :
1、 具有生成式模型训练及开发经验优先
2、 有海外留学背景者优先,博士优先
3、 有NLP、多模态研发背景,有智能对话、开放域对话机器人相关领域应用有深入理解的优先
4、 对大规模预训练语言模型技术现状和发展趋势有深刻的理解和认知,并对相关技术有极高的热情
5、 发表过大模型相关研究AI顶会论文优先
6、 具备有良好的代码开发能力,有开源项目开发经验优先