小天管理 发表于 2024年7月30日 发表于 2024年7月30日 一线大厂:字节、阿里、腾讯、快手、小红书等大模型创业公司:百川、零一、月之暗面、minimax 等地点:北京/上海 微信&电话:15210750729 邮箱: jxiao@hiringby.com 大模型算法专家 岗位职责 1.负责基于海量数据的 NLP/视觉/多模态大模型关键技术突破,研发面向计算基座的大模型。 2.深入调研和关注大模型/多模态等方向的前沿技术 职位要求 1.参与或者领导过大规模预训练模型落地项目。 2.对预训练大模型充满热情,信仰 AGI 。 3.有自然语言处理和多模态的研发背景,对搜索/对话/机器翻译/图像生成等相关领域有深入理解优先。 对齐算法工程师1.负责大模型对齐算法相关技术研究,不断提升模型逻辑推理、数学、指令跟随、代码、Planning 、多轮对话等能力;2.持续跟进业界最新的大模型对齐算法,参与大模型对齐算法的设计、训练、调优工作;职位要求1.硕士及以上学历,计算机、数学或统计学等相关专业,两年及以上 NLP 相关经验;2.熟练使用 pytorch/tensorflow 深度学习框架,熟练掌握 Transformer 框架;3.对 LLM 有深入理解和实践,有 SFT 、RLHF 相关经验者优先;4.较强的工程实现能力,熟练掌握 C/C++, JAVA,Python 等至少一种语言; 多模态算法工程师职位描述1.深入研究并探索视觉语言模型( VLM )、多模态大语言模型( MLLM )等尖端技术。跟踪多模态 AI 领域的最新技术动态,优化和改进现有技术和系统。2.研究多模态模型的训练范式,探索更高效的结合范式,并以此为基础发表高价值论文。3.探索多模态数据利用方式,对图文对, 图文交错等数据有更高效的使用方式。职位要求1.熟悉 Python, Linux, PyTorch 等深度学习必备知识,精通深度学习、机器学习、计算机视觉、自然语言处理的基本知识。2.有在 ICLR 、ICCV 、CVPR 、ECCV 、NeurIPS 、ICML 、TPAMI 、ACL 、EMNLP 等国际顶级会议和期刊上发表成果的优先。3.熟悉预训练算法的历史,熟悉对比学习,MAE 等大语言模型之前的预训练算法,有 Visual-Language Model 和大规模语言模型( LLMs )方面的经验者优先。4.熟悉 Flamingo, Llava, Fuyu 等多模态大模型的基本原理与优劣,熟悉 MMMU, MathVista 等多模态评测方式5.具备优秀的团队合作意识和沟通能力,出色的自我驱动和抗压能力,强烈的求知欲和技术热情,优秀的数据分析和逻辑思维能力。6.对多模态模型如何提升当前语言模型能力有独到的见解7.博士及以上学历(或者参与过出知名多模态项目的硕士)加分项1.在高影响力项目中做出过核心贡献者优先考虑。 视觉生成算法工程师职位描述1. 负责 AI 原生应用中的视觉内容生成模型等相关算法的研发和落地2. 负责跟踪前沿图像和视频方向生成的前沿技术,并调用落地到应用3. 参与多模态大模型的算法调研职位要求1. 硕士及以上学历,计算机科学、数学、人工智能等相关专业;2. 熟练掌握 Python/C++/Go 等编程语言之一,具备良好的编程习惯;3. 理解 Diffusion model ,Clip 等多模态/生成式模型原理,有实际实践经验者优先;4. 良好的团队协作能力,善于沟通和解决问题;5. 有相关领域论文发表或竞赛获奖者优先。 多模态语音算法工程师(语音合成 tts )职位描述1 、负责多模态大模型( Large Multimodality Model )的数据和模型开发。2 、负责 voice generation 、text to speech 、voice clone 模型的开发和产品应用。职位要求1 、本科及以上学历,计算机科学/计算机工程/电子信息技术等相关专业;2 、有自然语言处理、语音合成与识别、语音生成等研究或者技术背景优先;3 、具备扎实的机器学习、深度学习和自然语言处理的理论基础。熟悉至少一种主流深度学习框架(如 TensorFlow 或 PyTorch )4 、对主流的多模态语音大模型例如 VITS/VALL-E/LLAVA 等有深入的研究和理解。分布式训练工程师 职位职责: 1. 设计和实现超大规模语言模型的分布式训练算法,并提高训练效率和稳定性。 2. 优化模型结构,提高模型的精度和泛化能力。 3. 调优训练数据,提高模型训练效果。 4. 跟踪业界最新技术发展,探索新的训练算法和模型优化方法。 职位要求: 1. 精通分布式训练算法,具备超大规模模型训练的实际经验。 2. 精通深度学习算法,熟悉至少一种主流深度学习框架(例如 PyTorch 或 TensorFlow )。 3. 熟悉常用的模型结构和优化方法,例如 CNN 、RNN 、BERT 、GPT 等。 4. 熟悉数据调优和数据增强等相关技术。 5. 具备优秀的编程和算法能力,熟练使用 Python 和 C++ 等编程语言。 6. 具备良好的沟通能力和团队协作能力,能够与跨部门团队进行有效沟通和协作。 推理研发工程师 岗位职责: 1. 负责推理加速算法的研发和实现,包括但不限于模型剪枝、模型量化、模型蒸馏、模型压缩等。 2. 负责深度学习模型的量化和蒸馏,实现高效的模型压缩和部署,提高模型的运行效率和推理速度。 3. 负责 LLM 模型的端到端部署,包括但不限于推理引擎的开发、模型优化和压缩、模型部署的端到端流程设计等。 要求: 1. 具有深度学习推理加速和优化的经验,熟悉常见的加速技术,如剪枝、量化、分布式推理等,并能够根据不同场景和硬件平台进行针对性的优化。 2. 熟悉常见的模型量化技术,如低精度量化、动态量化等,并能够进行模型的量化优化。 3. 熟悉常见的深度学习框架,如 TensorFlow 、PyTorch 等,并能够根据业务需求进行算法实现和调试。 4. 熟悉 LLM 相关的算法技术以及推理加速方法。 5. 具备较强的团队合作和沟通能力,能够与团队成员、业务部门紧密协作,完成项目交付和技术创新。
已推荐帖子