文章详情

专注互联网科技,赋能企业数字化发展

DeepSeek招聘算法研发:网页内容理解与抽取

作者:DeepSeek招聘算法研发:网页内容理解与抽取

简历投递邮箱:yao.xu@deepseek.com 【DL研发-姓名-联系方式】 社招、校招、实习 均可投递!实习需要onsite不短于6个月 职位描述: 1. 设计研发面向AGI的网页理解与抽取算法,完成网页全维度内容理解,实现对文本、图片等网页核心内容精准提取,为大模型训练、RAG检索、结构化信息提取等场景提供核心技术支撑。 2. 设计agent驱动的网页抽取自动化处理流程,覆盖通用正文、特定字段结构化抽取全场景,搭建数据标注、效果评测、模型迭代的自动化闭环。 3. 结合大模型训练、推理的实际需求,优化抽取内容的语义完整性与信息密度,探索适配大模型场景的网页理解与抽取技术方案。 4. 持续跟踪LLM、信息抽取、agent领域的前沿技术与顶级会议成果,完成技术验证与落地,持续迭代核心算法。 任职要求: 1. 精通深度学习核心算法,熟悉主流预训练模型与大模型训练流程,有信息抽取、多模态内容理解相关的研发实践。 2. 具备极强的工程编码能力,熟练掌握Python 和主流深度学习框架,能独立完成算法设计、模型训练到落地的完整工作。 3. 熟悉HTML与DOM树结构,对网页多模态内容理解与抽取有深入的实践与思考,能精准把握核心优化方向。 4. 对技术有极致的追求与强烈的自驱力,主动探索领域前沿方向;熟悉 agent 技术体系并有实际落地使用经验、在 NLP/AI 相关顶级会议以第一作者发表过相关论文者优先。 #算法 #大模型 #数据科学 #信息抽取 #向量检索 #信息检索 #多模态内容理解 #内推 #deepseek #深度学习

返回新闻列表