职位详情
期望到岗时间:
2025-07-14
紧急程度:
正常
岗位要求:
1.计算机相关专业大专及以上学历,3年以上开发工作经验,熟练掌握Linux系统编程知识;
2.具备强烈的技术热情,良好的学习能力,分析问题及解决问题能力,热爱编程、善于合作、责任心强、乐于分享;
3.后台技术扎实,熟练掌握一门编程语言(C++/Go),有内容解析研发经验者优先;
4.具备AI应用开发使用经验者优先;
5.良好的团队合作精神,能够高效解决技术难题并推动项目进展。
岗位职责:
1、基础解析:
1.1、应用核心解析技术(如HTML/DOM解析、XPath、CSSSelectors、正则表达式等)精准、高效地提取页面中结构化或半结构化的基础数据字段(如标题、正文、价格、发布时间、作者、来源等)。
2、实现定制化网页解析逻辑:
2.1、根据特定项目需求,理解、设计并实现复杂的或项目独有的解析规则。
2.2、能够根据需求变化,快速、准确地调整和优化解析策略。
3、维护解析规则的稳定性和持续性:
3.1主动监控负责的解析任务运行状态和数据质量。
3.2及时发现并修复因目标网站结构变更、布局调整、反爬策略更新等导致的解析失败或数据提取错误问题。
3.3确保长期运行的解析任务稳定可靠,数据输出持续有效。
4、清洗、验证及初步格式化数据:
4.1、对提取到的原始数据进行必要的清洗处理(如去除无关空白、特殊字符、错误编码、重复信息)。
4.2、校验数据的准确性、完整性、格式一致性,识别并标记或修复明显的数据异常或缺失。
4.3、将数据转换并格式化为约定好的输出结构(md等),确保下游系统或分析可以无缝使用。
5、处理异常与日志记录:
5.1、识别并分类解析过程中遇到的各种异常情况(如网络超时、页面不存在、请求被封禁、预期元素缺失等)。
5.2、实现详细的日志记录,清晰记录任务运行过程、遇到的错误及其原因、修复措施等,便于问题追踪、复现和报告。
6.、编写与维护解析任务文档:
6.1、清晰记录负责的每个解析任务的技术细节,包括目标网站信息、解析逻辑说明、使用的工具/脚本、关键XPath/CSS规则、配置参数、运行频率等。
6.2、保持文档的准确性和时效性,确保任务的可理解性、可维护性及顺利交接。
7、有LLM的使用经验,可以使用LLM优化已有的流程效率和解析效果。
8、负责解析准召的分析和提升,能够分析case并给出优化方案并落地执行,持续优化解析的效果
2025-07-14
紧急程度:
正常
岗位要求:
1.计算机相关专业大专及以上学历,3年以上开发工作经验,熟练掌握Linux系统编程知识;
2.具备强烈的技术热情,良好的学习能力,分析问题及解决问题能力,热爱编程、善于合作、责任心强、乐于分享;
3.后台技术扎实,熟练掌握一门编程语言(C++/Go),有内容解析研发经验者优先;
4.具备AI应用开发使用经验者优先;
5.良好的团队合作精神,能够高效解决技术难题并推动项目进展。
岗位职责:
1、基础解析:
1.1、应用核心解析技术(如HTML/DOM解析、XPath、CSSSelectors、正则表达式等)精准、高效地提取页面中结构化或半结构化的基础数据字段(如标题、正文、价格、发布时间、作者、来源等)。
2、实现定制化网页解析逻辑:
2.1、根据特定项目需求,理解、设计并实现复杂的或项目独有的解析规则。
2.2、能够根据需求变化,快速、准确地调整和优化解析策略。
3、维护解析规则的稳定性和持续性:
3.1主动监控负责的解析任务运行状态和数据质量。
3.2及时发现并修复因目标网站结构变更、布局调整、反爬策略更新等导致的解析失败或数据提取错误问题。
3.3确保长期运行的解析任务稳定可靠,数据输出持续有效。
4、清洗、验证及初步格式化数据:
4.1、对提取到的原始数据进行必要的清洗处理(如去除无关空白、特殊字符、错误编码、重复信息)。
4.2、校验数据的准确性、完整性、格式一致性,识别并标记或修复明显的数据异常或缺失。
4.3、将数据转换并格式化为约定好的输出结构(md等),确保下游系统或分析可以无缝使用。
5、处理异常与日志记录:
5.1、识别并分类解析过程中遇到的各种异常情况(如网络超时、页面不存在、请求被封禁、预期元素缺失等)。
5.2、实现详细的日志记录,清晰记录任务运行过程、遇到的错误及其原因、修复措施等,便于问题追踪、复现和报告。
6.、编写与维护解析任务文档:
6.1、清晰记录负责的每个解析任务的技术细节,包括目标网站信息、解析逻辑说明、使用的工具/脚本、关键XPath/CSS规则、配置参数、运行频率等。
6.2、保持文档的准确性和时效性,确保任务的可理解性、可维护性及顺利交接。
7、有LLM的使用经验,可以使用LLM优化已有的流程效率和解析效果。
8、负责解析准召的分析和提升,能够分析case并给出优化方案并落地执行,持续优化解析的效果
2026-05-15 13:22
IP属地:广东深圳
职位福利
大专3-5年GolangC++AI应用开发

中电金信软件有限公司
不需要融资 · 10000人以上

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
后端开发-Golang(需现场面试)
9000-14000元/月
Golang1-3年大专DockerMySQLGolang服务端开发经验计算机相关专业GinPython
深圳 宝安区

杨先生 · 深圳恒鼎尚科技5日内活跃










