职位详情
数据包括:
生物数据湖
- 癌症数据: COSMIC突变、拷贝数变异、基因融合
- 蛋白相互作用: 多种实验方法(Y2H, MS等)
- 基因表达: GTEx组织特异性表达
- 药物发现: 结合亲和力、药物重定位
- 单细胞数据: Census数据集和分析工具
- 基因组变异: GWAS, GeneBass, 变异注释
岗位职责:
负责生物数据湖数据库架构的构建与日常维护,兼容多模态数据类型(文本、表格、结构化/半结构化);
整合来自癌症研究、蛋白互作、基因表达、药物研发等领域的异构数据资源(如COSMIC、GTEx、GWAS等);
制定高效的数据存储策略,保障数据快速查询及对下游AI模型的稳定支持;
开发数据清洗、转换(ETL)流程及相关自动化导入脚本;
维护数据元信息体系(版本、来源、授权等)并实施权限管理机制;
持续进行性能调优,确保系统可扩展性与运行稳定性。
技能要求:
具备数据湖、数据仓库或大规模数据处理实践经验(如使用 Hadoop、Spark、Airflow 等工具);
熟悉常见生物数据类型及专业术语(如基因突变、表达矩阵、基因注释等);
有科研计算或科学数据治理经验者优先考虑。
加分项:
掌握主流数据库技术(如 PostgreSQL、MySQL、MongoDB、ClickHouse 等),具有独立完成数据库系统设计与部署的能力;
了解数据建模、索引优化、查询性能提升等核心技术;
熟练使用Python或Shell编写脚本,能够搭建可靠的数据接入与更新流程;
熟悉常用数据格式(CSV、TSV、JSON、Parquet)及其处理范式;
具备扎实的数据结构基础与系统架构设计能力。
生物数据湖
- 癌症数据: COSMIC突变、拷贝数变异、基因融合
- 蛋白相互作用: 多种实验方法(Y2H, MS等)
- 基因表达: GTEx组织特异性表达
- 药物发现: 结合亲和力、药物重定位
- 单细胞数据: Census数据集和分析工具
- 基因组变异: GWAS, GeneBass, 变异注释
岗位职责:
负责生物数据湖数据库架构的构建与日常维护,兼容多模态数据类型(文本、表格、结构化/半结构化);
整合来自癌症研究、蛋白互作、基因表达、药物研发等领域的异构数据资源(如COSMIC、GTEx、GWAS等);
制定高效的数据存储策略,保障数据快速查询及对下游AI模型的稳定支持;
开发数据清洗、转换(ETL)流程及相关自动化导入脚本;
维护数据元信息体系(版本、来源、授权等)并实施权限管理机制;
持续进行性能调优,确保系统可扩展性与运行稳定性。
技能要求:
具备数据湖、数据仓库或大规模数据处理实践经验(如使用 Hadoop、Spark、Airflow 等工具);
熟悉常见生物数据类型及专业术语(如基因突变、表达矩阵、基因注释等);
有科研计算或科学数据治理经验者优先考虑。
加分项:
掌握主流数据库技术(如 PostgreSQL、MySQL、MongoDB、ClickHouse 等),具有独立完成数据库系统设计与部署的能力;
了解数据建模、索引优化、查询性能提升等核心技术;
熟练使用Python或Shell编写脚本,能够搭建可靠的数据接入与更新流程;
熟悉常用数据格式(CSV、TSV、JSON、Parquet)及其处理范式;
具备扎实的数据结构基础与系统架构设计能力。
2026-05-17 14:24
IP属地:北京
职位福利
硕士1-3年要求实时数仓经验ETL开发经验数据建模经验MySQL/SQL Server非外包类计算机相关专业数据治理经验SQLShellHiveElasticsearchClickhouse

北京医索科技有限公司
20-99人

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
高级数据仓库开发工程师
3-3.5万元/月
数据仓库3-5年本科要求实时数仓经验ETL开发经验KafkaMySQL/SQL Server非外包类计算机相关专业FlinkSQLHiveBI报表开发经验Spark要求有数仓开发经验Python
北京 海淀区

张女士 · 联想弘扬5日内活跃
数据仓库开发工程师
1-1.5万元/月
数据仓库3-5年本科JavaScala数据建模经验其他计算机相关专业数据治理经验金融行业经验接受无实时数仓经验SQLHive外包类Spark要求有数仓开发经验数学/统计相关专业
北京 海淀区

邵女士 · 信加科技5日内活跃
数据仓库开发工程师
1-1.5万元/月
数据仓库3-5年本科JavaScala数据建模经验其他计算机相关专业数据治理经验金融行业经验接受无实时数仓经验SQLHive外包类Spark要求有数仓开发经验数学/统计相关专业
北京 海淀区

邵女士 · 信加科技5日内活跃
大数据治理工程师-外派
1.5-1.6万元/月
数据仓库3-5年本科要求实时数仓经验数据治理DAMA数据治理DCMM数据成熟度其他元数据要求有数仓开发经验数据治理经验数据挖掘
北京 海淀区







