职位详情
岗位职责:
负责整合与管理多种类型的生物数据资源,包括:
-癌症相关数据:COSMIC数据库中的突变信息、拷贝数变异及基因融合事件
-蛋白质互作数据:酵母双杂交(Y2H)、质谱(MS)等实验产出的相互作用结果
-基因表达谱数据:GTEx项目提供的组织特异性表达水平数据
-药物研发数据:涵盖结合亲和力、药物重定位等相关信息
-单细胞测序数据:Census数据集及其配套分析工具链
-基因组变异数据:GWAS研究结果、GeneBass数据库、变异功能注释等
设计并实施高效的数据组织架构与存储策略,支撑快速检索及AI模型、统计分析等下游应用调用。
开展常规性数据清洗、格式转换与标准化处理,保障数据一致性与可追溯性。
持续维护数据元信息记录(如来源渠道、版本编号、授权许可)以及访问权限控制机制。
协同科研团队,提供数据管理技术支持与结构化解决方案。
职位要求:
具备生物信息学、遗传学、分子生物学或组学相关专业背景,掌握常见生物数据类型及专业术语(如基因突变、表达矩阵、基因功能注释等)。
具有实际处理生物科研数据的经验(如癌症基因组、单细胞转录组、基因组变异数据),熟悉主流数据文件格式(CSV、TSV、JSON、Parquet等)。
具备基础的数据处理能力,能使用Python或Shell完成数据清洗、格式转换、导入导出等操作。
加分项:
有数据湖或数据仓库平台使用经验(如Hadoop、Spark、Airflow等)。
掌握至少一种数据库系统(PostgreSQL、MySQL、MongoDB、ClickHouse等),具备基本查询与性能优化能力。
参与过科研级数据管理系统建设或大规模生物数据集处理项目。
了解AI模型训练过程中对数据供给的需求及数据结构优化方法。
负责整合与管理多种类型的生物数据资源,包括:
-癌症相关数据:COSMIC数据库中的突变信息、拷贝数变异及基因融合事件
-蛋白质互作数据:酵母双杂交(Y2H)、质谱(MS)等实验产出的相互作用结果
-基因表达谱数据:GTEx项目提供的组织特异性表达水平数据
-药物研发数据:涵盖结合亲和力、药物重定位等相关信息
-单细胞测序数据:Census数据集及其配套分析工具链
-基因组变异数据:GWAS研究结果、GeneBass数据库、变异功能注释等
设计并实施高效的数据组织架构与存储策略,支撑快速检索及AI模型、统计分析等下游应用调用。
开展常规性数据清洗、格式转换与标准化处理,保障数据一致性与可追溯性。
持续维护数据元信息记录(如来源渠道、版本编号、授权许可)以及访问权限控制机制。
协同科研团队,提供数据管理技术支持与结构化解决方案。
职位要求:
具备生物信息学、遗传学、分子生物学或组学相关专业背景,掌握常见生物数据类型及专业术语(如基因突变、表达矩阵、基因功能注释等)。
具有实际处理生物科研数据的经验(如癌症基因组、单细胞转录组、基因组变异数据),熟悉主流数据文件格式(CSV、TSV、JSON、Parquet等)。
具备基础的数据处理能力,能使用Python或Shell完成数据清洗、格式转换、导入导出等操作。
加分项:
有数据湖或数据仓库平台使用经验(如Hadoop、Spark、Airflow等)。
掌握至少一种数据库系统(PostgreSQL、MySQL、MongoDB、ClickHouse等),具备基本查询与性能优化能力。
参与过科研级数据管理系统建设或大规模生物数据集处理项目。
了解AI模型训练过程中对数据供给的需求及数据结构优化方法。
2026-05-15 12:12
IP属地:北京
职位福利
本科1-3年

北京医索科技有限公司
20-99人

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >








