职位详情
岗位职责:
负责整合与维护多种生物数据资源,涵盖:
- 癌症相关数据:COSMIC中的突变信息、拷贝数变化及基因融合事件
- 蛋白质互作数据:酵母双杂交(Y2H)、质谱(MS)等实验产出结果
- 基因表达谱:GTEx提供的组织特异性表达图谱
- 药物研发数据:包含结合亲和力、药物重定位线索等相关信息
- 单细胞组学数据:Census数据库及其配套分析工具链
- 基因组变异数据:GWAS关联结果、GeneBass统计、变异功能注释等
设计高效的数据存储架构与组织逻辑,支撑快速查询及后续AI建模与统计分析的调用需求。
执行常规数据清洗、格式统一与标准化流程,保障数据完整性与可追溯性。
持续更新数据元信息记录(包括来源、版本、授权状态等),并落实访问权限与安全控制机制。
协同科研团队,提供数据管理支持与结构化解决方案。
职位要求:
具备生物信息学、遗传学、分子生物学或组学相关专业背景,了解主流生物数据类型及术语体系(如基因突变、表达矩阵、基因功能注释等)。
有实际处理科研级生物数据的经验(如癌症基因组、单细胞测序、基因组变异数据等),熟悉常用文件格式(CSV、TSV、JSON、Parquet等)。
掌握基础数据处理技能,能使用Python或Shell完成数据清洗、转换与导入等操作。
加分项:
具有数据湖或数据仓库平台应用经验(如Hadoop、Spark、Airflow等)。
熟悉至少一种数据库系统(PostgreSQL、MySQL、MongoDB、ClickHouse等),具备基本SQL能力与查询优化意识。
参与过科研级数据管理系统建设或大规模组学数据处理项目。
了解AI模型训练中对数据供给的要求,具备数据结构优化的认知。
负责整合与维护多种生物数据资源,涵盖:
- 癌症相关数据:COSMIC中的突变信息、拷贝数变化及基因融合事件
- 蛋白质互作数据:酵母双杂交(Y2H)、质谱(MS)等实验产出结果
- 基因表达谱:GTEx提供的组织特异性表达图谱
- 药物研发数据:包含结合亲和力、药物重定位线索等相关信息
- 单细胞组学数据:Census数据库及其配套分析工具链
- 基因组变异数据:GWAS关联结果、GeneBass统计、变异功能注释等
设计高效的数据存储架构与组织逻辑,支撑快速查询及后续AI建模与统计分析的调用需求。
执行常规数据清洗、格式统一与标准化流程,保障数据完整性与可追溯性。
持续更新数据元信息记录(包括来源、版本、授权状态等),并落实访问权限与安全控制机制。
协同科研团队,提供数据管理支持与结构化解决方案。
职位要求:
具备生物信息学、遗传学、分子生物学或组学相关专业背景,了解主流生物数据类型及术语体系(如基因突变、表达矩阵、基因功能注释等)。
有实际处理科研级生物数据的经验(如癌症基因组、单细胞测序、基因组变异数据等),熟悉常用文件格式(CSV、TSV、JSON、Parquet等)。
掌握基础数据处理技能,能使用Python或Shell完成数据清洗、转换与导入等操作。
加分项:
具有数据湖或数据仓库平台应用经验(如Hadoop、Spark、Airflow等)。
熟悉至少一种数据库系统(PostgreSQL、MySQL、MongoDB、ClickHouse等),具备基本SQL能力与查询优化意识。
参与过科研级数据管理系统建设或大规模组学数据处理项目。
了解AI模型训练中对数据供给的要求,具备数据结构优化的认知。
2026-05-17 14:59
IP属地:北京
职位福利
本科1-3年

北京医索科技有限公司
20-99人

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >







