公民数据科学家的当务之急
近年来,数据科学民主化已成为跨行业的战斗口号,甚至在 Gartner 2020 年十大战略技术趋势中名列前三。广义上讲,它指的是迫切需要让企业内的业务用户、领域专家和其他非数据科学家能够在日常工作中利用数据科学的潜力。
全球数据科学家短缺是民主化论点的一个重要前提,但并非唯一前提。正如 HBR 文章所述,真正具有变革性的数据科学需要企业范围内的公民数据科学家团队——这些人使用高级分析,但没有必要的统计和分析经验——并可以使用自助工具,使他们能够每天识别和解决业务挑战。
多组学研究概况
目前,基因组学分析和研究几乎是纯粹的数据科学家所做的事情,这些专业技能对于整个价值链(从数据准备、集成和规范化到洞察提取)都是不可或缺的。
与多组学分析相关的大多 保加利亚手机数据 数数据都具有多样性,并且分布在特定领域的孤岛中。这使得数据采集成为一项只有熟练的数据科学家和生物信息学家才能完成的任务。
工具环境通常对于每种数据类型和领域都是唯一的,这意味着选择正确的分析工具集需要多年的经验和深入的专业知识。
最后,即使是基础流程,例如将新的基因组序列和子序列与现有数据库进行映射,也由数十年前的方法提供支持,例如动态规划算法和启发式算法。这些技术既不适合满足大数据时代对速度和可扩展性的要求,也没有反映促进公民数据科学家参与所需的通用可用性原则。
基因组学研究价值链的专业化需求不仅增加了研究项目的价值实现时间,而且还加剧了基因数据生成和数据分析之间原本很大的差距。
现在,可以通过重新构想整个组学研究过程,以公民数据科学家作为转变的焦点,充分解决这一问题。
如果这听起来像是学术上的重新发明,那么在 BioStrand,我们实际上已经证明了端到端自助式基因组学分析和研究解决方案的技术可行性和实际可行性,该解决方案可与经验丰富的数据科学家和公民数据科学家很好地配合使用。