早在16世纪,近代人体解剖学创始人安德烈·维萨里在其著作《人体结构》中首次描述了人体的骨骼、肌肉、血管和神经的自然形态和分布。这一伟大成果使维萨里成为与哥白尼并列的两大科学革命代表人物,也让医学和人体生物学从此摆脱中世纪神权桎梏,步入科学轨道。
以此为起点,医学研究一路向着更微观的世界挺近,在历经发明显微镜,发现细菌,发现抗生素等数个里程碑之后,来到了以基因图谱和分子式为研究对象,将人工智能(AI)和机器学习(ML)作为研究工具的精准医学时代。
相比于维萨里要靠盗尸来获得研究“数据”的窘境,如今已游走于分子维度的精准医学却要应对数据爆炸带来的难题。身处分秒不停的数据洪流之中,医疗与生命科学行业对IT基础设施的核心需求之一就是以较低成本获得庞大且可弹性扩缩的存储空间。这种需求也开启了医疗与生命科学行业数据的上云之旅。
(资料图片)
亚马逊云科技基于医疗与生命科学行业客户的需求不断创新,不但让他们获得云上高性价比的弹性存储空间,并针对存储服务不断创新以支持他们大规模的数据计算,达成“存”与“用”的性能协同。
如何满足医疗与生命科学行业海量数据的存储需求,并降低存储成本?
数据量的爆炸性增长在医疗与生命科学领域尤为显著。例如在药物发现领域,科学家已发现的自然界里有可能成为药物分子的个数有1060之多,相比之下,整个太阳系原子个数也只是1050左右。即便是数据指数效应相对较弱的医院和诊所,在国内也面对一年数十亿人次诊疗所沉积的数字化档案及医学影像。
如何存储海量数据并不断降低存储成本是医疗和生命科学领域亟需解决的一大挑战。而无论从可靠性还是经济性,亚马逊云科技的存储服务都为医疗和生命科学机构存放海量数据提供了可靠的选择。
其中,对象存储服务Amazon Simple Storage Service (Amazon S3)设计具有99.999999999%(11个9)的持久性,具有安全、可扩展和按需付费等特性,可轻松完成PB至EB级数据的存储。为了更经济、高效地存储客户的数据,亚马逊云科技持续对 Amazon S3进行创新。例如,Amazon S3的存储层级多达8级,让客户可根据工作负载对数据访问、恢复能力和成本等方面的需求来进行选择;Amazon S3智能分层( Intelligent-Tiering )在不影响性能的前提下,能够在数据访问模式发生变化时自动节省存储成本。自2018年推出 Amazon S3 Intelligent-Tiering 以来,客户使用该功能已经节省了 10 亿美元。
医疗与生命科学行业大规模、高并发的数据计算需要高性能的存储服务
海量数据为基因诊断、基因治疗、靶向药物研发等奠定了精准医学发展的基础,而大规模的数据计算则推进精准医学的发展。例如单次数据分析所涉及的样本数量可能超过数万或数十万,可能需调用底层成百上千甚至上万个计算实例,这对存储数据的存储服务提出更高的数据吞吐性能要求。
为了确保存储服务性能足以支持大规模、高并发计算集群的要求,亚马逊云科技提供了一项完全托管式的文件存储服务Amazon FSx for Lustre,为高性能计算工作负载提供经济高效、高性能且可扩展的支持。Amazon FSx for Lustre可将文件系统连接至多个Amazon S3存储桶,无缝访问Amazon S3中的数据,优化计算资源的吞吐量。同时Amazon FSx for Lustre与亚马逊云科技的计算服务高度集成,可提供亚毫秒级延迟、高达每秒数百GB吞吐量和数百万的IOPS,能够同时给上千台运行PB级数据复杂分析工作负载的计算实例提供支持,并且将分析结果的数据同步回写至Amazon S3中。
对于医疗与生命科学行业所涉及的大规模计算工作负载,Amazon FSx for Lustre相当于在对象存储与计算集群之间加入了高性能缓存层,为存储、计算两端实现高效率的双向数据同步;并且用户无需在设置和管理Lustre文件系统上花费精力,就能够获得充足的算力支持和更短的计算周期,并节省人力与计算成本。
位于上海的肿瘤精准医学企业桐树基因,采用二代高通量测序技术进行肿瘤基因检测,单个样本可以产生108至109的短序列片段,每个序列片段又约是150个基因碱基长度,单个样本的文件大小可达10GB到30GB。随着业务发展和样本量增长,桐树基因选择迁移至亚马逊云科技以解决对存储、I/O和算力的要求。此后,桐树科技一方面获得Amazon S3的高性价比存储服务,另一方面也借助Amazon FSx for Lustre 为基因测序流程提供高性能共享文件存储,使单个样本分析时间缩短30-40分钟,批量样本分析整体用时较过去节省达三分之二。
亚马逊云科技丰富的存储服务,满足医疗与生命科学行业的多样化需求
在医疗与生命科学行业,相对于初创企业从业务之初即原生上云,也有不少机构需要将本地数据存储向云上迁移。对此,亚马逊云科技不断丰富“专门构建”的Amazon FSx文件存储系列服务,帮助用户在迁移时无需重构应用,就能继续使用熟悉的文件管理系统。
除了Amazon FSx for Lustre,Amazon FSx文件存储系列服务还包括Amazon FSx for Windows File Server,基于开源OpenZFS文件系统构建的Amazon FSx for OpenZFS,以及Amazon FSx for NetApp ONTAP。例如,对于使用NetApp ONTAP文件存储在线下构建了自己的数据管理和应用的医疗与生命科学行业用户。这些企业在数据存储迁移上云时,可使用Amazon FSx for NetApp ONTAP,无需修改其应用和数据管理方式,即可将部署在本地数据中心的网络文件存储(NAS)设备上的应用迁移至亚马逊云科技,继续使用自己熟悉的方式在云端部署、管理应用和数据,同时获得FSx for NetApp ONTAP与亚马逊云科技其它云服务之间的无缝集成。
亚马逊云科技安全的数据保护功能,助力医疗与生命科学行业快速创新
此外,亚马逊云科技的所有存储服务都具有多重安全功能,并已通过权威的国际和本地技术测评与认证,遵守严格的国际和本地合规原则。同时,亚马逊云科技还提供丰富的数据保护功能,实现关键数据的备份、容灾、一站式管理和快速恢复,包括对不同应用和数据源的一站式数据备份,跨区域远程复制服务,以及多种数据快速恢复功能。亚马逊云科技安全及丰富的数据保护功能,让医疗与生命科学客户可以更轻松满足行业本身更高的安全与合规要求,将精力聚焦于业务创新上。
借助亚马逊云科技提供的存储服务,医疗与生命科学行业客户无论是海量数据存储,还是进行基因研究、药物分子筛选等大规模的数据计算,都能获得更优成本、卓越性能,以及满足细分场景需求的多样化解决方案,快速驱动业务的创新发展。