
Xinzhiyuan报告编辑:Aeneas [Xinzhiyuan简介]西湖大学的一篇论文成功地领导了顶级科学,超过了其他四篇论文。它背后的秘密武器确实是这家中国公司的科学研究插件?在这场速度,计算能力和全球奥林匹克技术的竞争中,他们使用了150GB/s的快速存储,直接消耗了世界第一的数据!关于同一主题的5篇论文已提交科学,其中一篇是来自西湖大学的立场,相应的团队成为了世界上第一个成功的团队!在这一惊人的成功之后,这一奇妙的成功,除了科学研究人员的艰难力量外,计算能力方面的强大支持是密不可分的。那么,谁在这个团队的背后,让他们击败了无法被估计的全球领先同龄人呢?西湖大学的科学文章成为第一个,从西湖开始大学布局。在西湖大学,一开始的纪律布局实际上是在生物医学,物理,化学和工程上。这些学科对科学计算有很高的要求。因此,自2019年以来,学校已经开始在引入计算资源的引入方面投入过多。您应该知道,科学研究是一个强调“快速准确”的地方。例如,诸如冷冻电子显微镜之类的研究,世界都在相同的蛋白质结构中竞争。无论是哪个国家或实验室,最终结构几乎相同。它已经在奥林匹克竞赛中发展起来,该竞赛正在追求谁能更加准确。直到今天,存储Shugang已经对用户数据进行了系统的测试,并最终发现,组织某些存储技术可以将整个计算过程加速近30%。为了产生集群,存储处于重要位置。这是因为CPU和GPU节点可以继续进行更新,用新的GPU节点替换旧的CPU节点,然后用更新的更新图形卡替换旧的图形卡,以便视频内存可以扩展。基础存储系统应保持升级计算强度的速度。您应该知道,在大学中,仅在生物医学领域中可能有十几个甚至二十个研究小组,这些研究小组可以积累十二个数据。在这种情况下,很难轻松更新存储系统。此外,许多应用程序确实可以在单个CPU或GPU节点上运行,但是一旦达到了应用程序量表,总体性能就会降低。原因的很大一部分是存储带宽不足以运行小片段文件,因此存储状态对于在大学和大学建立集群非常重要。因此,Shuguang Storage对西湖大学的AI集群进行了重大升级,并提供了非常困难的StoragE解决方案:单个节点的带宽为150GB/s,是美国高级竞争对手的表现的4倍。单个设备仅覆盖机架空间的2U。在这个科学问题上,全世界有5个关于同一主题的提交,西湖大学的这篇文章不仅是第一项提交的,而且数据质量在观众中最高! Shuguang Storage创建了三个主要平台,即当今超级实用,为西湖大学创建了一个科学研究存储平台,例如人工智能和科学计算,以及用于冷数据档案的共享存储平台。在科学研究的各个领域,Shuguang存储表现出强大的实践能力。例如,科学科学情况(例如冷冻电子显微镜)对IOPS(每秒的输入和输出操作数量)的要求很高。还有一些数据流到业务情况,例如存储集群中的首次写作通过总和协议,然后通过服务器解析和处理书面数据。有,这对存储系统是一个巨大的挑战。 Shugang存储性能水平可以在AI计算节点中处理,以达到非常高的单流级别的带宽级别。在网站上客户的实际测试中,它仍然可以达到150GB/s。如今,这种带宽速度直接产生了迅速运行的科学研究数据,为科学研究提供了机会。这种速度也使该地区的客户感到惊讶。具体而言,西湖大学的存储shuguang商店之一是全闪存存储。就像存储人工智力簇的前线一样,它需要带来最大的负载并在良好的压力下,尤其是在多个节点上训练的情况下,这需要存储才能具有较高的IOPS。同时,Dawn还将有一个混音 - 弹药存储空间,为用户提供一些空间的扩展,然后让他们存储一些数据集S和中级结果值得节省。此外,在一般计算集群中,西湖大学还使用Shuguang存储来生产软件目录。尽管该软件目录没有作为人工智能集群的主要吞吐量,但群集的稳定操作也需要它。此外,存储Shugang还将产生大量存储,例如温度数据,例如科学研究档案数据,存储时间至少可能需要5年。当西湖大学选择一线存储时,该过程非常谨慎,因为它需要满足一些特殊指标。毕竟,簇性能仍然对口香糖仍然受到赞赏。不仅如此,Shuguang存储现在已经实施了大量的科学研究领域。除西湖大学外,它还还包括北欧农业大学,南中国技术大学的AI4S场景,Liangzhu实验室,紫色山BServatory和其他AI4S场景。在当今的AI浪潮中,科学研究行业也处于领先地位。真正支持这种AI趋势的是什么不仅是计算的强度,而且是经常被忽略但重要的链接 - 存储能力! AI科学研究的存储解决方案的困难是什么?通常,科学存储解决方案困难的主要原因有四个主要原因:1。数据非常复杂2。在AI模型和推动中,MGA对性能的要求非常高3。数据应用程序循环挑战挑战4。数据存储的成本太高。 Shuguang存储具有解决方案。首先,数据复杂性的挑战是,由AI应用程序设计的大多数数据类型非常复杂,包括无人居住的数据(文本,图像,音频和视频等),概述的数据(例如标记,与档案,数据库注释等相对应的表格,表格,表格等)。但是,空置数据的增长迅速,其比例正在增加。数据形式ATS和各种处理方法为存储带来了巨大的挑战。在这方面,Shuguang创建了一个分布式的全闪存存储parastor,该Parastor完全使用了高级存储功率组合的功能,它支持许多MGA访问访问协议,例如块,文件,对象,HDFS等,并且可以在没有格式的情况下转换。道路平稳,可防止数据复制到存储系统。这样,它可以轻松处理对象级对象数据和100个TB级文件数据。 AI培训性能的第二个挑战是,AI模型培训过程和理解需要处理大量数据,从而提高了存储系统的高性能要求。例如,在模型训练阶段,阅读速度和写作速度将直接影响训练周期。大多数传统存储系统都难以满足TB每秒的阅读和写作要求,并且无法与GPU的高速计算CA匹配功能,是闲置计算源并形成性能瓶颈的功能。同样,在理解阶段,存储的低延迟要求非常严格。 Shuguang的高性能全弹药库可以支持带宽190GB/s和500万IOPS的压纹智能型号的训练,这有助于从“每月模式”到“季节性模式”的模型培训的旋转。数据应用程序发行的挑战是由于数据共享机制不完整,区域,大学和部门之间的不清楚数据交易标准,并且很难确认权利。因此,迫切需要打破数据障碍并建立一个单一而有效的平台。因此,Shuguang创建了统一的数据资产视图,实现了跨域,跨站点和跨物质等复杂数据的全球纪念和实时更新;它还意识到数据目录的智能;它可以面对大规模文件,并可以实现在几秒钟内搜索10亿亿美元文件的能力,以及良好的数据搜索。数据存储问题AI构建成本大型应用存储模型很高,Shugang存储通过增加单位存储密度,更少的空间工作和更好的性能可大大降低成本。对于100 pb-eb级的超大AI基础架构,这是一个不错的选择。现在,根据CADI顾问的新发布的“中国分布式存储市场研究报告(2025)”,Shugang Storage拥有教育存储市场的总部分。此外,自从该报告发布以来,Shuguang Storage以前连续三年在市场共享中排名。 Shuguang Storage使用实际数据来确认,仅通过了解科学研究,我们就可以真正提供科学研究。将来,Shuguang团队肯定会使用更强大的数字基础将中国研究机翼送给中国人并在前一天到达世界领袖。
特别声明:上面的内容(包括照片或视频(如果有))已由“ NetEase”自助媒体平台的用户上传和发布。该平台仅提供信息存储服务。
注意:上面的内容(包括照片和视频(如果有))已由NetASE HAO用户上传和发布,该用户是柏拉图媒体表单,仅提供信息服务。