数据,不仅是企业的生命线,而且掌控着我们日常生活的脉搏。因此,数据资产对于企业的重要性不言而喻,存储、管理和保护好这些数据是非常重要的。大数据时代的来临已经毋庸置疑,Gartner曾总结了大数据的“3V”特点,即大量(Volume)、多样性(Variety)和速度(Velocity),这也是早期阶段企业处理大数据所面临的三大挑战。

大数据很复杂,因为它的来源很复杂,从结构化数据到非结构化数据;大数据很复杂,因为它交付和使用的速度,例如实时;大数据很复杂,因为我们生成的信息量是惊人的。以前,我们的家用存储容量用MB和GB为单位,现在已经是TB,企业级更是用到了PB.

大数据的复杂性也带来了一系列风险和挑战。首先,如何理解和利用非结构化形式的大数据;其次,如何获取最重要的数据,并将其实时地交付给合适的人群;第三,如何保存这些数据,这其中就涉及到隐私性和安全性等诸多难题。

大数据所带来的潜在机遇不言而喻,但同时诸如数据隐私、监管和法律挑战等风险也需要企业提高警惕。在这个情况下,企业必须提升效率、优化性能和简化管理,才能更好地应对大数据所带来的风险和挑战。

然而,很多企业并没有做到这一点,例如很多企业没有制定一个合理的备份策略,导致数据量日积月累变得越来越庞大,冗余数据充斥着整个环境,既没有达到保护数据的初衷,反而带来更沉重的负担和潜在的存储风险。这时候,传统方法已经不再奏效甚至是诟病丛生,用户利用能够提高存储效率的同时、更好地完善备份和灾难恢复策略才能双管齐下地降低存储风险。

企业在IT预算有限的情况下,人力资源也是难以调配的,如果通过管理员手动进行优化和管理,不仅效率极低,如果没有周密的规划会耗费大量时间反而做无用功。因此,利用自动化的方式优化存储,通过软件的自动处理来取代可能耗费大量人工的工作是十分有必要的。

如果企业有很多应用,老旧的系统通常会给应用过量分配存储空间,而事实上很多容量是处于闲置状态的,因此应该根据实际需求分配容量才是高效率的做法。但是,让管理员时刻关注容量使用情况并且手动为应用分配存储空间显然是非常耗费时间和精力的,如果有自动精简配置这样技术就可以自动地分配存储空间,并且会在容量用尽之前自动提醒用户,避免影响业务的正常运转。

很多用户有需要频繁访问的“热点”数据和高IO的需求,一方面,人工识别热点数据即加重管理员的负担,又是需要相当周密的规划,另一方面,以前可能我们只是通过增加硬盘数量来提供高IO,但实际数据量并没有那么大,导致容量利用率甚至不足10%.自动分层技术通过软件自动处理和追踪数据访问频率,让我们可以将重要数据或者访问频繁的数据保存在高速存储介质中,访问频率较低的数据放在性能和成本也相对较低的介质中,提高了资产利用的同时降低管理成本。

对于磁盘备份用户来说,每完成一次备份,都会备份大量与之前相同的文件和数据,产生相同数据的多个副本,随着时间推移,冗余数据将充斥着宝贵的磁盘空间,这时候管理员手动定位和删除冗余数据显然是不切实际的,需要一种自动化的数据精简工具来减少需要备份的数据量。而且,不管是数据中心内部的备份,还是以容灾为目的的远程备份,都是需要占用大量带宽的,重复数据删除技术可以将新的备份数据与之前的备份数据进行对比,消除冗余数据,减少对以上两种传输的带宽需求,从而加快备份速度。

另一方面,不同价值的数据需要用不同价值的存储资源来保存,同时也应该有不同的数据保护等级。用户不能只顾着提高效率而忽略数据保护,实际上,在运用高效存储技术的同时也可以降低数据保护成本,反过来数据保护对于系统效率也是有促进作用的。因此,提高存储效率和降低数据风险这两者是需要紧密结合,可以同时实现并且相互作用的。

同样,在改善存储效率的环节,如果已经对数据所具备的价值进行了分析与区分,那么还将一些长期不用的数据保存在生产系统中的话,就是非常低效的做法,这时候应该适当考虑进行归档并实施数据保护,以便于日后的访问读取以及避免法律风险。这样既提供了保护,存储效率也得到了提升。

当下有很多企业用户,尤其是中小企业出于成本考虑选择云存储的方式。云存储是在云计算概念上延伸和发展出来的,不同之处在于云存储只是将数据保存在云中,如果部署的是通过互联网连接的公共云,那么带宽受限决定了云存储并不太适合于一些在线应用,但在数据备份方面大有用武之地。

对于广大中小企业来说,如果把备份数据和生产数据都放在一个数据中心内,如果发生地震等自然灾害的话就无法保证这些数据得到妥善保护,而且很多中小企业建不起容灾中心。相对来说,云存储提供了一种廉价的远程存储,用户可以将备份数据保存在云中,甚至作为一个远程容灾站点,既提供了异地保护,又不用花很多钱建造容灾中心,而且对于中小企业来说,这样做即使短时间出现中断而无法访问备份数据也是可以接受的,所以这种方式也是当前云存储一个比较广泛的应用。

相较而言,云计算则是指将数据和处理能力同时放在云中,用户只是远程调用一些计算结果。那些建不起机房的企业可以选择使用公共云提供商的云计算服务,或者使用自己的应用,配合网络中的服务器和存储。这样做虽然可以显著降低成本,但同样无法避免数据风险问题。

随着数据越来越重要,哪些数据都不能丢,哪些数据需要快速访问,这都是需要判别和优化的。在云计算和大数据时代,即使是Amazon这样专门做IT服务的厂商都会遭遇数据风险问题,广大用户就更应该加以重视,尽可能地优化自己的架构,在提高效率的同时规避风险。控风险能力越强,遭遇意外的可能性就越小。

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2022-04-14 15:44:09
市场情报 2022分布式存储线上峰会成功举行,驱动中国数据要素市场发展
4月14日,“2022分布式存储线上峰会”成功举行。本次峰会由百易传媒(DOIT)与厦门大学信息学院联合主办,中国计算机学会信息存储专委会、中国计算机行业协会信息存储与安 <详情>