数据,不仅是企业的生命线,而且掌控着我们日常生活的脉搏。因此,数据资产对于企业的重要性不言而喻,存储、管理和保护好这些数据是非常重要的。大数据时代的来临已经毋庸置疑,大数据很复杂,因为它的来源很复杂,从结构化数据到非结构化数据;大数据很复杂,因为它交付和使用的速度,例如实时;大数据很复杂,因为我们生成的信息量是惊人的。以前,我们的家用存储容量用MB和GB为单位,现在已经是TB,企业级更是用到了PB.

大数据的复杂性也带来了一系列风险和挑战。首先,如何理解和利用非结构化形式的大数据;其次,如何获取最重要的数据,并将其实时地交付给合适的人群;第三,如何保存这些数据,这其中就涉及到隐私性和安全性等诸多难题。

大数据所带来的潜在机遇不言而喻,但同时诸如数据隐私、监管和法律挑战等风险也需要企业提高警惕。在这个情况下,企业必须提升效率、优化性能和简化管理,才能更好地应对大数据所带来的风险和挑战。

然而,很多企业并没有做到这一点,例如很多企业没有制定一个合理的备份策略,导致数据量日积月累变得越来越庞大,冗余数据充斥着整个环境,既没有达到保护数据的初衷,反而带来更沉重的负担和潜在的存储风险。这时候,传统方法已经不再奏效甚至是诟病丛生,用户利用能够提高存储效率的同时、更好地完善备份和灾难恢复策略才能双管齐下地降低存储风险。

企业在IT预算有限的情况下,人力资源也是难以调配的,如果通过管理员手动进行优化和管理,不仅效率极低,如果没有周密的规划会耗费大量时间反而做无用功。因此,利用自动化的方式优化存储,通过软件的自动处理来取代可能耗费大量人工的工作是十分有必要的。

如果企业有很多应用,老旧的系统通常会给应用过量分配存储空间,而事实上很多容量是处于闲置状态的,因此应该根据实际需求分配容量才是高效率的做法。但是,让管理员时刻关注容量使用情况并且手动为应用分配存储空间显然是非常耗费时间和精力的,如果有自动精简配置这样技术就可以自动地分配存储空间,并且会在容量用尽之前自动提醒用户,避免影响业务的正常运转。

很多用户有需要频繁访问的“热点”数据和高IO的需求,一方面,人工识别热点数据即加重管理员的负担,又是需要相当周密的规划,另一方面,以前可能我们只是通过增加硬盘数量来提供高IO,但实际数据量并没有那么大,导致容量利用率甚至不足10%.自动分层技术通过软件自动处理和追踪数据访问频率,让我们可以将重要数据或者访问频繁的数据保存在高速存储介质中,访问频率较低的数据放在性能和成本也相对较低的介质中,提高了资产利用的同时降低管理成本。

对于磁盘备份用户来说,每完成一次备份,都会备份大量与之前相同的文件和数据,产生相同数据的多个副本,随着时间推移,冗余数据将充斥着宝贵的磁盘空间,这时候管理员手动定位和删除冗余数据显然是不切实际的,需要一种自动化的数据精简工具来减少需要备份的数据量。而且,不管是数据中心内部的备份,还是以容灾为目的的远程备份,都是需要占用大量带宽的,重复数据删除技术可以将新的备份数据与之前的备份数据进行对比,消除冗余数据,减少对以上两种传输的带宽需求,从而加快备份速度。

另一方面,不同价值的数据需要用不同价值的存储资源来保存,同时也应该有不同的数据保护等级。用户不能只顾着提高效率而忽略数据保护,实际上,在运用高效存储技术的同时也可以降低数据保护成本,反过来数据保护对于系统效率也是有促进作用的。因此,提高存储效率和降低数据风险这两者是需要紧密结合,可以同时实现并且相互作用的。

对于以上的自动化管理手段,并不是说用户采用了就可以高枕无忧了,风险意识应该贯穿于整个存储管理过程中。例如,使用自动精简配置和自动分层及虚拟化,但没有使用备份就不可能完全规避风险。在备份过程中,采用诸如重复数据删除等提高效率的方法,可以减少实际备份的数据量,高效地降低数据风险。

同样,在改善存储效率的环节,如果已经对数据所具备的价值进行了分析与区分,那么还将一些长期不用的数据保存在生产系统中的话,就是非常低效的做法,这时候应该适当考虑进行归档并实施数据保护,以便于日后的访问读取以及避免法律风险。这样既提供了保护,存储效率也得到了提升。

当下有很多企业用户,尤其是中小企业出于成本考虑选择云存储的方式。云存储是在云计算概念上延伸和发展出来的,不同之处在于云存储只是将数据保存在云中,如果部署的是通过互联网连接的公共云,那么带宽受限决定了云存储并不太适合于一些在线应用,但在数据备份方面大有用武之地。

对于广大中小企业来说,如果把备份数据和生产数据都放在一个数据中心内,如果发生地震等自然灾害的话就无法保证这些数据得到妥善保护,而且很多中小企业建不起容灾中心。相对来说,云存储提供了一种廉价的远程存储,用户可以将备份数据保存在云中,甚至作为一个远程容灾站点,既提供了异地保护,又不用花很多钱建造容灾中心,而且对于中小企业来说,这样做即使短时间出现中断而无法访问备份数据也是可以接受的,所以这种方式也是当前云存储一个比较广泛的应用。

相较而言,云计算则是指将数据和处理能力同时放在云中,用户只是远程调用一些计算结果。那些建不起机房的企业可以选择使用公共云提供商的云计算服务,或者使用自己的应用,配合网络中的服务器和存储。这样做虽然可以显著降低成本,但同样无法避免数据风险问题。

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2023-03-30 11:15:07
云资讯 分布式时代已至,数据如何更有价值?
无论是连通各大集群内大型超大型数据中心,还是连接边缘侧小型、边缘数据中心,分布式云计算都已成为这张算力网络最重要的支撑。在此背景下,云计算步入分布式时代。 <详情>
2023-03-01 19:27:00
市场情报 FlagOpen大模型技术开源体系,开启大模型时代“新Linux”生态
大数据+大算力+强算法=大模型”是当前人工智能发展的主要技术路径。语言大模型ChatGPT成为现象级应用,人工智能进入普及应用的新时期。 <详情>
2023-01-09 09:36:46
大数据资讯 我国互联网广告数据匿名实施服务正式上线
《指南》形成的“技术保障、评估规制、过程控制”的互信制衡机制,适用于各类互联网广告业务,包括广告投放、程序化交易、广告监测等应用场景下的数据匿名化处理。 <详情>
2022-12-30 10:10:19
大数据资讯 中国移动磐维数据库正式发布
未来,随着数据库功能和稳定性等进一步增强,磐维数据库将在中国移动内外部的广泛应用中积累更多复杂业务场景实践经验,进一步提升数据库产品的核心技术能力,助力数智化转 <详情>
2022-12-26 09:43:37
大数据资讯 贵阳大数据交易所年度交易额突破3.59亿元
据悉,下一步,阳大数据交易所将持续完善数据流通交易产业链,强化政策扶持和数据供给,构建数据流通交易市场体系,促进数据交易规范化、 市场化,推动数据要素实现有序流 <详情>