数据备份和数据归档有许多不同点。首先,数据备份是将数据拷贝到顺序读写的介质上,而数据归档是将数据转移到速度稍微低一些的随机读写的介质上。数据备份一般都会保留多个副本,而数据归档通常通过重复数据删除或者CAS技术只保留一份。

两者另外一个很大的区别是,数据归档的重点是为文件提供索引和搜索功能,而数据备份则侧重于对备份策略或者备份后的镜像进行搜索。最后一个不同点是,备份的数据通常保存的时间比较短,主要是用在数据恢复的时候,而归档后的数据一般要保存很长一段时间,因为法律对此都有明文的规定。

大部分的数据归档软件都提供重复数据删除功能,常用的方式有以下几种:单实例存储,文件级别重复数据删除,块级别重复数据删除,内容地址存储算法等。在此之前,数据备份软件只能使用第三方的硬盘设备来完成重复数据删除。

而现在,一些著名的数据备份软件厂商如Comm Vault系统公司、EMC公司、IBM公司和赛门铁克公司在各自的备份软件中都实现了重复数据删除。这项功能的出现也消除了原先人们认为数据备份不支持单实例存储的说法。

数据备份软件另外一个新增的功能是:数据生命周期管理。原来单个的备份镜像受到时间的限制,而两层存储备份方式又受到应用的限制,所以现在大部分的备份软件都支持多层存储,这样就可以根据不同的目标,例如,服务级别,恢复时间目标,恢复点目标等来制定不同的备份策略。

将关键的应用程序备份到硬盘上,将一些不是很关键的应用程序备份到顺序读写的设备上。备份软件可以让数据根据各自的年龄在各层之间转移,这样在恢复数据时可以保证各层数据读写的连续性。不过,在这个过程中,它的操作对象的最小单元是整个备份的镜像,这一点跟数据归档是没法比的。(数据归档的生命周期管理是基于文件级别的)

由于两者本质的不同,数据归档软件中的有些功能是绝对不能用在数据备份软件中的,例如,在文件级别进行搜索或者建立索引。因为数据备份是基于镜像级别的,所以它根本不能对每个文件建立索引。不过,在运行电子发现程序或者搜索业务数据时所用的全文搜索跟上面的搜索是不一样的。

Comm  Vault公司的Simpana、IBM的Content Manager和赛门铁克公司的EnterpriseVault属于归档软件,不过它们在产品中都加入了数据备份的功能,例如搜索备份的数据等。搜索功能只适用于归档的数据,对备份的数据无效。数据归档的另外一个特性是可以随机读取。所有的归档都是在硬盘上运行的,并且是基于文件系统的。

相比之下,所有备份的数据都是顺序读写的(tar或者cpio)。这意味着,每次读取数据时,不管它的大小,备份都需要从头开始读取备份文件。这种方式不用考虑文件存放在何种介质上。

在备份时需要快速写入备份的文件中,在恢复时需要快速的读取备份的内容。而对单个文件修改或者搜索时,速度不一定快。数据归档的两个基本的特性:搜索功能和随机读写,是备份软件无法获取的。

数据备份由来已久并且引用了很多数据归档软件中的功能。由于它们的功能相互补充,数据备份和数据归档以后还会继续存在下去,而且不能彼此取代对方。

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2020-03-26 13:23:39
运维管理 运维人员如何建立有效的备份系统
什么是有效的备份系统?可以将不同的数据库用于不同的目的,并且备份系统的有效性也会相应变化。根据其功能,数据库可以分为测试数据库,生产数据库和核心数据库。 <详情>
2019-04-11 17:36:00
云技术 云端数据集成的五大技巧
与任何新技术一样,企业需要明确如何好地实施它,并以最快的价值获得大的投资回报率。企业最不希望的是投资被浪费,而有了这些最佳实践,企业就有了更多的机会使其投资产生 <详情>
2019-02-27 11:10:00
运维管理 网络运维工作是什么?
互联网运维工作,以服务为中心,以稳定、安全、高效为三个基本点,确保公司的互联网业务能够 7×24 小时为用户提供高质量的服务。 <详情>
2019-01-17 16:14:00
国际资讯 完全托管,AWS推出备份新服务
AWS宣布启用完全托管的备份新服务。这项新服务在云端和本地部署提供集中备份。 <详情>
2018-10-24 11:33:40
运维管理 搬迁!搬迁!小型机房搬迁要点大放送
通过分析,发现机房搬迁存在两个难点。一是搬迁风险大,许多设备早已过保修期且比较陈旧,因此设备安全性和数据安全性的保障显得尤为重要。二是对用户有较大的影响,机房迁 <详情>