对将非结构化数据转化为可操作的商业智能的美好前景感到兴奋?你需要做的第一步是创建一个可以处理PB级数据的存储架构。EMC Isilon的Nick Kirsch表示,横向扩展NAS(网络附加存储)是最佳解决方案,他还为首席信息官提供了用以判断横向扩展NAS的五个原则。
随着企业开始进军大数据世界——数字化纸张文件和保存电子邮件通信,Word文档、Excel文件和各种其他非结构化数据都可能转变成可操作的商业智能,不过企业首先需要解决一个大问题:存储。
“企业累积了越来越多的数据,信息量达到PB级,”EMC Isilon公司产品管理主管Nick Kirsch表示,“他们面临着类似的挑战:他们面对如此庞大的信息量,他们该如何利用?他们该如何将这些信息存储在可扩展的架构中?”
一种可能性是垂直扩展。垂直扩展也就是使用新的高容量设备替换你现有的存储设备,让你现有的存储节点变大变快,甚至更强大。以这种方式来加强存储基础设施很有吸引力,因为这种方式简化了管理,并减少了占地空间和电力消耗。但是这种方式并非没有问题:它不能简单地跨越多个地点,它没有很多固有的整体灵活性,并且大型高性能存储设备价格很昂贵,在处理不断增加的信息洪水时,大的问题就是现在的存储设备只有那么大。
“你可以建立越来越大的单一单元控制器,”Kirsch表示,“但是在某些时候,你不能够让系统变得更大,你必须添加第二个系统,最终你可能需要管理数百个独立单元。”
Kirsch表示,水平扩展(横向扩展)NAS是一个不错的选择。横向扩展NAS架构没有选择昂贵的高容量存储设备来作为存储元件组合到总存储池。横向扩展NAS并不是让节点变得更大,你按照需要来添加节点。这种方法的缺点就是你可能很快就会面临一个更为复杂的管理环境。但是这种方式可以跨越多个地点,并且有很大的固有灵活性。也许从管理大数据的角度来看,最重要的事情在于你能够快速地低成本地添加存储。
Kirsch表示:“当涉及存储时,人们大的抱怨就是真的很容易管理单个单元,但是当你有两个或者更多单元时,管理就变得很复杂。”
对于大数据,NAS是比SAN更好的选择,Kirsch表示,因为SAN并不是为非结构化数据和文件共享而建立的。为了与网络协议(例如NFS或者CIF/SMB)一起使用SAN,然而,你必须在SAN前面部署文件服务器,这会增加管理复杂性,并会影响可扩展性。