产业发展数据

中小企业大数据解决之道

来源:51CTO  频道:信息化    发布时间:2012-06-08

    明确分析自己的需求,下面是几个常见的需求选项:

  > 数据类型,是结构化,半结构化,还是非结构化为主;

  > 数据大小,内部数据级别是TB级别、PB级别或者PB以上级别;

  > 读写量级,比如每小时写入的数据达到GB级别,或者每天写入达到TB级别等;

  > 读写比例,是写为主,还是以读为主;

  > 并发数,大致的每秒并发数;

  > 一致性,只接受强一致性,或者可以接受最终一致性和弱一致性;

  > 延迟度,最高能容忍的延迟度是多少,是10毫秒,100毫秒,还是可以1秒;

  > 分析的复杂度,需不需要引入较复杂的数据挖掘算法等。

  要灵活使用现有的工具,首先,推荐使用一些开源或者是可以承受的商业软件,虽然个人并不排斥自建,但是一定要有具体的商业价值,并且最好是在现有工具上的画龙点睛,而不是从头开始构建;其次,工具方面应与具体的场景相关,在不同的场景要使用不同的工具。

  尽量不要走平台思路,应以具体的应用和场景为主,因为建一个平台有很多附加的成本和设计,比如,Amazon的云平台是通过至少五年时间构建而成。特别是项目的初期,不建议走平台这个方向,而是应脚踏实地以具体的商业场景为主。

找准切入点,最好是找到一个技术难度小,并且有一定的商业价值的场景来做大数据技术落地的试点,并不断地进行测试和迭代来验证,而不是一味求复杂,求大,这样比较容易说服企业管理层来进行长期地投入和支持;

  最后,想和大家说一下,“罗马不是一天建成的”,无论是Google的用于大数据处理的基础设施,还是我们国内淘宝的“云梯”都是一步步通过不断积累和实践而成,所以我们这些中小企业应该贯彻“大处着眼、小处着手”的方针来持续地验证和推进。


责任编辑:韦加乐
                         
3 当前第3 上一页
123
下一页