首页 理论教育 具体技术应用

具体技术应用

时间:2022-11-04 理论教育 版权反馈
【摘要】:SAP大数据技术体系在数据层包含三类数据源即结构性数据、半结构性数据和非结构性数据。而内存计算技术是SAP大数据重点关注的技术,内存计算能够支持在服务器的主内存中处理超大量的实时数据,从分析和交易中提供及时的结果。数据存储方面采用了自主研发的数据仓库和分布式文件系统相结合的方式。数据源的分类以数据用途进行分类体现了大数据的多样性;数据库存储技术方面将自身的数据仓库和分布式文件系统进行了结合。

微软大数据在数据源层微软结合自身特点将大数据分为结构化、非关系型和数据流三种类型。数据存储采用了传统自主研发关系数据库和Hadoop分布式文件系统存储相结合的方式,利用非关系数据库集群存储结构化的数据,利用Hadoop分布式文件系统存储非关系型数据。微软大数据的技术优势在于:数据源的分类涵盖大数据的各个方面;数据库存储技术能够存储各种不同类型的大数据,并且支持水平扩展;

Oracle大数据技术在数据层包含三类数据源即结构化、半结构化和非结构化。数据存储涵盖关系数据库、非关系数据库和分布式文件系统多方面来存储不同类型的大数据。其中数据库包含传统的关系数据库Oracle/MySql/Extradata以及非关系数据库Oracle NoSql DB/HBase;而文件系统包含本地文件和分布式文件系统HDFS。

SAP大数据技术体系在数据层包含三类数据源即结构性数据、半结构性数据和非结构性数据。数据存储包含数据库存储和文件存储两大部分,其中数据包含传统的关系数据库Sybase IQ、内存数据库SAP HANA和非关系数据库HIVE;而文件系统包含分布式文件系统HDFS。结构化数据存储于关系数据库,半结构化数据存储于非关系数据库而非结构化数据存储于分布式文件系统中。SAP大数据框架形成以SAP HANA为核心,以Sybase数据库为重要组成部分的统一整体。SAP HANA作为SAP的创新技术,将引领SAP在数据库领域的发展。随着大数据的发展企业会将明细数据导入内存,以提升商务智能应用的性能。而内存计算技术是SAP大数据重点关注的技术,内存计算能够支持在服务器的主内存中处理超大量的实时数据,从分析和交易中提供及时的结果。

Teradata大数据技术在数据源层包含六类数据源即网络日志和点击流数据、文本数据与多媒体、语音数据、移动数据、社交媒体数据和机器生成数据。数据存储包含数据库存储和文件存储两大部分,其中数据包含传统的关系数据库Teradata Dataware House;而文件系统包含分布式文件系统HDFS。在数据源层,Teradata与其他几家不同,它将大数据按照数据的用途进行了分类。数据存储方面采用了自主研发的数据仓库和分布式文件系统相结合的方式。数据源的分类以数据用途进行分类体现了大数据的多样性;数据库存储技术方面将自身的数据仓库和分布式文件系统进行了结合。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈