首页 励志故事 常用数据格式

常用数据格式

时间:2022-01-19 励志故事 版权反馈
【摘要】:本节仅介绍目前常用的一些地震数据格式。而数据以无格式文件存储,称为非数据库管理系统文件。ESSTF格式组合了ASCII码格式的头段信息和二进制格式的地震数据信息。头段信息放在数据段之前,包含事件发生时间。最有效地读取二进制数据是直接通过一个对ASCII格式数据有译码能力的存储缓冲器,进行无格式缓冲器读取。响应数据类型允许给出全部的响应作为一个响应组序列。
常用数据格式_地震学实习教程

§2.2 常用数据格式

地震数据的数据格式种类非常多,不同的数据格式用于不同的分析软件系统,而分析软件除了少数几种能够在多种计算机平台上工作外,通常都是只适用于某一种平台,因此,了解数据格式时必须注意其适用的计算机平台。本节仅介绍目前常用的一些地震数据格式。

1.AH

级别:2  平台:Unix

Ad Hoc(AH)格式是用于AH波形分析软件包的一种格式,这个软件包是由美国哥伦比亚大学莱蒙特-道荷提地球观测所(Lamont Doherty Earth Observatory)开发的。

2.CSS

级别:2,4  平台:Unix

地震研究中心(CSS,the Center for Seismic Studies)数据库管理系统(DBMS)是为了便于存储与检索“禁止核试验条约”的地震监测数据而设计的。地震数据分成两个类别:波形数据与参数数据。

参数数据的设计采用了关系数据库管理系统。信息被存储在二维图表中,就像在ISF格式中的一样。波形数据的索引与波形数据本身分开,保存在关系数据库中。而数据以无格式文件存储,称为非数据库管理系统文件。每个非数据库管理系统文件根据一个包含数据描述和数据文件在系统中的物理位置的信息进行索引。每一个波形段,包括一个台站中一个信道的数字采样。样本的开始时间、样本数和采样率都记录在一个索引中,此外,索引中还定义了所在的文件名、样本段在文件中的开始位置、台站和信道的名称,以及一个在特定频率的标定值。索引记录被保存在wfdisc中,每个wfdisc记录描述一个特定波形段,并包括一个id号来指定台站和使用仪器的详细信息。

3.GeoSig

级别:1  平台:PC

GeoSig记录器采用的二进制格式。此格式包括一个头段和多元数据。

4.Guralp格式

级别:1  平台:PC

Guralp记录器采用的格式。

5.ESSTF二进制

级别:1  平台:所有平台

ESSTF是欧洲标准地震磁带格式(The European Standard Seismic Tape Format),曾经被SAS-58000数据采集系统用作文件系统的构架。ESSTF格式组合了ASCII码格式的头段信息和二进制格式的地震数据信息。头段信息放在数据段之前,包含事件发生时间。每个数据段包含一个ASCII格式的48字符的头段(信道号、时间等)。所有的信道在一个文件中以多元形式存储。数据按帧的形式组织,每帧包含500个数据点。最有效地读取二进制数据是直接通过一个对ASCII格式数据有译码能力的存储缓冲器,进行无格式缓冲器读取。

6.GSE

级别:3  平台:所有平台

GSE格式是联合国裁军计划GSFTT广泛采用的格式。GSE2.1现在被改名为IMS1.0,是最新的版本。手册可以从http:∥www.orfeus knmi.nl/manuals/provisional_GSE2.1.ps或International Monitoring System上下载。

一个GSE2.1波形数据文件包括一个波形鉴定行(WID2),随后的是台站行(STA2),然后是波形信息本身(DAT2),最后是对每个DAT2段数据的检查行(CHK2)。默认行长度为132个字节,每行字符长度不超过1024个字节。响应数据类型允许给出全部的响应作为一个响应组序列。响应描述必须加上CAL2鉴定,以及一个或多个PAZ2、GEN2、DIG2和FIR2任何阶的响应节。

波形鉴定行WID2的内容包括:第一个数据样本的日期和时间;台站、信道和辅助代码;数据的子格式、样本数和采样率;在标定周期内,每个数字计数的仪器标定(以毫微米为单位);仪器型号、水平向和垂直向。

STA2行包括台网标识、台站的纬度和经度、参考坐标系统、高程和爆破深度。

DAT2后的数据段可以是GSE2.1波形格式认可的六种不同子格式之一:INT,CM6,CM8,AUT,AU6和AU8。INT是一种简单的ASCII子格式,“CM”子格式是压缩数据,“AU”子格式是鉴定数据。所有这些格式数据都以整数表示,可以通过电子邮件发送。

在GSE2.1格式中必须提供CHK2。检查值是在转换整数值为任何子格式之前计算出来的。

7.IRIS拨号扩展ASCII

级别:1  平台:所有平台

IRIS拨号数据检索系统能够从IRIS的GSN台站查找、显示和写数据。这些台站都配置了拨号能力。利用不同的在线命令,数字波形能够被写为ASCII格式及扩展ASCII格式,例如,“V”变量和“F”固定记录长度。这些文件包含两种类型的记录:头段记录(每个文件一个)和数据记录。头段记录包括台站和仪器信息、数据记录的开始时间和样本数。数据记录包含记录数、8个样本值和一个检验值。这种格式为每一个台站的每个分向配置了一个单独的文件。

8.ISAM-PITSA

级别:2,4  平台:Unix

检索顺序存储方法(ISAM)是为了易于存取数据而设计的一个商业数据库文件系统。PITSA对数字波形数据利用检索顺序存储方法(ISAM)是基于它的内部文件结构。这个结构经常被认为是ISAM格式,但不要把它与潜在的数据库引擎混淆。一个ISAM-PITSA文件系统包括两个含有头段和所有信道索引信息的数据库文件,并且每个信道最少有一个信道文件。信道文件是一个浮点数二进制文件,原则上浮点数据能够被独立地读取。所有在ISAM-PITSA文件系统中的文件有相同的基本文件名。数据库文件扩展名是“.nx0”和“.dt”,信道文件扩展名是“.001”,“.002”。

9.Ismes

级别:1  平台;PC

意大利Ismes记录器所用的格式。

10.Kinemetrics格式

级别:1  平台:PC

Kinemetrics有几个二进制格式,其中两个主要的格式是为DataSeis记录器和K2分级记录器的格式。

11.Lennartz

级别:1  平台:PC

Lennartz记录器所用的格式。最普通的是Mars88格式,还有一种格式是老磁带记录器片的格式。

12.Nanometrics

级别:1  平台:PC

Nanometrics记录器所用的格式。最普通的是Y格式。

13.NEIC ORFEUS

级别:2  平台:PC

NEIC ORFEUS的程序SONICl能够搜索、显示、书写来自NEIC地震数字数据CDROMs(NEIC波形目录,1991)的数据。ASCII格式的数字波形数据包括两种类型的记录:头段记录和数据记录。头段记录包含台站信息、数据的开始时间、采样率、传递函数的参数。数据记录包含从CD-ROM读取的数据。数据记录中每个数据记录之前有数据点总数。要想得到更多信息,请参考NEIC ORFEUS SONEC软件磁盘的文件。

14.PDAS

级别:1  平台:PC

Geotech PDAS记录器所用的格式。这种格式除了记录器输出外还有更多的用处,有把整个数据转换成PDAS的例子。

15.PITSA二进制

级别:2,3  平台:PC和UNIX

这种格式完全是PITSA的内部数据描述的二进制映像,没有ISAM格式的数据库头段。二进制格式的另一个优点是它能够非常容易地通过各平台来交换数据文件。用户仅需要为任何所需的字节交换提供代码。

每个文件包括一个短的头段文件,随后是每个通道的数据块。它们都是二进制文件。头段文件包括:

(1)NCHANNELS:一个在文件中包含通道数的长整数。

(2)SIZE[]:一个表示通道的尺度的长整数矩阵。每个SIZE[i]元素包含第i块数据的块大小,以字节为单位。第i块的块大小,意思是第i块数据的头段大小加上第i块数据本身的大小。

(3)BLOCK[i],对于NCHANNELS来说,i=1是指每个结果记录一块。每块包括数据头段的二进制映像(如data.h文件里所述),随后是波形数据的二进制映像。

公共地震台网格式

16.SAC

级别:2  平台:Unix

SAC(Seismic Analysis Code)是一个研究时间序列的交互式分析软件,是目前国际地震学界最流行的供地震学家和工程师应用的数字信号处理和分析软件之一,具有信号校正、数据质量控制、走时分析、频谱分析、台阵和台站三分向波形数据分析等功能。其采用的SAC数据格式成为地震数据处理软件使用最广泛的数据文件格式。一个地震台站记录的一个分向的数据,形成SAC数据文件。每个数据文件包含一个头段,用来说明这个文件的内容(例如,数据点个数、文件类型等)。SAC分析软件只在Unix平台上运行,文件的一般格式是二进制,目前已有能够运行于任何平台的ASCII版本。

17.SEED

级别:3  平台:所有的平台

地震数据交换标准格式(SEED)主要是为了交换非压缩的波形数据。1987年,联合数字地震台网(FDSN)采用SEED作为它的标准格式。IRIS也采用了SEED格式,并把它作为数据的主要格式。SEED应用四种类型的控制头段:

(1)卷标识符头段;

(2)缩写字典头段;

(3)台站头段;

(4)时间间隔头段。

控制头段中的数据域是格式化的ASCII格式,但数据域(在记录数据中)主要是格式化的二进制格式。在SEED参考手册中可找到全面的描述。

一些现代的数据采集系统(例如Quanterra,Nanometrics)只产生SEED数据卷(miniSEED),而没有任何控制头段信息。从miniSEED卷到SEED数据卷需要利用软件工具进行转换,目前已有很多这样的转换软件(如SeedStuff)。

18.SEISAN

级别:2  平台:所有平台

SEISAN二进制格式是地震分析软件SEISAN所采用的格式(http:∥www.ifjf.uib.no/ seismo/software/seisan.html),这个程序由挪威Bergen大学固体地球物理学院开发。格式包括描述所有信道的主要头段。每个信道又有一个含有响应等基础信息的信道头段紧跟其后。SEISAN软件能够读取任何平台的二进制SEISAN文件。SEISAN分析系统还能够处理GSE格式的数据。

19.SeisGram ASCII和二进制

级别:2  平台:PC

时间序列以连续的格式化ASCII文件或连续的二进制文件形式存储。SeisGram软件(Lee,1991)还可以利用BDSN随机存储格式读取固定记录长度的文件。不论是ASCII数据文件还是二进制数据文件都包括以下头段信息:文件类型、数据格式、台网、台站和仪器标识、记录类型、日期、事件号、Y分向的方位、每个样本的时间单位、采样率、振幅单位、每个数字计算的振幅单位、开始时间、样本总数、事件和数据注释、时间序列处理历史

ASCII文件将以“顺序存取,格式化”的格式选项打开。除了开始时间以外的所有头段个数,都是每行被写成一个单个的值。二进制文件主要是为了压缩和快速存取而设计,二进制文件以“顺序存取,二进制”格式选项打开。SeisGram的随机存储数据文件是为了存储来自BDSN台网的大量二进制随机存储数据。文件中的数据与来自遥测系统数据流中的数据是一致的,除了一个额外的8记录头段来唯一地识别记录源、开始时间和格式。随机存储文件可按“随机存储,二进制”格式选项打开。

20.Sismalp

级别:1  平台:PC

Sismalp是一种法国数据地震记录系统广泛采用的格式。

21.Sprengnether

级别:1  平台:PC

Sprengnether记录器所应用的格式。

22.SUDS

级别:1,2,4  平台:PC

SUDS是地震统一数据系统(The Seismic Unified Data System)。SUDS格式既可用于记录也可用于分析,并且独立于任何特殊设备厂商。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈