首页 理论教育 回归数据块的写法和把数据输入数据文件

回归数据块的写法和把数据输入数据文件

时间:2022-02-13 理论教育 版权反馈
【摘要】:回归分析前,须将全部观测数据按一定格式规定,写成程序可接受的“数据块”。数字前写有“DATA”指令为数据行专用指令符号,凡向程序输入数据必须用该指令。无数据块特别结尾。后文的每个回归举例中都有各自的具体数据块,可将其与上面所讲写法对照阅读。实际的数据块在写入RD程序后,必须将其运行一次,数据才真正成为回归可用的数据;RD程序仅用于存放观测数据,回归计算另直接调程序RR。

回归分析前,须将全部观测数据按一定格式规定,写成程序可接受的“数据块”(不按规定格式,程序将不能接受数据)。回归观测数据在程序中的存储有两种情形。一是回归程序RR与数据程序RD分设,单独调用RD程序的情形,此时数据是打入RD程序内,RR程序不储存数据,是直接调用(调用规定后面说明);二是使用自身含有储存数据功能的回归程序REG,数据是直接打在其后部的DATA数据行内,符合一般程序储存数据的规定。本书下面的说明皆以使用分设的RR与RD的情形为准。

具体的回归数据块写法格式如下:

先确定4个量,按顺序分别为:问题的决策变量个数;数据组数;指标值列数和指标值测量绝对误差的一般估计值。前两个概念清楚,第三个指因变量个数。通常,因变量多为一个,列数写“1”(这里的“写”应理解为通过键盘打入程序),但也有对一组自变量数据取了多个指标值的情形,即多指标回归问题,多个时要如实顺序写出,后文有进一步举例说明。第四个数为取观测值时因变量值可能带入的一次测量(平均绝对)误差大小的估计值或经验误差大小(此处用δ表示,只取正值),用于从经验角度判断所得回归方程对过程拟合的可靠性,该值可实际测定,最好凭长期经验确定。此数据如尚未取得也可没有,此时须写 “0”,缺少则出错。

此4个数构成数据块首行,写为“RD□:DATA □,□,□,□”。其中“RD□”为规定的数据块行标号,“□” 处写一个数字,一般为顺序号,与“RD”一起连写。数据块间顺号允许不连续,也可不符合大小顺序要求,但不能重复,方便查找。行标号后要接写“:” 号。

实际调用数据块时,本书统一规定:数据块行标号含(顺序)数字时,为该数据块的隐蔽状态,不能调用;去掉顺号仅留下程序名主干RD,为其打开状态,可调用。一个程序处于打开状态的数据块只能有一个,否则运行中将出现“行标号重复”的错误。

数字前写有“DATA”指令为数据行专用指令符号,凡向程序输入数据必须用该指令。程序首行在DATA后顺序接写前面确定的四个数并间以逗号,但数据行的最后一个数之后不能写逗号(此普遍适用,不再说明)。例如写 “RD4:DATA 2,20,1,0.5”,表示该回归问题数据块的行标号定为“RD4”,有两个决策变量,20组数据,只有1个指标列,指标值带入的测定误差估计值平均为±0.5个测量单位(未取得此数据时此处需写“0”,不可缺少)。首行为回归参数行。将“RD4”中的“4”去掉,为该数据块的打开(可调用)状态。为方便数据块的打开与关闭操作,常在数据块首行后,用REM指令隐蔽一个该行的行标号数值,以便再隐蔽时参照。

一个数据块只设一个行标号,后面的行一律写为“DATA □,□,… ,□”形式,用于输入一组组观测值,自变量在前因变量在最后,其中每组数据前写有数据组号(少了不行),方便数据输入正确性检查,不参与回归计算。可每行写一组数据,变量个数少时每个DATA行很短,也可一行写多组数据(一组接一组写,不另加DATA)。数据行数无限制,写完为止。无数据块特别结尾。

后文的每个回归举例中都有各自的具体数据块,可将其与上面所讲写法对照阅读。实际的数据块在写入RD程序后,必须将其运行一次,数据才真正成为回归可用的数据;RD程序仅用于存放观测数据,回归计算另直接调程序RR。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈