基于时间序列分析及Clementine软件的宝钢股价研究.doc
《基于时间序列分析及Clementine软件的宝钢股价研究.doc》由会员分享,可在线阅读,更多相关《基于时间序列分析及Clementine软件的宝钢股价研究.doc(48页珍藏版)》请在沃文网上搜索。
1、摘 要时间序列是按照时间顺序取得的一系列观测值,现实中的很多数据都是以时间序列的形式出现的:一个工厂每月生产的一系列货物数量,每周道路事故的一系列数据,每小时观察的药品生产产量。时间序列的例子在一些领域中是极丰富的,诸如经济,商业,工程等。时间序列分析典型的一个本质特征就是相邻观测值之间的依赖性。时间序列观测值之间的这种依赖特征具有重要的现实意义。时间序列分析所论及的就是对这种依赖性进行分析的技巧。要求对时间序列数据生成随机动态模型,并将这种模型用于重要的应用领域。本文的主要内容是借助SPSS Clementine 软件研究宝山钢铁股票价格随时间的变化规律,并用时间序列分析的有关知识对其进行建
2、模预测。本文分两部分:第一部分介绍时间序列分析的一些基本概念,如平稳过程、自相关函数、偏相关函数、白噪声等,然后对几种时间序列模型进行描述;另一部分借助SPSS Clementine 软件对宝山钢铁股价这一具体事例分别用专家建模、指数平滑建模和ARIMA建模并对股价进行短期预测,最后通过模型参数比较及预测值误差对比,找出最佳模型。在给案例建模的同时,将给出使用SPSS Clementine软件研究的具体过程。关键词:时间序列;SPSS Clementine软件;宝钢股价;模型比较AbstractThe time series is a sequence of observations take
3、n sequentially in time. Many sets of data appear as time series in reality: a monthly sequence of the quantity of goods shipped from a factory, a weekly series of the number of traffic accidents, hourly observations made on the yield of a chemical process, and so on. Examples of time series abound i
4、n such fields as economics, business, engineering and so on. The nature of this dependenced among observations of a time series is of considerable practical interest. Time series analysis is concerned with techniques for the analysis of this dependence. This requires the development of stochastic an
5、d dynamic models for time series data and the use of such models in important areas of application.The main task of this dissertation is to have a research on the law of the varying number of the stock price of the Baoshan iron and steel company. In this study, we will make the use of the software S
6、PSS Clementine and create the models of the stock price by using the time series analysis. To begin with, this dissertation briefly introduces some basic concepts such as stationery process, autocorrelation function partial correlation functions and white noise about the time series analysis. In add
7、ition, this dissertation begins to talk in detail about several fundamental time series models and the properties of the ACF and PACF belonging to the four fundamental models. Then, with the help of the software SPSS Clementine, we will establish models by three measures on the times series of the s
8、tock price and forecast short-term price. Finally, the model parameters and predictive value of the price should be compared to identify the best model. In the case, the dissertation offers the process of the software modeling in detail.Key words: the time series analysis; SPSS Clementine software;
9、Baoshan iron and steel company stock price; model comparison 目 录第1章 绪论11.1 时间序列的概念11.2 时间序列的应用11.3 本文的主要内容及安排2第2章 基本概念32.1 随机过程32.2 自协方差和自相关系数42.3 偏自相关函数52.4 白噪声过程72.5 均值、自协方差和自相关的估计82.5.1 样本均值82.5.2 样本自协方差函数92.5.3 样本自相关函数112.5.4 样本偏自相关函数122.6 本章小结13第3章 时间序列模型及Clementine软件介绍143.1 指数平滑模型143.1.1 基本公式1
10、43.1.2 指数平滑标准143.2 ARIMA模型153.2.1 自回归过程153.2.2 移动平均过程173.2.3 AR(p)过程和MA(q)过程的对偶关系173.2.4自回归求和平稳模型193.2.5 自回归、滑动平均、ARIMA模型性质比较203.3 模型识别与选择213.3.1 模型识别的步骤213.3.2 矩方法223.3.3 极大似然方法233.3.4 模型选择准则243.3.5 模型简易选择253.4 对Clementine软件的概述263.4.1 Clementine的窗口263.4.2 数据流的基本管理和执行283.5 本章小结29第4章 基于Clementine软件的对
11、宝钢股价建模分析304.1 对宝钢历年股价进行预处理304.2 对宝钢最近2年股价进行建模分析314.2.1 模型建立314.2.2 模型分析及比较36结论42参 考 文 献43致 谢44基于时间序列分析及clementine软件的宝钢股价研究基于时间序列分析及Clementine软件的宝钢股价研究第1章 绪论1.1 时间序列的概念时间序列 (Time series) 从字面意思上看它是与时间相关的一组序列,针对某一种现象,在一个确定的统计指标下可以获得不同时间上的各个数据,将这些数据按照时间先后的顺序排列成一组序列,便构成了一组时间序列。时间也并非是唯一的观测度量,有时可以根据其他度量来观测
12、,如空间。时间序列法作为一种定量的数据预测方法,经过数十年的不断发展与完善,已被广泛应用于统计学研究中。时间序列分析 (Time series analysis) 是建立在随机过程与数理统计学理论基础上的一种统计方法,该方法适用于动态数据处理,以解决生产、经济中的实际问题为目的1。1.2 时间序列的应用时间序列现象广泛存在于各个领域中:在农业领域,我们关注农产品的年产量及其价格等;在经济和商业领域,我们关注股票的日收盘价格、周利息率、月价格指数、季销售额和年利率等;在工程领域,我们观测声音、电流和电压等;在地球物理领域,我们记录湍流,一个地区的海浪和地球噪声等;在医学研究领域,我们测量脑电图和
13、心电图追踪等;在气象学领域,我们观测每小时风速、每日温度和年度降雨量等;在质量控制领域,我们根据某目标值监测一个过程;在社会学领域,我们研究年度出生率、死亡率、事故发生率和各种犯罪率等。此外,时间序列被用于观测和研究的领域还有很多。对时间序列的研究基于各种各样不同的目的,它们包括对数据生成机制的理解和描述,对未来值的预报,以及实现系统的最优化控制。时间序列其本质主要表现为:一组观察值之间是相互依赖或相关的;观测值是有序的。因此,以独立性假设为基础的统计方法和技术将不再适用,需要建立有别于传统的新的统计方法。我们把用于时间序列统计的方法学称为时间序列分析2。1.3 本文的主要内容及安排本文的主要
14、目的是介绍时间序列分析相关的各种方法概念与模型,利用SPSS Clementine 软件研究宝山钢铁股票价格随时间的变化规律,并用时间序列的有关知识进行建模分析。本文的主要安排:第一章:绪论,对本文的内容进行简要概述。 第二章:介绍时间序列的一些基本概念,如随机过程、平稳过程、自相关函数和偏相关函数、白噪声过程等。第三章: 介绍了案例中需要用到的几种模型,并进行简要对比;对SPSS Clementine 软件进行简单介绍。第四章:通过宝山钢铁股价这一案例具体介绍使用Clementine软件建立时间序列模型的步骤与方法,并对模型参数进行分析比较,确定最佳模型。对本文进行总结。第2章 基本概念2.
15、1 随机过程随机过程是以时间为标号的一组随机变量,其中属于某个样本空间,t属于某个标号集。对于固定的t, 是一个随机变量。对于给定的, 是t的函数,我们把它称作样本函数或实现。所有可能实现的全体称为随机过程和时间序列分析。因此,一个时间序列就是来自某个随机过程的样本函数或实现。为了对时间序列分析有一个正确的认识,我们在本节引入了随机过程的一些基本概念。假设指标集是所有整数的集合。考虑一个来自随机过程的有限随机变量集,其n维分布函数可定义为 (2.1)其中,是任意实数。如果其一维分布函数是时不变的,及对任意整数,k和有,这个过程称为依次分布一阶平稳。依分布二阶平稳是指对于任意整数,和有成立;从而
16、,依分布n阶平稳是指 (2.2)对于任意n元组 和整数k成立。若对任意整数n,公式 (2.2) 成立,则该过程被称为严平稳过程。对于实值过程,定义该过程的均值函数为 (2.3)该过程的方差函数为 (2.4)和间的协方差函数为 (2.5)和间的相关函数为 (2.6)对于一个严平稳过程,分布函数对于所有的t都是一样的,若,则均值函数,是一个常数。若,则对所有的t,有,也是一个常数,再进一步,由对,和k取任意值时都成立,我们有 (2.7)以及 (2.8)令,可以得到(2.9)以及(2.10)因此,对于前两阶矩有限的严平稳过程,和之间的协方差和相关仅依赖于时间差k 3。2.2 自协方差和自相关系数时间
17、序列相邻值之间是有依赖性的,对于一个平稳过程 ,如果其时间间隔为k,那么对于任意时间t,和之间的协方差都是相同的,我们将其称为滞后k的自协方差,表达式如下 (2.11)和之间的相关为 (2.12)其中,,作为k的函数,称为自协方差函数,称为自相关函数(autocorrelation function简称ACF),因为它们描述同一过程中相距k个时滞的和之间的协方差和相关性。平稳时间序列的自协方差函数列与自相关函数列具有以下的性质:(1) 对称性:,;(2) 非负定性:系列与都是非负定序列,即对任意正整数m,, 为非负定对称阵;(3) 。2.3 偏自相关函数除了和之间的自相关外,我们考察除去和共同
18、依赖的干预变量的影响后的相关。这种条件相关通常被称之为偏自相关4。这里有两种方法推导:第一种方法:记为和之间的偏自相关,它等于和之间的普通自相关 (2.13)然后再计算各个分量。第二种方法:考虑回归模型,其中因变量来自于0均值的平稳过程,它关于之后k个变量进行回归 (2.14)其中代表第i个回归系数,是0均值的误差项,并且与不相关。在 (2.14) 式回归方程的两边同乘,并取期望得到对于,我们有如下的方程组对k=1,2,依次运用Cramer法则,有 (2.15) 作为k的函数,通常称为偏自相关函数(partial autocorrelation function简称PACF)5。2.4 白噪声
19、过程若是一个不相关的随机变量序列,具有常值均值(通常假设为0)和常值方差的确定分布,且对任意,那么这个过程称为白噪声过程。显然,白噪声过程是平稳的,并且其自协方差函数为 (2.16)自相关函数为 (2.17)偏自相关函数为 (2.18)根据定义,对任何过程都有,所以我们提到的自相关和偏相关,仅涉及时的和。在白噪声过程中的基本现象就是其ACF与PACF均等于零。尽管白噪声过程在实际中很难发生,但它作为时间序列模型中的基本构建,扮演着一般向量和函数分析中正交集的角色。2.5 均值、自协方差和自相关的估计一个平稳时间序列可以被均值、方差、自相关和偏自相关所描述。如果知道了所有可能实现的全体或者得到了
20、多次独立实现,则能够计算出这些参数的精确值。然而,在大多数情况下,得到多次实现非常困难。大多数可利用的时间序列只由单个实现构成,不可能计算总体平均。不过,对于平稳过程,可以将总体平均由时间平均来代替。接下来,本节在优良的统计特性检测条件下,使用时间平均来估计均值、自协方差和自相关。2.5.1 样本均值对于单个实现的平稳过程,其均值的一个自然估计是简单均值 (2.19)它是n个观测值的时间平均。问题变为上面的估计是否是一个有效的估计。显然 (2.20)这意味着是的无偏估计。同时也容易得到 (2.21) 其中令。因此,如果是有限的,则当时,从而是的一致估计。即在均方意义下有 (2.22)如果存在式
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
20 积分
下载 | 加入VIP,下载更划算! |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 时间 序列 分析 Clementine 软件 宝钢 股价 研究