您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [TIPDM]:第三届挑战赛B8-基于数据挖掘技术的市财政收入分析预测模型 - 发现报告

第三届挑战赛B8-基于数据挖掘技术的市财政收入分析预测模型

2015-11-23 TIPDM 郭小欧
报告封面

全国大学生数据挖掘竞赛 优秀作品 作品名称:基于数据挖掘技术的市财政收入分析预测模型荣获奖项:二等奖作品单位:甘肃农业大学作品成员:王久旺吴俊红许丽雯指导教师:赵有益 基于数据挖掘技术的广州市财政收入分析预测模型 摘要:通过挖掘、整理1999-2014年与广州市财政收入关联的经济、社会等指标统计数据,利用SAS和SPSS软件,分析了广州市财政收入的构成及其比例,建立了因素分析的回归模型,分析了在财政收入结构中,企业所得税、印花税、罚没收入、消费税和增值税是影响财政收入的主要方面,进一步分析识别出了影响财政总收入的关键因素是企业所得税、增值税、第三产业、交通业,其中,影响增值税的关键因素是商品进口总值、工业增加量,影响营业税的关键因素是第三产业增加值、建筑业总产值、住宿和餐饮业零售额,影响个人所得税的关键因素是第二产业增加值,影响企业所得税的关键因素是商品进口总值、工业增加量。 在因素分析基础上,构建了灰色预测和回归预测模型,预测结果误差5%左右,其中广州市2015年财政总收入、增值税、营业税、企业所得税、个人所得税的预测区间分别是(29031430.82,31087829.18)、(2890442.273,2986829.727)、(1934437.078,2069874.922)、(1492866.117,1527933.883)、(576012.5216,592216.6784)。 通过对广州市近几年社会经济发展的人口、就业、环境、医疗卫生和社会福利、财政收入及支出等数据的挖掘,再用R软件等对影响财政收入的经济因素和非经济因素两方面进行了分析,明确了财政收入支出与经济、社会的相互关系,向广州市财政局提出财政收入和支出预算的平衡性、行业或部门财政支出分配的弹性、政策制定与监管落实的严肃性等方面的建议,为下一年的财政预算支出政策提供指导依据。 关键词:广州市财政收入;广州市财政支出;逐步回归;灰色预测模型 The thesis title Abstract:Through mining and sorting the statistical data about social and economy associated withfiscal revenue of Guangzhou from1994 to 2014.Using SAS and SPSS software, analyzed the compositionand proportion of fiscal revenue in Guangzhou City, we set up a regression model of factor analysis. Drawaconclusion that the corporate income tax,stamp tax,incomes from fines and confiscations,theconsumption tax and value-added tax are the major aspects on affecting the fiscal revenue. Further analyzing and identifying the key factors affecting the total fiscal revenue are the enterpriseincome tax, value-added tax, the third industry, transportation industry. Among them, the key factorsaffecting the value-added tax are the total value of imports and industrial added quantity. The key factors affecting the business tax are the third industrial added value, total output value ofconstruction, accommodation and catering industry retail sales.The key factor affecting the personal incometax is the added value of the second industry. The key factors affecting the corporate income tax are thetotal value of imports, industrial added quantity. On the basis of factor analysis,we constructed the grey forecasting model and regression predictionmodel, the prediction result error is about 5%. Among them,the prediction intervalsof Guangzhou 2015 total fiscal revenue,value added tax,businesstax,enterprise income tax,personal income tax are(29031430.82,31087829.18)、(2890442.273,2986829.727)、(1934437.078,2069874.922)、(1492866.117,1527933.883)、(576012.5216,592216.6784). By the population of guangzhou city social and economic development in recent years, employment,environment, health care andsocial welfare, fiscal revenue and expenditure data of mining.Then using Rsoftware analyzed the two aspects of both economic and non-economic factors affecting the financialincome.We cleared the relationship between the fiscal revenue expenditure and the economic and social. Putting forward the advice to the Guangzhou Municipal Finance Bureaubureau about the balancefiscal revenue and expenditure budget , industry or sector spending allocation of elasticity, policy andregulation to carry out the seriousness.It provides the basis for the next year's fiscal expenditure policy. Key words:local fiscal revenue stepwise regression grey forecasting model 目录 1.研究目标...............................................................................................1 2.分析方法与过程....................................................................................4 2.1.总体流程.....................................................................................................................42.2.具体步骤.....................................................................................................................32.3.结果分析.....................................................................................................................4 4.参考文献.............................................................................................19 1.挖掘目标 本次建模的目标是通过收集、整理1999-2014年的与广州市财政收入关联的经济、社会等指标的统计数据,分析广州市财政收入的来源、构成及其比例,建立因素分析回归模型,分析相关经济数据对广州市财政收入及其构成要素的相互关系,以此确定影响财政收入的关键因素;在因素分析基础上,利用数据挖掘技术,构建灰色预测模型和回归预测模型,对广州市2015年的财政总收入及各个类别收入进行科学合理的预测;同时,为尽量避免和克服年度预算收支规模确定的随意性和盲目性,结合广州市近几年社会经济发展的财政收入及支出等情况,正确处理财政与经济的相互关系,向广州市财政局提出几点财政收入和支出预算的建议,为下一年的财政预算支出政策提供指导依据。 2.分析方法与过程 2.1.总体流程 为了对问题进行有序有效分析研究,将建模过程和建模方法进行整体设计,具体见图1和图2抽 图2.1.2方法流程图 主要包括以下几个步骤: 步骤1:通过广州市统计信息网、文献数据库、图书馆文献资料等多渠道了解问题背景,收集梳理相关经济社会统计统计数据,从“广州市政府预算支出”、“广州市国民经济和社会发展统计公报”等文本中提取、整理信息与数据。对个别缺失、异常数据进行预处理。对部分统计数据的单位进行换算处理,对个别指标进行整合计算。 步骤2:建立回归模型,分析、识别影响广州市财政总收入、税收(包括增值税、营业税、企业所得税、个人所得税等)、非税收等收入的关键影响因素。 步骤3:基于财政收入的因素分析,构建灰色预测模型、回归预测模型,对广州市2015年地方财政总收入、一般预算收入、营业税、增值税等指标进行预测与分析。 步骤4:结合广州是社会经济发展,进一步挖掘近几年财政收入、预算的数据信息,挖掘影响财政收入的经济与非经济因素的人口、环境、就业等指标数据,并从财政收入和支出预算的角度进行分析,向广州市财政局提出建议,为下一年广州市的财政预算支出政策提供指导依据。 2.2.具体步骤 结合上述总体流程图1和图2,对广州市地方财政收入的主要影响因素分析、收入预测和财政收支分析等内容,对每一问题解决进行具体说明与解释。 步骤1:数据的挖掘、抽取与整理 通过广州市信息统计网、“广州市1999-2013年预算报表”、百度文库、中国知网、广州市政府信息平台、“广州市国民经济和社会发展统计公报”等方面多渠道多方面搜集、挖掘和梳理数据。主要数据整理如下: 1999-2014年广州市地方财政总收入相关指标的数据(见附件1),1999-2014年广州市地方财政收入的税收与非税收的数据(见附件2),1999-2014年广州市地方财政收入的税