三、简评与展望 1.新数据源 随着技术的进步,新的数据源或“补充数据”和“替代数据”不断出现。这些新数据源提供了传统调查无法提供的信息,可以加强或补充官方统计数据。TRA在国内游客调查(NVS)中已经开始使用手机流动数据衡量国内游客流动情况。这些数据使用来自手机、全球定位系统(GPS)和移动应用程序(App)的ping来识别和聚合跨地理位置的大规模移动。目前在统计国际游客方面还没有发布通过“补充数据”或者“替代数据”等新数据源所做的旅游统计和预测,可以期望TRA在收集和统计国际游客的过程中也能很快采用新数据源。 一、全国国内旅游统计遵循3个技术要件 2020年颁布的《全国文化文物和旅游统计调查制度》(以下简称《制度》)规定,游客指“指任何为观光游览、休闲度假、探亲访友、保健疗养、购物娱乐、学习交流、会议培训或开展经济、文化、体育、宗教等活动,离开常住国(或常住地)到其他国家(或地方),其连续停留时间不超过12个月,并且在其他国家(或地方)的主要目的不是通过所从事的活动谋取报酬的人”⑥,并规定,国内出游需在外停留超过6小时但不足12个月。从统计的角度来说,游客应该满足3个技术要件:离开惯常环境、出行满足最短和最长时间标准、具备旅游动机。 2.需求方数据、供应方数据以及数据源清单 在国际游客的统计中,澳大利亚统计局和旅游研究中心报告的目前数据主要基于需求方数据(即关于游客的旅行和假期的统计和采样数据),还缺少供应方数据(即住宿和容量数据,以及通过住宿机构统计的数据)。供应方数据包括住宿机构数据、航空数据、陆地交通数据以及其他经济指标数据。文献中对旅游活动供需方数据的比较显示两个数据源之间存在显著差异。供应方数据的提供和统计有一定难度,而且一些旅游活动的相关部分在供应方数据中不能得到显示。住宿数据通常也无法清楚区分前往惯常环境的旅行和前往非惯常环境的旅行。但是供应方数据(例如住宿数据)会对入境游对旅游产业的相关方面和地区发展规模和经济影响的评估有意义。未来旅游统计和需求预测可能需要结合来自不同领域的统计信息。梳理可能的数据源,整理数据源和数据库,并建立一套可行的指标体系,可能是进一步建设旅游统计体系的关键步骤。 首先,《制度》并没有具体规定惯常环境的数量、形状和大小等属性,在执行统计调查过程中区分本地游和异地游,其中,本地游要求离开日常居住(生活)以及工作(上学)的社区(村庄),距离在10km以上。这就隐喻日常居住(生活)以及工作(上学)的社区(村庄)周边10km范围内即为惯常环境。 其次,在外停留超过6小时,这个时间标准在世界各国中位于中上水平。英国⑦和西班牙⑧要求不低于3小时,澳大利亚要求一日游需离家4小时以上⑨,日本规定游客需离开日常生活环境8小时以上⑩。 澳大利亚相关部门定期发布旅游统计数据,包括月报、年报等。这些数据可以在这些部门的网站①②③④上以文档或者表格的方式下载。 (作者系该系副教授;收稿日期:2023-12-28) 国内旅游统计的技术路径及改进思考⑤马仪亮 (中国旅游研究院,北京100005)DOI:10.19765/j.cnki.1002-5006.2024.02.005 旅游不是一项明确的生产活动,而是一组交易细目,统计难度高。我国国内旅游遵循制度统计, 数 为T,同 期j省 域 接 待国 内 游 客 人 数 为Tj,则T=∑j=131Tj/δ,其中,31为省域数量,δ为该年游客一次国内旅游中平均游憩的省域数。T与∑j=131Tj的差距,取决于δ的大小。经多年位置大数据监测,δ值通常不会高于1.2。毕竟多数情况下,周边游、都市休闲等近程游是主流,占据绝对多数的市场份额。 最后,旅游动机需从两个维度加以理解和规范,其一是肯定性动机,即以观光游览、休闲度假、探亲访友、保健疗养、购物娱乐等为目的的出游。其二是否定性动机,也就是主要目的不是通过所从事的活动谋取报酬。对于肯定性动机,有的人觉得到郊区吃一顿农家乐只是日常休闲,不是旅游,买一张机票到三亚度假才算是旅游,认为当前旅游的动机约定过于宽泛。联合国世界旅游组织《2008年旅游统计国际建议》(以下简称《建议》)规定游客需“出于商务、休闲或其他个人目的”①,并将个人目的分为8类:度假、休闲、娱乐;探亲访友;教育和培训;保健和医疗;宗教、朝拜;购物;过境;其他。美国的相关规定是“出于商务和休闲目的”②,法国是“以休闲、商务为目的”③,西班牙规定旅游的“主要动机包括商务、休闲或其他个人原因(不包含在目的地公司工作或从事货运或客运工作)”④。我国对于肯定性旅游动机的细化,只是对《建议》中相关规定的详细阐述,并不存在刻意放大放宽之处。否定性旅游动机确实容易造成误解或产生歧义,需要进一步厘清细节。有人认为商务或公务出差就是为了获取工资而接受指派前往外地,不应属于旅游的范畴。《建议》将那些在其惯常环境以外处于工作或商业目的而跨越国际(或行政区)边界的旅行者,视为游客,并且进一步规定两类人群是为游客,一是“在与居民实体之间没有任何隐形雇主-雇员关系的情况下,非居民实体雇员,以及短期逗留(不足1年)提供设备安装、维修、咨询等服务的自营职业人员”⑤,二是“与居民实体进行商务谈判或者寻求商业机会(包括购买和销售机会)的旅行者”⑥。可以看出,合乎出游条件的商务或公务出差,确实属于旅游的范畴。当然,“如果受聘和收取的报酬只是该出行的偶发事件,则旅行者仍然是游客,而出行仍然构成旅游性出行。”⑦比如边打工边游玩的青年背包客,又或者游客在旅途中偶然提供咨询、绘画、表演、维修等服务获得报酬,不能将其排除在游客之外。 全国国内旅游采用计算机辅助电话调查的方式,每年3月、6月、9月和11月进行季度调查,全年约8万样本,城市和农村各一半。其中,城市样本在30个城市选取,分别是北京、天津、呼和浩特、沈阳、大连、长春、哈尔滨、上海、南京、苏州、杭州、宁波、福州、厦门、南昌、济南、郑州、武汉、长沙、广州、深圳、海口、重庆、成都、昆明、拉萨、西安、兰州、银川和乌鲁木齐。样本量原则上根据常住人口比例分配到各城市,各城市目标样本量原则上根据常住人口比例分配到各市辖区。会根据每个市辖区所辖全部电话局号(主要为固定电话号),由计算机辅助电话调查系统随机生成号码库,随机抽取电话号码,拨通后将符合条件的接听者确定为受访者。农村样本会在31个省域等距随机抽取,每个省域抽取4~10个区县(北京、天津、上海抽取4~5个远郊区,西藏抽取4个县,其他省域8~10个区县),根据每个抽中区县所辖全部电话局号,由计算机辅助电话调查系统随机生成号码库,随机抽取电话号码进行调查。 调查后,进一步通过样本出游率推算得到国内旅游人数和收入。具体计算中,分城市和农村,以及分性别、年龄、受教育程度几个组加权推算并汇总,如式(1)所示。 其中,T pst和Y pst分别为报告期内国内旅游人次数和国内旅游收入,thias为城镇/农村居民第h层内的第i个样本a报告期本地出游次数观测值,thial为其a报告期异地出游次数观测值,yhis为其本地出游次人 二、全国国内旅游统计的口径和方法 全国国内旅游遵循出游口径,游客具备旅游动机从离开其惯常环境达到时空标准至返回的全过程计1人次出游,也就是,不论游玩了几个省几个市,也不管进了几家景区住了几家酒店,都只计算1人次。实际上,全国的出游口径统计与地方的接待统计口径之间是存在关联的。理论上,全国出游人数等于各省接待游客人数之和除以游客一次出游平均游憩的省域数。设某年全国国内旅游出游人 均花费测算值,yhil为其异地出游次人均花费测算值,whi为其事后调整层权,mh(h=1,2,3,…,L)为落入第h层内的样本数。whi为人口普中每个分层组的人口数除以报告期对应层组调查样本数,为一个远大于1的数值。实际上,式(1)蕴含的基本推算逻辑,就是用层组样本出游率替代该层组全部人群的出游率。设phi为i样本对应层组人口数,shi为i样本对应层组调查样本小计,则thias×phi/shi与phi×thias/shi等价,而thias/shi正是报告期内该层组的样本出游率,该样本出游率乘以层组人口数得到报告期内该层组出游人数。 10km,那么该居民周末到所有四环以内的景区景点都不能称为旅游了。至于雇佣关系和获取报酬,应参照世界旅游组织的规定结合国情加以明确。 第二,样本代表性有明显欠缺。总量上,全国国内游年度调查自然人样本8万②,不到人口的十万分 之 六。与 英 国13.5万③、法 国26.4万④、西 班 牙9.84万⑤、澳大利亚12万⑥自然人样本量相比均有差距,人口覆盖水平差距巨大。结构上,30个城市多为生活及经济发达城市,这些城市居民出游力强,会得到高样本出游率进而放大推算得到的全国游客总数。且我国城镇常住人口较农村多近4.3亿,城镇居民出游率更高,意味着城镇产出游客的规模较农村大很多。2023年前三季度城镇游客产出是农村的3.44倍⑦。然而,调查样本城乡五五开,既没有考虑城乡的人口分布也没有考虑出游能力的差异。未来增加样本是必要之举,而在目前财政支付的调查经费只减不增的行政约束下,可将季度样本分配调整为城镇1.4万和农村0.6万,城镇样本按照超大城市、特大城市、Ⅰ型大城市、Ⅱ型大城市、中等城市、Ⅰ型小城市和Ⅱ型小城市分层后,等距离抽样确定样本,以增强样本代表性和统计科学性。 三、全国国内旅游统计存在的问题与改进 第一,核心概念界定不清造成理解偏差。居民成为游客的首要前提是其离开惯常环境。如前所述,《制度》并没对惯常环境做出统一定义和技术规范,反而先后使用了“惯常环境”“常住地”“惯常居住地”“惯常居住环境”“日常生活工作地点”等多种不同表述,造成了更多的困扰和理解偏差。惯常环境是基于居住住所定义,还是基于工作地定义,又或者基于住所和工作地双重定义,旅游统计制度存在的20多年间从来没有对此做过任何规定。具体到惯常环境是圆形还是方形?如果基于夜晚住宿和白天工作学习双重定义惯常环境,白天和夜晚属于惯常环境的空间范围是不是一样大?出租车司机、快递员、外卖员、货车司机等无固定工作地点的人员,怎么定义其惯常环境?这些问题都没有任何表述。2023年第三季度,我国国内游客中异地游游客占53.3%,过夜率达61.6%①,这一组有悖于常识和各地拦访统计结论的数据,正是很多受访者的理解和认同偏差造成应答中排除近程游所致。《制度》还把“主要目的不是通过所从事的活动谋取报酬”作为游客统计的规则之一,但既没有对出于工作或商业目的的旅行可能属于旅游做出规定,也没有明确雇佣关系是不是一定需要劳动合同、是不是包括边打工边旅行的临时性雇佣在内?造成了不少技术性困境。上述问题亟须在修订的《制度》或指定相关细则中予以明晰。建议规定惯常环境为以居所为中心的惯常空间和以职学地为中心的惯常空间构成的不规则空间并集,两个空间存在包含、相交和分离3种状况,分离的状况可以跨越行政区。此外,第一个空间为以主要居所为中心的10km范围,有且只有一个。第二空间为以职学地为中心的周边2~3km范围,不多于两个。以北京家住通州在前门附近上班的居民为例,如果两个空间的半径都是 第三,调查方法存在技术性缺陷。目前采用的计算机辅助电话调查,基本依赖固定电话接入。实际上,随着社会的发展多数家庭已经不再安装固定电话,使得样本向某一些行为方式趋同的群体集中,削弱了代表性。特别是高收入群体接受电话调查的意愿较低,势必影响调查数据的可靠性。调查时点上,仅在季末调查时让受访者回忆季度出游及其花费,由于遗忘或者不愿意耗费心力仔细回溯,容易出现遗漏应答的现象。另外,仅仅通过电话而没有面对面调查,受访者不如实应答的可能性明显增加。每个季度样本随机确定,而不是保持样本相对固定,也会影响时间序列数据之间的可比性。西班牙除了有电话调查也有计算机辅助面访,加拿大和南非等会对相对稳定的数万个家庭样本展开调 涉及众多概念、繁复报表、复杂调查项目、一系列指标关系和核算公式,要读懂《制度》并理解且转化为可操作可执行的方案,对于地区旅游统计人员来说具有一定难度