首页 理论教育 旅游大数据分析与挖掘技术的应用

旅游大数据分析与挖掘技术的应用

时间:2022-11-05 理论教育 版权反馈
【摘要】:在旅游大数据分析平台中,对游客旅行线路与位置进行实时跟踪调查非常重要。同时,通过旅游大数据的分析,有针对性地结合客源市场状态与游客消费行为,提供优质多样的旅游产品,制定合理的旅游服务价格体系,满足各种层次与各种类型的游客的旅游消费需求,真正实现游客、旅游企业与地方经济发展三者利益的统筹与最大化。

(一)游客消费行为数据收集分析

数据挖掘所获得的旅游活动信息、旅游潜在市场、旅游的满意度等内容,都是在游客的消费行为数据收集的基础上分析获得的。因此,定位、筛选这些信息,并实现高效、科学的收集成为大数据运用的重要前提。大数据的分析即为大数据挖掘的处理过程,是实现数据挖掘的必要手段,如何选取大数据的分析路径和方法对于提升大数据挖掘的分析结果等具有重要意义。

旅游消费行为大数据收集在数据采集中心完成数据配置、获取与处理、数据提取与信息加工一般有多种方式,如多点异构采集、多信号协同处理等。

1.游客消费行为及旅游消费行为大数据

旅游消费行为一般是指旅游消费者为了满足自身在旅游过程中的整体需求,所表现出来的旅游购买动机及对旅游产品、旅游服务等旅游消费的选择喜好、获取享受、评价处置与决策计划等行为特征。

根据不同的游客消费行为可以将游客分为不同的消费类型,如观光游客、自驾游客、探险游客、休闲游客、娱乐游客、自由行游客、团队游客等。还可根据游客群体的地理来源、社会经济状况、人口统计因素、心理状况、行为状况细分为不同的旅游细分市场。

旅游消费行为大数据是指游客为满足其欲望、需求的产品或服务而开展的各项活动,时间跨度涵盖了游客产生旅游动机,到计划、预定、开展旅游活动、旅途后等各个环节。比如游客是否认为其消费的旅游产品是自己想要的并且物有所值,旅游产品或服务的价格是否合理,旅游产品是否符合旅游者审美要求;旅游决策前,旅游服务的质量是否有保证,旅游体验过程中旅游产品与旅游服务是否存在需要改进的地方,以及顾客的理想状态;对于实物的旅游产品,了解消费者购买的目的;对旅游产品价值与使用价值的基本判断,如精致小巧、携带方便;包装环保,简洁大方;价格合理,质量可靠;旅游产品品牌价值大小,作为礼品或实用性的意义大小等。

根据数据分析的需要,对游客消费行为细分可以有其他不同的形式。如购买旅游产品意愿状态下的消费行为,可分为准备购买、不想购买、已购买等行为;如对旅游产品态度下的游客消费行为,可分为热情、忠诚、漠不关心、敌视等行为;如购买次数下的游客消费行为,可分为没有购买、购买一次、购买二次以及多次购买等行为;如游客环境消费理念下,可将游客消费行为分为绿色环保生态游客、普通游客与破坏环境游客等。

2.游客消费行为数据收集

旅游消费行为数据的来源包括消费者在旅游网站上的注册资料、电子门票,以及消费记录、微信、博客、电子邮件调查、探头摄像记录等。通过旅游大数据的分析挖掘,让更多的旅游企业从中发现旅游商机,生产更多物有所值或物超所值的旅游产品,设计更多人性化的旅游线路,以引导游客科学合理地完成旅行与游览。

游客消费行为数据收集主要通过以下几种途径与方式进行:

(1)直接通过旅游者消费行为抽样调查数据采集云平台。

旅游科技网络公司或相关的政府旅游机构与大型旅游企业一般拥有云计算架构的一体化定量数据采集平台,该平台系统包括旅游大数据调研中心、旅游大数据调研应用服务器,可以将通过移动互联网、电子邮件、电话、信函等采集到的数据,在统一数据管理、样本管理、用户管理以及认证与权限管理等方式下,集成存储到相应的数据库中,并连接具有数据存取的API接口

(2)旅游大数据分析平台智能机器调研系统。

计算机智能调研系统可以对旅游相关的网络信息,以在线或离线方式进行当面访谈和网络调查与数据采集,并支持相应的游客访问图像、录音、位置、过程等自动记录监控与自动上传数据调查,还可对各种网络参数和来源进行统计分析,并支持IP地址与相关设备限制,以及监控网络问卷发布方式和数据质量。计算机人工智能系统可以利用电话调查自动拨号,电话号码随机生成和抽样,可以对电话语音进行识别。在数字或模拟方式下,通过对访谈的电话进行全程录音监控与播放,多种形式发放网络问卷,如邮件或发送、社交网络媒体发布、在线填写等。

(3)旅行线路与位置等图像信息采样系统。

在旅游大数据分析平台中,对游客旅行线路与位置进行实时跟踪调查非常重要。因为旅游即旅行与游览,游客的空间位置影响到旅游目的地或旅游景区的旅游状况,如交通与游览活动是否拥挤、通畅,这直接关系到游客旅游的满意度与各级管理部门的管理水平高低。旅游大数据可以利用在线的Web GIS的地理信息系统进行样本采集与管理,可以在线对游客的游览轨迹与分布、旅游景点旅游状况进行绘图并进行图像展示,为调查统计景区容量、景区旅游活动规律与游客满意度创造条件。

(二)旅游大数据分析与系统化的顾客管理

旅游网站、旅游企业、旅游大数据服务机构对旅游大数据的分析需要开展的工作非常多。一方面,通过对游客对旅游产品与服务的需求意愿、旅游消费过程、旅游消费过程中的评价等消费者行为特征进行系统的分析,发现旅游产品和旅游服务中存在的问题,寻找解决问题的途径,提供更便捷的服务,最大限度满足游客个人旅游消费的意愿,提升游客满意度。另一方面,分析不同家庭收入游客、不同职业身份、不同客源地、不同出行方式的游客的购买和消费行为,从中发现旅游资源分布、旅游基础服务设施、旅游交通与旅游指示牌、服务水平与服务意识等方面与旅游消费需求之间的差距,及时改进,提高旅游企业与旅游产品的竞争力。同时,通过旅游大数据的分析,有针对性地结合客源市场状态与游客消费行为,提供优质多样的旅游产品,制定合理的旅游服务价格体系,满足各种层次与各种类型的游客的旅游消费需求,真正实现游客、旅游企业与地方经济发展三者利益的统筹与最大化。

1.对游客个人与群体行为进行预测,提高旅游服务质量与服务水平

旅游大数据分析平台可以通过电子门票、磁卡、手机扫描传感器、网络实时调查等技术和手段,获取游客个人和消费者群体的行为信息,通过大数据挖掘与分析,对游客消费行为加以了解,对游客个人与群体行为进行预测,加强对游客期望的引导,针对不同细分市场的游客进行个性化与量身定制的旅游产品服务与设计。为喜爱大自然与绿色出行的游客提供更好的接近大自然的景点景区,为经济型游客提供更多、更丰富的旅游产品,为喜爱个性化出行的游客提供有针对性的旅游项目与内容。

旅游大数据平台还可以对旅游团队的群体行为进行分析预测和景区人流量预测,便于不同收入、不同文化背景与不同兴趣爱好的游客组建合适团队、选择与采购恰当的目的地旅游产品,并即时根据景区人流量预测调整旅游团队服务方案,加强对旅游消费行为的管理,提高旅游服务质量与服务水平。

2.充分分析酒店、旅游娱乐场所等企业游客消费数据,提升客户管理水平

酒店、旅游娱乐场所是信息化最早的领域之一。智能化的酒店预订系统,房务管理系统,饭店销售、后勤服务与保障运营系统在企业得到了广泛的应用,积累了大量的游客消费数据。通过对顾客档案的统计分析与管理,可以预测未来一定时间内的客流量等信息,便于合理安排相应的资源,提出有针对性的、个性化的服务措施。

3.旅游服务产品精细化运营与营销传播

旅游服务产品精准营销的目标就是用最少的钱,选择最正确的旅游产品与服务,在最合适的地方,给最需要的游客,以达到最佳的效果。现代旅游大数据分析由于大数据收集、存储、分析、查询服务等环节技术手段的现代化,使得数据分析信息的价值越来越大,数据的丰富性和细致性更加突出,信息数据的可信度、精确性、实时性、实用性与科学性也大大提高,使得现代旅游企业进行精准化营销与运营管理成为可能。

旅游企业对客户行为的洞察能力在大幅提高,从而可以有针对性地根据目标客户的特点,提出相应旅游需求的产品设计与营销方案,使得产品与客户需求更加匹配。旅行社和旅游网络等运营商也可以根据游客在旅游过程各个阶段的历史现实表现与意见,及时识别与捕捉营销机会,提出相应的营销策略,提高营销管理的灵活性与可操作性。

(三)游客流量实时监测与数据统计分析

旅游活动的安全保障是旅游活动顺利开展的前提条件,特别是上海跨年踩踏事件之后,旅游景区的大客流管控成为旅游安全生产的重中之重。国家旅游局制定了《景区最大承载量核定导则》,指导全国旅游景区开展最大承载量核定工作。

旅游客流量是指在单位时间内特定空间所形成的旅游人数规模,它是旅游景区经济效益和承载力估算的重要依据,同时,对旅游流量预测也是旅游景区旅游规划重要的前提条件之一,增加旅游景区游客数量,提升游客所产生的经济与信息效益是旅游景区管理的基本任务。而旅游大数据技术在推动景区旅游监管监测方面发挥了特有的作用。

目前我国现有的与游客流量显示有关的大数据统计系统主要包括国家旅游局目的地营销系统平台、国家旅游局旅游统计系统、全国“黄金周”假日旅游预报系统。这些数据涵盖了旅游目的地各旅游企业的经营数据、财务数据、目的地各类旅游产品的相关数据、目的地游客信息、游客参加假日旅游活动信息、目的地各级旅游管理部门的统计数据、全国假日办黄金周全国旅游接待数据、交通客运数据等。这些旅游信息数据分布于多个异构的数据服务器和几个相互独立的业务系统中,信息数据规模大、结构复杂、功能综合、因素众多,具有典型的海量、多维、异构、分布式特征,而隐藏在其中的规律用常规的技术手段很难发现。因此,采取大数据挖掘手段对假日旅游信息进行处理势在必行

1.旅游景区游客流量实时监测的方法与手段

旅游景区的客流量控制包括景区内游客总量的控制和各个景点的客流量监测控制,前者直接通过电子门票技术等就可以轻松获取当前景区内游客数量,后者主要通过图像设别、交通车流与道路状况的实时监控等获得游客流量强度、流量变化节律、流量流向等。

旅游景区游客流量实时监测分析平台主要发挥对游客流数据多方的融合、实时监测、目标识别、客流量评估和客流的态势分析预测等,对旅游大流量数据实现实时化的分析处理,为旅游景区游客的流量管控提供真实可靠的信息,实现旅游大数据的信息化服务。

2.旅游景区游客流量数据统计分析与应用

旅游景区游客流量的统计分析可以是基于 R[1]的在线统计分析工具,提供在线编码转化、数据集筛选、描述性统计和高级统计分析功能。其中高级统计分析功能集成了分类统计模型、连续变量模型、顺序变量模型等主流统计模型,可呈现各类分析的复杂数据图表。

(1)依托大数据统计景区客流量,实现游客分流与预警。旅游景区通过电子门票等技术,轻松获取景区内当前游客数量,当游客数量超过景区最大承载量时就可以采取停止售票、放缓售票等方式进行相应控制。通过图像设别,获得游客流量强度、流量变化规律、流量流向以及交通车流与道路状况的实时监控,实现对旅游流时空分布的可视化与图像数据处理,及时发现与解决景区内外交通拥堵,并对游客流实行管控和疏导。

(2)依托大数据分析景区内游客流量规律,对景区开展市场营销具有参考价值。通过支付宝、二维码以及个人身份证件、图像传感器、移动设备等统计游客进出景区或旅游点的次数、逗留时间、分布特点,以及购买相关旅游商品的信息,并依据个体特征数据对所有进入园区或景区的游客群体进行区分,通过大数据进一步分析相应的游客群体客流量规律,实现游客流量数据的分类统计。具体来说,景区可以获得客源市场所在地,游客的年龄、性别、消费能力等,以进一步细化市场定位。

(3)依托大数据分析,获得游客体验的反馈信息,提升景区管理服务水平和经营效益。通过语音、短信、视频、呼叫中心、二维码等智能调查系统,对景区游客满意度进行调查,获知游客旅游消费的偏好,进而部署服务改进措施,调整旅游景点开发与布局,发掘新的旅游景点与景区游客数量增长点,拓展旅游景区收入。

(4)依托大数据对数据的整合能力,还可进一步从多方渠道获取旅游景区的环境质量、污染物、光线强度、气压风速、气流与负氧离子状况、气温、降水等信息,实时发布,提升景区的旅游公共服务水平。

【案例】百度如何利用大数据进行旅游预测?

百度作为全球最大的中文搜索引擎,从创立之初,便将“让人们最便捷地获取信息,找到所求”作为自己的使命,公司秉承“以用户为导向”的理念,不断坚持技术创新,致力于为用户提供简单、可依赖的互联网搜索产品及服务,包括以网络搜索为主的功能性搜索,以贴吧为主的社区搜索,针对各区域、行业的垂直搜索,MP3搜索,以及门户频道、IM等,全面覆盖了中文网络世界所有的搜索需求。根据第三方权威数据,百度在中国的搜索份额超过80%。

百度公司于2014年推出了百度旅游预测,其最基本的思想是:利用对用户在百度的搜索数据和LBS(基于位置服务)数据进行深度挖掘,发现旅游相关词搜索数量和实际旅游人数之间的密切关系,依此建立了旅游预测模型。目前,百度旅游预测主要提供国内外城市旅游热度、国内主要旅游景点实时及未来的拥挤程度预测、各城市相关旅游景点实时及未来的拥挤程度预测。

1.国内主要旅游景点拥挤程度预测

在本模块中,百度利用预测模型对国内主要旅游景点的旅游大数据进行分析,得出主要旅游景点的拥挤程度,并对主要景点实时及未来30天的拥挤程度、趋势及天气情况进行预测。景点旅游热度预测结果可视化效果如图4-7所示。

图4-7 景点旅游热度预测

2.国内外城市旅游热度预测

在本模块中,百度利用预测模型对各城市旅游大数据进行分析,得出全国各大城市和国外城市的旅游热度,并对国内城市实时及未来两周的旅游热度趋势进行预测。城市预测结果可视化效果如图4-8和图4-9所示。

3.国内城市相关旅游景点拥挤程度预测

在本模块中,百度利用预测模型对国内城市相关旅游景点旅游大数据进行分析,得出相关旅游景点的拥挤程度,并对相关景点实时及未来30天的拥挤程度、拥挤趋势及天气情况进行预测。景点拥挤程度预测结果可视化效果如图4-10所示。

尽管百度预测提供的预测结果并不完美,但是,百度利用大数据进行旅游人流预测,开旅游大数据预测应用的先河,其标志和创新的意义十分重大,给旅游行业带来了巨大的震动和重要启发。未来随着跨平台数据的整合以及预测模型的完善,大数据技术将会推动旅游行业的跨越式发展。

图4-8 北京市旅游热度预测

图4-9 英国旅游热度预测

图4-10 北京市主要旅游景点拥挤程度预测(国家游泳中心为例)

目前,中国旅游大数据的利用程度还处于较低水平,商业化程度还不够。未来的中国旅游业需要利用信息技术与大数据分析技术,开创全新的、高科技与智慧旅游新时代,中国旅游大数据商业化应用的前景无疑会更加广阔。随着政府与企业的数据更加开放,以及大数据预测技术的发展,大数据对社会各方面的影响将更加深远。对于旅游企业、政府和旅游消费者而言,在未来的大数据时代,需要解决的不仅是技巧和法律问题,更需要转变思维方式,以商业化角度思考大数据营销。

【知识归纳】

本章学习基于大数据和云平台等现代信息化管理技术与方法,开展旅游管理与服务。首先,在充分了解大数据的起源、概念、本质特征的基础上,认识旅游大数据的商业价值,以及价值转化方式与方法,初步掌握旅游大数据分析的应用价值;认识旅游大数据分析的主要内容与流程,重点剖析旅游消费行为数据的收集与分析方法,旅游大数据平台对游客流量监测与分析的作用等。

通过本章的学习,要求学生了解旅游大数据的知识及其应用,学会掌握旅游大数据的分析方法并能够将分析结果应用于实践,为智慧旅游发展服务。

【复习思考】

一、单项选择题

1.大数据挖掘技术中不包括( )。

A.关联分析  B.分类  C.多目标决策  D.聚类

2.( )导致了全球社会数据量的爆发式增长。

A.数据库的出现  B.Web 2.0技术的应用

C.Web 1.0技术的应用  D.虚拟现实技术的应用

3.在信息碎片化时代,为了让用户更好地理解数据挖掘结果,我们需要对挖掘结果( )。

A.数据清洗  B.数据收集  C.数据可视化  D.数据融合

4.在数据收集及处理过程中,( )对最后的数据挖掘结果至关重要。

A.数据融合  B.数据降维  C.数据清洗  D.数据转化

5.Google的大数据平台不包括( )。

A.分布式文件系统GFS  B.分布式计算框架Map Reduce

C.分布式数据库Big Table  D.分布式数据存储平台PNUTS

二、多项选择题

1.大数据的主要发展历程为( )。

A.运营式系统阶段  B.用户原创内容阶段  C.感知式系统阶段

D.媒体发布内容阶段  E.以上全部

2.大数据通常具有4V的特点,即( )。

A.Volume  B.Velocity  C.Variety

D.Value  E.Online

3.下面属于大数据技术范畴的是( )。

A.云计算  B.分布式存储  C.大数据算法

D.No SQL数据库  E.SOA结构体系

4.旅游大数据的应用价值表现在( )。

A.旅游市场定位  B.旅游行业收益管理  C.旅游创新需求开发

D.旅游目的地推广  E.旅游学术研究

5.拥有商用大数据平台的公司主要有( )。

A.Google  B.Amazon  C.Yahoo

D.IBM  E.Microsoft

三、判断题

1.人类社会数据量第二次大的飞跃是建立在运营式系统开始广泛使用数据库的基础之上。  ( )

2.在挖掘有价值的旅游信息的过程中,大数据可以通过对游客在旅游网站日志的点击率进行分析。  ( )

3.金棕榈企业机构是集管理咨询、技术研发、平台运维与专业培训为一体的中国旅游行业第三方平台服务企业。  ( )

4.在数据量呈指数增长的同时,隐藏在海量数据中的有用信息相应比例也随之增长,使我们获取有用信息的难度加大。  ( )

5.大数据有着海量性、隐藏性和碎片化特点,必须通过技术的力量,才能分析出有意义的信息。  ( )

四、简答题

1.简述大数据的起源、概念与本质特征。

2.简述旅游大数据分析的主要内容。

3.简述旅游大数据的商业价值及其转化方式。

4.简述旅游大数据的应用价值。

5.简述旅游大数据平台的架构体系。

【实训项目】基于大众点评网的旅游景区服务质量大数据分析处理

一、数据来源

选择当地不少于五家有代表性的5A级以上旅游景区作为本次实训对象,以大众点评网作为评价景区服务质量的数据,提取网站中有关上述景区近两年的全部评论信息。

二、分析步骤

1.抓取

通过网络信息抓取软件Net Spider对网站评论进行收集,并进行一般性文本处理(如去除乱码、去除空行等)。

2.过滤

通过分类(Classification)的方法对文本里的噪声信息进行过滤,剔除可能对分析结果有影响的文本信息。

3.高频关键字分析

通过国内较为流行的ROSTContent Mining(CM 6.0版本)语义分析软件对过滤后的网络评论信息进行分词和高频词统计。

4.提取景区服务质量信息高频词

结合国家5A景区评定标准,对步骤(3)得到的高频词进行过滤,得到基于国家5A景区评定的景区服务质量高频词,如表4-2所示。

表4-2 国家5A景区评定标准分类与关键字列表的对应关系

对所列景区网络评论进行高频词提取。

三、统计结果分析

1.景区星级评论比例比较

得出服务质量星级评价级别比例、同级星级评价平均值与景区星级评价对比等信息。例如,在五星级评价中,有哪些景区的五星评论比例超过了平均水平,哪个星级的评价比例最高等。

2.景区网络评论中游客关注热度统计

根据网络评论关键字搜索数据,统计游客在网络上对景区在服务质量方面的关注热度,进一步分析游客对服务质量的关注点,即景区最需要加强的地方。

四、结论与报告

根据网络评论的数据挖掘和分析结果,形成对景区在服务质量方面存在的问题的分析报告和对应的解决方案

[1] R是一套完整的数据处理、计算和制图软件系统,其功能包括数据存储和处理系统、数组运算工具(其向量、矩阵运算方面功能尤其强大)、完整连贯的统计分析工具、优秀的统计制图功能、简便而强大的编程语言,可操纵数据的输入和输出,实现分支、循环,用户可自定义功能。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈