首页 百科知识 旅游大数据挖掘分析的主要工作内容

旅游大数据挖掘分析的主要工作内容

时间:2022-07-15 百科知识 版权反馈
【摘要】:移动互联网让旅游业呈现数据大爆炸。(一)旅游大数据采集和整理1.旅游大数据的来源旅游大数据是智慧旅游建设实施的基础。大数据挖掘技术主要包括关联分析、序列模式、分类、聚类、异常检测等。

移动互联网让旅游业呈现数据大爆炸。目前,在线旅行网站、旅游微博、微信、视频网站、社交网站等都产生以亿计的数据,这其中既包括在线旅游预订网站中用户的预订频率、价位,也包括旅游攻略网站中用户对酒店环境的评价,以及对旅游景点和公共服务设施的描述,还有景区、酒店内部管理所有的信息系统、视频监控系统、感知系统等所产生的大量数字、文字、视频数据。

虽然大数据是座“金矿”,在旅游行业的应用前景也非常广阔,但是,整个行业对于大数据的应用仍存在较大的障碍。这些障碍来自于数据的收集,更来自于数据的分析和挖掘。只有充分地从海量旅游数据中抽取出有用的旅游信息,旅游行业的发展才会更加“智慧”,实现智慧旅游的建设目标。

(一)旅游大数据采集和整理

1.旅游大数据的来源

旅游大数据是智慧旅游建设实施的基础。旅游大数据的来源主要有两个。

(1)企业内部获取的各类数据。其中包括了用户在与企业互动过程中的交易、评价、轨迹、调研等数据,以及企业的管理营销等数据。

(2)外部数据。其中企业可以通过购买的方式从第三方机构获取相关数据。另外,企业也可以通过数据软件采集的方式获得相关旅游数据。如利用相关的数据扒取软件和数据拥有方提供的API[1]接口来进行数据采集。其中常用的数据采集软件有火车采集器、网络矿工采集器等。

2.数据采集的渠道

数据采集的来源渠道较多。

(1)公众Wi-Fi是性价比较高的游客信息采集渠道,能获取游客的手机号码、游客微调研问卷以及了解游客具体位置数据。

(2)旅游一卡通是最佳游客行为数据采集措施,能够获取旅游消费清单数据、游客旅游消费轨迹数据。

(3)旅游手机应用是高性价比的游客行为采集渠道,能获取游客信息关注行为数据、采集游客旅行轨迹数据以及获取游客满意度调研与反馈数据。

(4)旅游资讯网是采集潜在消费者信息的渠道,可采集消费者旅游信息关注数据、旅游网络营销效果评估数据以及获取智慧化的旅游信息服务数据。

(5)旅游呼叫中心是采集高价值游客信息的渠道,可采集游客需求数据、旅游CRM维护平台等。

(6)在线旅游企业的用户使用数据获取是比较热门的渠道,比如携程、去哪儿、途牛等在线OTA类企业,在此类网站上形成、积累了大量的用户数据,包括酒店、机票、景区门票、旅行社的交易数据。

(7)智慧旅游类系统或平台数据,即城市、景区、酒店、旅行社等信息库统计和记录下了相关数据,可通过这些智慧数据库收集到具体的运营和监管数据,包括旅游出入境及本地游客数量、海陆空各交通枢纽游客流量、饭店入住人数、景区入园人数、各旅游景区游客分布与拥挤状况、旅游经济与环境现状等特征数据。

3.数据分析

旅游行业作为一项经济、复杂以及庞大的社会活动,旅游大数据庞大复杂且碎片化。每个旅游业者都会有自己的会员和消费数据记录,这些记录是大数据的基础信息,那么,如何在一堆数字和消费者行为中分析处理并得出结论呢?

(1)结构化数据分析。结构化数据是指在固定字段集合中存放的数据,如关系数据和电子表格数据,属于传统的数据技术。结构化数据的分析处理相对简单,比如将现在的数字与上一年同期做比较,或直接计算占比等。

(2)非结构化数据分析。非结构化数据是指难以用数据库二维逻辑表现的数据,包括文本数据以及未标记的视频、音频和图像数据等。

处理非结构化数据时,首先要看懂消费者行为,包括浏览、预订、出行等整个过程。比如现在很多游客会在OTA(在线旅游代理商)上比价和预订酒店,其搜索的关键词和浏览痕迹会体现在OTA的记录里,如果客人浏览过这家酒店的页面却跳转了,并未下订单,则可以通过这个记录分析该客人不下单的原因,当这个客人通过价格、品牌、区域等关键词排序查找酒店信息后,其留下的浏览记录则可以统计出人们是对于价格敏感还是品牌敏感。此外针对互联网上的旅游评论,大数据还可采用非结构化的方式对评论内容的情感心理偏好等做出判断。

(3)半结构化数据则介于两者之间,是用标签和其他标志划分数据元素的数据,可扩展标记语言和超文本标记语言都属于半结构化数据。

(二)旅游大数据挖掘服务

大数据是庞大复杂且碎片化的,无从处理和编辑,大数据分析的目的就是要把隐藏在一大批看起来杂乱无章的数据中的信息集中、萃取和提炼出来,以便找出研究对象的内在规律。要快速挖掘出数据的价值,寻找到隐藏在沙里的“金子”,第一步就是去除不需要的石头和沙砾,在大数据分析过程中,这个过程叫数据清洗,也可以理解为数据的预分析,这对数据挖掘的方向有重要影响。

数据挖掘可称为数据的知识发现,是从大量不完全的、模糊的、有噪声的随机数据中提取隐含在数据中的有价值的信息,并通过统计、在线分析处理、情报检索、机器学习、专家系统模式识别等众多方法实现数据分析的目标,通常与计算机科学有关。它是一个基于机器学习、人工智能、数据库、模式识别等的决策支持过程,可以自动分析大量数据,做出归纳性推理,并从中挖掘出潜在模式,为用户提供决策性支持。

大数据挖掘技术主要包括关联分析、序列模式、分类、聚类、异常检测等。在旅游大数据挖掘分析应用中可以采用关联分析对旅游数据进行搜索,从中找出出现概率较高的模式,或者通过数据的聚类与分类,分析旅游数据的相似性,将相似的数据存放在一起,为决策者提供决策支持。

具体而言,旅游大数据的挖掘聚焦以下三个层面:

1.挖掘旅游活动信息

通过分析游客浏览旅游网站的日志,利用数据挖掘技术发现用户常见的浏览行为,或通过游客游记、评论等内容中涉及的旅游活动安排,掌握游客感兴趣的旅游目标和信息。针对这些内容的数据挖掘可帮助旅游企业和管理部门进一步优化旅游产品的线路组合策略,提升旅游管理服务,甚至发现新的旅游项目与旅游目的地。例如,通过数据挖掘分析,某游客在浏览张家界国家森林公园网页信息的同时,浏览了凤凰古城网页信息,由此可以得知,游客在游玩张家界国家森林公园之后继续游玩凤凰古城的概率很大,反之也成立。因此,旅游管理部门可以在两个景区之间增加旅游大巴,或者在张家界国家森林公园网页中推荐凤凰古城网页。

针对客户的旅游爱好与需求可提供个性化的旅游建议和推荐旅游线路,协助旅游者做出相应的旅游计划。如携程等在线旅游企业开发的定制旅游服务,通过分析客户提交的个人信息,根据客户特征来推荐(或者说定制)更适合、更舒适的旅游线路。

2.挖掘潜在旅游市场

通过旅游数据挖掘能够获得潜在的旅游客户,主要采用数据聚类与分析方法。对于新的游客,通过对游客的访问记录进行聚类与分析,识别潜在的旅游客户,向其推荐感兴趣的旅游动态。比如,用户虽然并未明确浏览过旅游网站信息,但经常浏览非登录地的住宿信息,则该用户很可能是位经常出差的商务人士,可以在住宿页面推荐当地特色休闲旅游动态。

大数据可以针对特定旅游产品做出需求预测,使企业管理者掌握和了解旅游行业潜在的市场需求,把握未来一段时间每个细分市场的产品销售量和产品价格走势等,从而使企业能够通过价格的杠杆来调节市场的供需平衡,并针对不同的细分市场来实行动态定价和差别定价。此外,通过定位到的潜在旅游市场群体,旅游营销可以更加准确地定位到那些已经搜索和预订的旅行者细分市场,将营销嵌入整个旅行环节内部并实现精准营销。

3.挖掘旅游的满意度

在微博、微信、论坛、评论版等平台随处可见网友在旅游目的地的游玩点评,点评内容涉及住宿、餐饮、景区景点、服务人员、休闲设施等各个方面。通过收集网上旅游行业的评论数据,建立网评大数据库,利用分词、聚类、情感分析了解消费者的消费行为、价值趣向、评论中体现的新消费需求和企业产品质量问题,改进和创新产品,量化产品价值,制订合理的价格,提高服务质量,从而获取更大的收益。

(三)数据分析库

将分析模型与结果保存起来,作为数据分析工具,便于开发人员快速地进行旅游数据挖掘应用。数据分析模型常作为数据分析的工具为开发人员所采用,数据通过合理的算法模型分析后能快速地进行旅游数据挖掘应用。

旅游行业是高度复杂、高度关联的行业,旅游部门对大数据的分析内容包括旅游市场需求预测、旅游景区和旅游供应商销售预测、旅游产品优化、资源库存管理、多渠道市场营销方案优化、旅游税收流失分析等。旅游部门和企业需要对来自不同渠道的数据源进行整合分析,如利用在线门户网站和旅游运营商的数据,使用不同参数提高销售和市场营销的有效性。

社交媒体上的非结构性数据是研究游客行为模式的最佳资料。社交媒体还提供了丰富的群体情感信息,帮助政府和企业分析市场趋势和游客偏好,提出细分市场的销售战略,识别未知的市场风险。

(四)数据结果的可视化

可视化(Visualization)是利用计算机图形学和图像处理技术,将数据转换成图形或图像在屏幕上显示出来,并利用数据分析和开发工具发现其中的未知信息,并进行交互处理的理论、方法和技术。通过可视化(图表等)工具展现挖掘结果。在碎片化时代,用户每天面对海量的信息,可视化数据结果可以让用户更加直观地了解和记住相关结果和知识。

作为旅游行业,数据可视化的方法和技术发展的速度不容小觑,它使大数据处理和分析形成了一个从数据整合、分析、挖掘到展示的完整闭环。数据可视化是对大型数据库或数据仓库中数据的可视化,这是可视化技术在非空间数据领域的应用,不再局限于通过关系数据表来观察和分析数据信息,还能以更直观的方式看到数据及其结构关系,最直白的解释就是用图和表来呈现数据的结果。它的起点来自独立的关系型数据库,经过数据整合之后形成统一的、多源的数据存储系统,再根据用户的需求,重新取出若干数据子集,或构造多维立方体进行联机分析,或进行数据挖掘,发现隐藏的规律和趋势。如果挖掘的结果经得起现实的检验,那就形成了新的知识,这种知识还可以通过数据可视化表达、展示和传递。

数据经过一系列的清洗、分析处理之后,如何以合适的方式表达出来才有它独特的意义。数据展现就是如何以更直观和互动的方式把分析结果展示出来,便于人们理解,被理解才能被使用,这样一系列的大数据处理才能变得有意义。大数据的分析系统必须提供数据来源、分析过程、查询机制等一系列的信息,最终以图表、文字等可视化的方式呈现在我们眼前。

目前,大多数的办公和统计软件都能对数据分析结果进行可视化,例如EXCEL、SPSS等。当用户对数据结果可视化有特殊要求时,可以借助C++、PYTHON、R等编程语言工具实现。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈