静态数据平台概述
有关 Expedia 静态数据平台的用途和结构的指南
平台用途
静态数据下载平台旨在为 EG 合作伙伴提供对完整静态住宿数据集的访问权限,其结构旨在实现下载过程和将数据加载到合作伙伴托管的存储库中的完全自动化。
什么是静态数据?
几乎所有有关住宿的信息都不会经常变动,一般情况下,名称、地址、住宿服务设施等信息每周、每月都是相同的。这类数据被认为是静态数据。
虽然静态数据可能多年都保持不变,但住宿的当前优惠、定价和房态可能非常易变,热门目的地尤其如此。这种易变性是促使合作伙伴如此频繁地查询 Expedia 住宿 API 的原因。
为什么要单独列出静态数据?
通过将静态数据与易变数据区分开来,合作伙伴可以在本地托管静态数据,使其用户能够搜索指定区域中所有住宿的特色,而无需对 Expedia 进行 API 调用。在用户有一个或多个有兴趣预订的住宿后,就可以执行更简洁的 API 调用来访问定价和房态。
通过向合作伙伴方便地提供静态数据,我们可以为客户提供更快、更高效的住宿选择流程选项,同时减少合作伙伴和 Expedia 的庞大 API 调用。
平台结构
平台上的下载文件将由一组 9 个可下载文件组成:
摘要数据文件
此文件将包含所有可用 Expedia Group 住宿 ID 的列表(总计约 300 万),以及每个住宿的基本信息。此文件将替换当前可从本网站其他部分获取的标题为“住宿:库存(酒店 ID)”的现有文件。
任何正在寻找紧凑格式的完整 EG 住宿列表的合作伙伴都应该使用此文件。
完整的数据文件集
对于寻求更完整的信息的合作伙伴,我们建议您下载静态住宿数据的完整合集。
请注意,摘要数据文件中的数据是 8 个完整文件中总数据的子集。如果您下载完整的文件集,您将获得摘要数据文件中包含的所有信息,且另含更多信息。
文件结构
由于涉及的数据量很大,所有下载都将包含一个压缩存档,其中含有多个文件,使处理更加简单。
上面列出的每个文件都将包含每个住宿的住宿编号,这些编号采用 EG 目前支持的三种格式。这些值将充当“主密钥”,使合作伙伴能够准确地将数据关联在一起。
每个文件都将以 JSONL 结构进行格式化,这意味着文件的每一行都将包含完整的 JSON 记录,并且在文件已拆分的情况下,拆分将在记录间隙进行,以便用户可以通过标准化的加载流程加载所有的 文件数据,也可以手动读取数据。
文件子集
由于该平台首次发布,我们仅提供单个文件范围的下载:包含指定类型的所有可预订住宿和数据的文件。随着时间的推移,我们计划为合作伙伴提供一种下载总文件的较小子集的方法,该方法基于自上次更新或下载以来的时间、地理地区,或者通过可自定义性更强的界面,使合作伙伴能够下载经过筛选可满足合作伙伴特殊需求的较小数据集。
虽然我们希望同时提供所有数据、特性和功能,但逐步交付功能更切合实际。在完整平台全部发布后,我们将探索是否有更好的方式来提供更灵活的数据范围控制。