预览加载中,请您耐心等待几秒...
1/9
2/9
3/9
4/9
5/9
6/9
7/9
8/9
9/9

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113657671A(43)申请公布日2021.11.16(21)申请号202110947624.4(22)申请日2021.08.18(71)申请人北京航空航天大学地址100000北京市海淀区学院路37号(72)发明人于滨方轲陈鹏飞(74)专利代理机构合肥云道尔知识产权代理事务所(特殊普通合伙)34230代理人司楠(51)Int.Cl.G06Q10/04(2012.01)G06Q50/30(2012.01)G06N20/20(2019.01)G06N5/00(2006.01)权利要求书1页说明书5页附图2页(54)发明名称一种基于集成学习的航班延误预测方法(57)摘要本发明公开了一种基于集成学习的航班延误预测方法,包括步骤S1:获取目标航班相关的航空公司属性、航班属性、执行班机属性、紧前航班的延误信息、起飞机场及航站信息,并对所获数据进行预处理;S2:根据预处理后信息提取多维解释变量并计算航班延误;S3:采用聚类算法设置延误分类规则;S4:依照航班延误时长设置延误等级标签;S5:基于集成学习算法模型并训练数据;S6:利用航班的多维特征预测目标航班的延误情况。本发明提供的一种基于轻量级梯度提升机的航班起飞延误预测方法,能够显著提升训练效率、降低内存消耗并且可以获取更高的准确率。CN113657671ACN113657671A权利要求书1/1页1.一种基于集成学习的航班延误预测方法,其特征在于,包括以下步骤:S1:获取目标航班相关的航空公司属性、航班属性、执行班机属性、紧前航班的延误信息、起飞机场及航站属性,并对所获数据进行预处理;S2:根据预处理后信息提取多维解释变量并计算航班延误;S3:采用聚类算法设置延误分类规则;S4:依照航班延误时长设置延误等级标签;S5:构建基于集成学习算法的模型并训练数据;S6:利用航班的多维特征预测目标航班的延误情况。2.根据权利要求1所述的一种基于集成学习的航班延误预测方法,其特征在于:所述S1步骤中,预处理步骤包括对异常数据进行剔除,对具有少量特征缺失的数据进行补全,对班机、航班、航线、机场、航站进行编码,特征数值化。3.根据权利要求1所述的一种基于集成学习的航班延误预测方法,其特征在于,所述S2步骤中,提取多维解释变量可分为:航空公司属性:航线所属基地机场编号、航线规模;航班属性:是否为国际航班、是否经停、预计周转时间、旅客数量、航站楼编号、历史平均延误;班机属性:容量、最小周转时间;紧前航班属性:延误、飞行间隔;机场属性:机场航班密度、机场旅客密度;航站属性:准点率。4.根据权利要求1所述的一种基于集成学习的航班延误预测方法,其特征在于,所述S3步骤进一步包括以下步骤:S3(1):选取带有K个集群的初始分区;S3(2):将样本点按照样本点与聚类中心的距离分配到最近的聚类中心,生成新的分区;S3(3):更新集群中心;S3(4):迭代步骤S3(2)和S3(3),当集群离散度最小时聚类算法收敛。5.根据权利要求4所述的一种基于集成学习的航班延误预测方法,其特征在于:所述集群数量K由肘部法确定。6.根据权利要求4所述的一种基于集成学习的航班延误预测方法,其特征在于:单个集群离散度表达式为:总集群离散度表达式为:7.根据权利要求1所述的一种基于集成学习的航班延误预测方法,其特征在于:所述S5步骤中提供的集成学习算法为轻量级梯度提升机。8.根据权利要求7所述的一种基于集成学习的航班延误预测方法,其特征在于:所述轻量级梯度提升机包括单边梯度抽样算法、直方图算法以及互斥特征捆绑算法。2CN113657671A说明书1/5页一种基于集成学习的航班延误预测方法技术领域[0001]本发明涉及航空管理领域,具体涉及一种基于集成学习的航班延误预测方法。背景技术[0002]在航空运输系统中,对航班起飞延误进行合理准确的预测是十分必要的。旅客如果能够提前获取航班起飞信息就可以有效安排行程,减少不必要的等待时间以及等待过程中的焦虑。同时,对机场而言,航班起飞延误预测提供短时间内机场的状态,机场可根据预测结果更高效安排相关设施如摆渡车和登机桥廊的调配,减少不必要的设备占用。因此,需要高质量的航班起飞延误预测模型,为乘客和机场提供准确的航班起飞信息。[0003]航班延误预测问题近十年受到大量学者关注。对该问题的拓展可以分为两方面:就解释变量角度而言,现有研究中,PfeilandBalakrishnan考虑天气因素;RebolloandBalakrishnan的研究中考虑季节性的影响;Du考虑了延迟的传递;MayerandSinai考虑了空中交通管制。就模型算法角度而言,Balakrishna等人使用马尔可夫决策过程建模,采用了一种机器学习算法预测航班