您现在的位置是:首页 > 要闻 > 正文

研究人员使用人工智能和模拟来优化共享乘车的好处

发布时间:2022-04-06 09:04:02编辑:来源:

由于司机、乘客和平台本身的利益存在冲突,对于优步、Lyft等以车共享服务的司机来说,实现稳定的薪资是一个挑战。然而,这三者都可以从缩短响应时间和提高整个城市的供应利用率中受益。在一篇论文中,波士顿大学的研究人员描述了一种使用框架和增强的学习环境来共享和协调公共汽车的方法。在实验中,他们证明了在不损害骑手体验的情况下,公平地最大化驾驶员的收入是可能的。

为了实现福利目标,如零工的生活工资,经济学家倾向于依靠动态定价机制来抑制过剩需求,解决特定社区的供需失衡。然而,当这些机制应用于共享乘车时,它们可能会对驾驶员和乘客产生歧视性影响。合著者的另一个选择是“基于需求”的协调框架,它提供了“不羡慕”的建议,这意味着在同一地点和时间工作的司机没有理由羡慕彼此的收入。

该框架源于以下观察:司机通常独立行动,而城市的供需不平衡通常仅限于特定社区。供需耦合可以帮助公司了解驱动因素何时何地需要协调。为了支持这一目标,该框架将强化学习算法与受不平衡供应社区数量限制的组合技术相结合。

为了模拟,框架将城市划分为不重叠的区域,时间逐渐推进。司机在两个地区之间穿梭,接送乘客。通过将乘客从一个地区带到另一个地区,司机可以获得奖励,包括他们的收入减去汽油和定期车辆维护的费用。在每个时间步骤中,当前不在道路上的驾驶员可以选择以下两种操作之一:

等待包括在当前区域等待乘客。如果成功,可能会导致去另一个地区旅行,司机会因此得到奖励。但当某一区域内等待的司机数量超过该区域特定时间的需求时,可能会出现等待不成功的情况,司机无法获得奖励。

搬迁,即在没有乘客的情况下从一个地区搬到另一个地区。司机为此付出了代价。

研究人员的模型提醒司机,他们可以在每个时间步骤在每个领域采取最佳行动。例如,当两个司机从出发地点竞争一程时,其中一个人得到司机,得到报酬,并在目的地结束。一个给了另一个建议。

为了评估该模型,共同作者在OpenAI的工具包Gym中建立了一个数字环境,用于开发和比较强化学习算法。对于培训,他们允许虚拟驾驶员以城市乘车需求数据的形式重复互动:

在每次交互的第一阶段,驱动程序通过选择随机动作来显示良好的性能。

在第二阶段,驾驶员的行为是利用学到的策略直到最后一次交互的剥削行为。该策略建议司机根据一天的时间和地点采取行动,但也可以防止以下情况下的供需失衡:(1)大量司机因需求不足而搬迁到同一地区;或者(2)太少的司机搬到需求太大的地区。衡量标准(协调度)表明同一地区有多少司机需要协调行动。只要该地区具有积极的协调程度,该战略将建议该地区的一些驱动因素采取剥削行动。

第三阶段,探索开发阶段建议的动作,引导司机上车或换乘到不同的区域。

在一项实验中,该团队为其框架提供了一个纽约黄色出租车的公共语料库,其中包括位置、票价、行驶距离和其他关于每天20万次乘坐的信息。他们将一天的数据(2015年9月的第一个星期一)进行分配,分成288个时长为5分钟的时间片,按照开始时间进行索引。然后,他们在大约5000名司机之间的数百次互动中训练了该模型。

合著者报告说,白天大约95%的需求对他们的框架感到满意。此外,附近的司机可以在10分钟内满足10%的未满足需求,15分钟内可以满足70%以上的需求,一天下来,平均每个司机可以赚535美元。

该团队解释说:“在缺乏协调的情况下,我们希望这个城市的所有司机都能搬到曼哈顿,以满足早上通勤期间的大量需求。”“然而,我们的模型表明,一定比例的司机会在清晨在纽约以外的行政区等待通勤到曼哈顿。值得注意的是,该模型可以了解与时间相关的热点的需求趋势,如城市东南部的肯尼迪国际机场。相比之下,当晚上通勤到外部城市时,该模型强烈建议司机在曼哈顿等待。”

当然,值得注意的是,纽约的司机数量远远超过5000人,估计在8万人左右。另一个需要考虑的因素是,该框架不能考虑人口统计或旅行目的等因素,这些因素可能会影响司机留在某个地区的决定。

尽管如此,本文仍对目前的拼车算法有所贡献,说明目前的拼车算法存在严重缺陷。在2016年10月的一份报告中,美国国家经济研究局发现,在波士顿和西雅图等城市,有非裔美国人名字的男性骑手被取消的可能性是其他城市的三倍,等待骑行的时间要长35%。东北大学研究人员合作的另一项研究显示,相距仅几米的用户可能会被收取不同的费用。乔治华盛顿大学的研究人员发表的预印本公布了共享乘车定价算法中社会偏见的证据。

标签:

上一篇
下一篇

最新文章