由于驾驶员,乘客和平台本身的利益存在冲突,因此要为Uber,Lyft和其他乘车共享服务的驾驶员实现稳定的薪酬是一个挑战。但是,这三者都可以受益于缩短响应时间和改善整个城市的供应利用率。在一篇论文中,波士顿大学的研究人员描述了一种利用框架和强化学习环境的乘车共享协调方法。在实验中,他们证明有可能在不损害骑手经验的情况下公平地最大化驾驶员的收入。

为了实现福利目标,例如零工的生活工资,经济学家倾向于依靠动态定价机制来扼杀过剩的需求,同时解决特定社区的供需失衡问题。但是,将这些机制应用于乘车共享时,可能会对驾驶员和骑手产生歧视性影响。合著者的另一种选择是“基于需求”的协调框架,它提供了“无羡慕”的建议,这意味着在相同地点和时间工作的驾驶员没有理由羡慕彼此的收入。

该框架源于以下观察结果:驾驶员通常独立行事,而城市中供需失衡的情况通常仅限于特定社区。供需耦合可以帮助公司学习驾驶员何时何地需要协调。为了支持该目标,该框架将强化学习算法与受供应不平衡社区数量限制的组合技术相结合。

为了进行模拟,该框架将城市划分为不重叠的区域,时间逐步推进,驾驶员在区域之间旅行以接送乘客。通过将乘客从一个区域带到另一个区域,驾驶员可以获得奖励,其中包括他们的收入减去汽油和常规车辆维护等成本。在每个时间步上,当前不在旅途中的驾驶员都可以选择以下两种操作之一:

等待中,涉及在当前区域中等待乘客。如果成功,则可能导致前往另一个区域的旅行,驾驶员会为此获得奖励。但是,当选择在某个区域中等待的驾驶员数量超过特定时间的区域需求时,可能会发生不成功的等待,而驾驶员无法获得奖励。

搬迁,这涉及在没有乘客的情况下从一个区域搬到另一个区域。司机为此付出了代价。

研究人员的模型提醒驾驶员,他们可以在每个时间步长在每个区域中采取最佳行动。例如,当两个驾驶员从出发地争夺一次乘车时,其中一个驾驶员得到驾驶员,获得报酬并在目的地结束。另一个给了另一个建议。

为了评估模型,合著者在OpenAI的工具包Gym中建立了一个数字环境,用于开发和比较强化学习算法。为了进行训练,他们允许虚拟驾驶员以城市的乘车需求数据的形式重复交互:

在每个交互的第一阶段,驾驶员通过选择随机动作来表现出良好的表现。

在第二阶段中,驱动程序的行为表现为利用直到上一次交互之前所学的策略的剥削行为。该策略建议驾驶员根据一天中的时间和位置采取行动,但是它还可以防止在以下情况下出现供需失衡:(1)大量驾驶员因需求不足而重新安置到同一区域;或(2)人数太少司机搬到了需求过多的区域。度量标准(协调程度)表示位于同一区域的驾驶员在多大程度上需要协调其行动。只要区域具有积极的协调程度,该策略就会向该区域内的部分驾驶员建议采取剥削性行动。

在第三阶段,在探索和开发阶段建议采取的行动导致驾驶员上车或将自己转移到不同的区域。

在一个实验中,该团队向其框架提供了纽约市Yellow出租车的公共语料库,其中包含位置,票价,行进距离以及每天约20万次游乐设施的其他信息。他们分配了一天的数据量(2015年9月的第一个星期一),将其分为288个时间片,长度为5分钟,并按开始时间进行了索引。然后,他们在大约5,000位驾驶员之间的数百次互动中训练了该模型。

共同作者报告说,白天约有95%的需求对他们的框架感到满意。此外,附近的驾驶员可以在10分钟内满足10%的未满足需求,而在15分钟内可以满足70%以上的需求,并且到一天结束时,驾驶员平均可赚取535美元。

该团队解释说:“在没有协调的情况下,我们希望这座城市的所有司机都能够迁往曼哈顿,以满足早晨上下班期间的大量需求。”“但是,我们的模型建议一定比例的驾驶员在纽约市外行政区等待清晨通勤到曼哈顿。值得注意的是,该模型能够了解与时间相关的热点的需求趋势,例如该城市东南部的肯尼迪国际机场。相比之下,该模型在晚上通勤到外部自治市镇时,强烈建议驾驶员在曼哈顿内等候。”

当然,值得注意的是,纽约市的司机人数远远超过5,000名,估计约为80,000名。另一个要考虑的因素是,该框架无法考虑人口统计或旅行目的之类的事情,这可能会影响驾驶员在某个区域停留的决定。

尽管如此,该论文仍在为目前的拼车算法做出贡献,这表明当前的拼车算法存在严重缺陷。国家经济研究局(National Bureau of Economic Research)在2016年10月的一份报告中发现,在波士顿和西雅图等城市,拥有非裔美国人名字的男性骑手被取消骑行的可能性是三倍,而等待骑行的时间要长35%。东北大学研究人员合着的另一项研究表明,相距仅几米的用户可能会被收取不同的票价。乔治华盛顿大学(George Washington University)研究人员发表的预印本发表了共享乘车定价算法中社会偏见的证据。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。