K-set

duality between point and line

二维平面上有一条直线 和一个点 ,现在我想描述一下点和直线之间的相对位置; 点如果在直线上面,说明 的时候直线取得的 小于 ,也就是说 ,这里也可以将 看成系数, 当成带入的坐标,表示的意思变成 这个点位于直线 的上面

upper envelope of linear functions

现在二维平面上有很多条直线,我想找到最上面的边缘线(upper envelope)

fig1

假设在横坐标为 处直线 位于 upper envelope 上,这个点 位于所有其他直线上方, 那么根据对偶,这些直线对偶对应的点也都位于点 对应的直线的上方,而实际上这条直线就是凸包的下边缘, 因为它一定过某个直线对偶对应的点。

k-level

k-level 是推广的upper envelope,找的是最上面的k条直线(实际上定义是下方正好有k条直线的那个边缘线), 也就是需要找到正好上方有k-1条直线的那个边缘线。这个边缘线上的点上方应该有恰好k-1条直线, 下方有n-k条直线。类似upper envelope 的处理,研究和直线互为对偶的点。要找的是一个类似凸包下边缘的东西 上的点,这些点对应的直线就是能够出现在k-level 边缘线上的那些直线。

下面是 1999 Timothy M. Chan 中的算法

首先容易的方法是枚举所有直线的交点 ,然后对这些交点分出的所有区间计算最大的k个直线(应该是 个区间,每个区间用median of medians线性时间找到top k)

1999 Timothy M. Chan 的思路是从左到右扫描x轴,维护两个优先队列,一个维护在当前的x rank小于k的直线是哪些,一个维护大于等于k的是哪些。如果把 横轴x看成时间,优先队列在维护一些会在一维直线上做匀速运动的点,这种东西叫做 kinetic data structure,实现方法先不讨论

有了这种数据结构之后就可以按照这样的步骤维护 k-level: fig2 可以看出来k-level的复杂度就相当于m次插入、大小为n的这种优先队列维护起来的复杂度 ## detail

目前 kinetic priority queue 的复杂度

kinetic priority queue 需要实现的操作: - 插入点 - 删除点 - advance(把时间往后推) - 维护最小值

文中讨论复杂度基于两个上界:优先队列中点的数量的上界 ,插入操作的数量上界

Observation 2.1 For elements moving linearly, the number of times S.min changes is .

实际上kinetic priority queue在维护的是一个子集的lower envelope,lower envelope上的breakpoint数量有 上限 (来源见1999 Timothy M. Chan)(这个奇怪复杂度是怎么来的?zh.wikipedia, en.wikipedia lower envelope 上的线段编号写成一个序列就 是这个Davenport–Schinzel sequence)

实际上这个界对于直线是非常不紧的,线段才可能产生长度为4的交替子序列,直线只能产生长度为2的;所以线段是3阶DS sequence而 直线是1阶,从对偶对应的凸包也可以看出breakpoint上限是 ,所以文章这里考虑的是带上插入删除操作的

使用暴力方法,复杂度

复杂度这里实际上算的是从一个空的KPQ开始,插入点,删除点,advance,按照需要进行操作,直到 花费的时间; Observation给出了advance操作的数量上限,每次advance必然发生 改变。插入和删除操作数量上界是

文章中用分治,把每个kinetic priority queue 维护的集合分成 组,每组用一个kinetic priority queue维护( ), 然后再用一个额外的kinetic priority queue 维护这r个子队列最小值的最小值

KPQ 只需要暴露出上面说的四种操作,首先 如下,很好理解 fig3

:

fig4

insert 把要插入的元素放在大小最小的那个子队列 中,然后更新 中的那个 ,最后维护

delete 完全类似

表示递归方法中一个KPQ做advance操作的数量

其中 (所有插入次数被分配到了每个子队列中)

层数 个数 工作量(一整层)
1 1
2 r
3 (r个一组,一共r组)

最后得到

sum里面直接取最大值,可以得到上面的结果

复杂度:

RHS第二项需要解释, 完全是上面 维护产生的复杂度, 现在文章认为 使用暴力方法,插入删除操作复杂度都是 A5说明每次 的最小值改变 都会进行一次插入和一次删除,所以 就会让 产生 次插入和删除,每次 , 这部分复杂度就是 (因为n小于m,队列中的元素数量肯定小于插入次数, 执行次数一定少于 ,这里不用继续考虑D5和I5操作了);其次是A1和M2中找 最小的P,单独用一个大小为r的堆来 维护这个信息,回答A1和M2是常数时间,但是每次任意一个 发生改变或者发生插入删除的时候都要 时间维护, 需要 ,令

这种递归方法我写了代码github

感觉写的有点丑陋,而且用的是boost的heap

优化

需要用到 semi dynamic convex hull (只支持删除操作的动态凸包), 去查了一下发现很多有趣的结果, - KIRKPATRICK二维平面凸包竟然做到 n是输入大小,k是输出大小。 - 完全动态的凸包(支持插入和删除)Overmars 做到了 - semi dynamic convex hull 仅插入单次操作可以做到单次 ,仅删除可以做到单次均摊

先不讨论semi dynamic convex hull的实现,如果已经有了一个维护删除操作下的凸包的数据结构,如何实现一个仅支持删除操作的KPQ?

首先如果是仅删除的KPQ,寻找最小值实际上就是在一些都从左端点在x=0、右端点位置不同的线段组成的 lower envelope, 同样根据上面的 DS sequence , 可以看出两个线段组成最长交替子序列长度是3,是一个2阶DS sequence,得知 次数上界也是

那么我们可以先算出最开始的 lower envelope(一个凸包, )然后再用semi dynamic convex hull去维护 删除操作,n个删除操作只需要 于是借用上面定义的衡量KPQ的复杂度

这种方法先不写了,我认为我能把它成功写出的概率不大,而且过于复杂。首先上面说的 semi dynamic convex hull 只能做到只处理插入操作和只处理删除操作, 得到的 kinetic priority queue 也是只能支持一种操作, 1980 Bentley & Saxe 发明了用一种叫做binary-counting的技巧把只支持一种操作的数据结构变成支持插入和删除的,维护的时间加一个 ; 为了消除掉这个 还需要使用什么 b-ary。 最终复杂度能达到

随机化版本

AGARWAL et al.

对于 上的k-level[CS89]K. L. CLARKSON AND P. W. SHOR, Applications of random sampling in computational geometry, II, Discrete Comput. Geom., 4 (1989), pp. 387–421 证明了复杂度是 ,上面链接中二维平面k-level复杂度 是 应该在到目前为止随机化算法中worst case是最优的