SLAM – MathSword数值计算软件

基于GPS、IMU、轮速的ESKF

2024年1月25日2024年3月6日 shikang999 2 条评论

在使用传感器采集到一些数据后，需要计算车辆位姿。在融合GPS位置、IMU角速度、轮速后，可以通过ESKF进行求解。ESKF本质还是一个EKF过程，只是这里面更新量换成了值较小的误差状态量。由于是EKF过程，只需要导出下面公式(10)里的 $F、F_i、H$ 矩阵，就可以使用EKF过程进行递推。

设真值状态变量 $\mathbf{x}=[\mathbf{p},\theta,\mathbf{b}]$ ,其分别表示位置、朝向、车辆坐标系下角速度偏置，误差状态量为 $\delta\mathbf{x}=[\delta\mathbf{p},\delta\theta,\delta\mathbf{b}]$ ， $t$ 时刻含有噪声状态量为 $\mathbf{x}_t=[\mathbf{p}_t,\theta_t,\mathbf{b}_t]$ 。状态变量之间使用下式进行关联
(1)
$\begin{cases} \mathbf{p}_t &=\mathbf{p}+\delta\mathbf{p} \\ \theta_t&=\theta+\delta\theta&,R_t=\exp(\theta_t^\wedge) \approx \exp(\theta^\wedge)\exp(\delta\theta^\wedge)=R\exp(\delta\theta^\wedge) \\ \mathbf{b}_t&=\mathbf{b}+\delta\mathbf{b} \end{cases}$
以常见的四轮汽车模型为例，现在已知车辆坐标系下的后左右轮速 $v_l,v_r$ 以及角速度 $\bar{\mathbf{w}}$ ,这里以后左右轮中心作为车辆坐标系原点，设 $\bar{\mathbf{v}}=[\dfrac{v_x+v_y}{2},0,0]$ ，速度与角速度噪声为 $\eta_v,\eta_w$ ，接下来需要找到满足如下方程的 $F,F_i$
(2)
$\delta\mathbf{x}=F\delta\mathbf{x}+F_i\begin{bmatrix} \eta_v \\ \eta_w \end{bmatrix}$
根据物理模型有
(3)
$\begin{aligned} &\begin{cases} \dot{\mathbf{p}}_t &=R_t(\bar{\mathbf{v}}+\eta_v) \\ \dot{R}_t&=R_t(\bar{\mathbf{w}}-\mathbf{b}_t-\eta_w)^\wedge \\ \dot{\mathbf{b}}_t&=\eta_w \end{cases} \\ &\begin{cases} \dot{\mathbf{p}} &=R\bar{\mathbf{v}} \\ \dot{R}&=R(\bar{\mathbf{w}}-\mathbf{b})^\wedge \\ \dot{\mathbf{b}}&=\mathbf{0} \end{cases} \end{aligned}$
对于位置更新，结合(1)(3)可得
(4)
$\begin{aligned} \delta \dot{\mathbf{p}} &=\dot{\mathbf{p}}_t-\dot{\mathbf{p}} \\ &=(R_t-R)\bar{\mathbf{v}}+R_t\eta_v \\ &\approx (R\exp(\delta \theta^\wedge)-R)\bar{\mathbf{v}}+R\exp(\delta \theta^\wedge)\eta_v \\ &\approx (R(I+\delta \theta^\wedge)-R)\bar{\mathbf{v}}+R(I+\delta \theta^\wedge)\eta_v \\ &=R\delta\theta^\wedge\bar{\mathbf{v}}+R\delta\theta^\wedge\eta_v+R\eta_v \\ &=-R(\bar{\mathbf{v}}+\eta_v)^\wedge\delta\theta+R\eta_v \\ &\approx -R\bar{\mathbf{v}}^\wedge\delta\theta+R\eta_v \end{aligned}$
对于旋转部分，结合(1)(3)可得
(5)
$\begin{aligned} \dot{R}_t&=\dot{R}\exp(\delta\theta^\wedge)+R\dot{\exp(\delta \theta^\wedge)} \\&=\dot{R}\exp(\delta\theta^\wedge)+R\exp(\delta\theta^\wedge)(\mathbf{J}_r(\delta\theta)\delta\dot{\theta})^\wedge \\&\Downarrow \\ \dot{R}_t&\approx\dot{R}\exp(\delta\theta^\wedge)+R\exp(\delta\theta^\wedge)\delta\dot{\theta}^\wedge \\&\Downarrow \\ R_t(\bar{\mathbf{w}}-\mathbf{b}_t-\eta_w)^\wedge&=R(\bar{\mathbf{w}}-\mathbf{b})^\wedge\exp(\delta\theta^\wedge)+R\exp(\delta\theta^\wedge)\delta\dot{\theta}^\wedge \\&\Downarrow \\ R\exp(\delta\theta^\wedge)(\bar{\mathbf{w}}-\mathbf{b}-\delta\mathbf{b}-\eta_w)^\wedge&=R(\bar{\mathbf{w}}-\mathbf{b})^\wedge\exp(\delta\theta^\wedge)+R\exp(\delta\theta^\wedge)\delta\dot{\theta}^\wedge \\&\Downarrow \\ \exp(\delta\theta^\wedge)(\bar{\mathbf{w}}-\mathbf{b}-\delta\mathbf{b}-\eta_w)^\wedge&=(\bar{\mathbf{w}}-\mathbf{b})^\wedge\exp(\delta\theta^\wedge)+\exp(\delta\theta^\wedge)\delta\dot{\theta}^\wedge \\&\Downarrow \\ \delta\dot{\theta}^\wedge&=(\bar{\mathbf{w}}-\mathbf{b}-\delta\mathbf{b}-\eta_w)^\wedge-\exp(-\delta\theta^\wedge)(\bar{\mathbf{w}}-\mathbf{b})^\wedge\exp(\delta\theta^\wedge) \\ &\approx(\bar{\mathbf{w}}-\mathbf{b}-\delta\mathbf{b}-\eta_w)^\wedge-(I-\delta\theta^\wedge)(\bar{\mathbf{w}}-\mathbf{b})^\wedge(I+\delta\theta^\wedge) \\ &=(\bar{\mathbf{w}}-\mathbf{b}-\delta\mathbf{b}-\eta_w)^\wedge-(\bar{\mathbf{w}}-\mathbf{b})^\wedge-(\bar{\mathbf{w}}-\mathbf{b})^\wedge\delta\theta^\wedge+\delta\theta^\wedge(\bar{\mathbf{w}}-\mathbf{b})^\wedge+\delta\theta^\wedge(\bar{\mathbf{w}}-\mathbf{b})^\wedge\delta\theta^\wedge \\ &=-(\delta\mathbf{b}+\eta_w)^\wedge-(\bar{\mathbf{w}}-\mathbf{b})^\wedge\delta\theta^\wedge+\delta\theta^\wedge(\bar{\mathbf{w}}-\mathbf{b})^\wedge+\delta\theta^\wedge(\bar{\mathbf{w}}-\mathbf{b}) \\ &\approx -(\delta\mathbf{b}+\eta_w)^\wedge-(\bar{\mathbf{w}}-\mathbf{b})^\wedge\delta\theta^\wedge+\delta\theta^\wedge(\bar{\mathbf{w}}-\mathbf{b})^\wedge \\ &= -(\delta\mathbf{b}+\eta_w)^\wedge+(\delta\theta^\wedge(\bar{\mathbf{w}}-\mathbf{b}))^\wedge \\ &=-(\delta\mathbf{b}+\eta_w)^\wedge-((\bar{\mathbf{w}}-\mathbf{b})^\wedge\delta\theta)^\wedge \\&\Downarrow \\ \delta\dot{\theta}&=-(\delta\mathbf{b}+\eta_w)-(\bar{\mathbf{w}}-\mathbf{b})^\wedge\delta\theta \end{aligned}$
对于角速度偏置部分，结合(1)(3)可以得到
(6)
$\delta\dot{\mathbf{b}}=\dot{\mathbf{b}}_t-\dot{\mathbf{b}} =\eta_w$
因此在一个小时间 $\triangle t$ 内，综合(3)(4)(5)可以得到
(7)
$\begin{aligned} &\begin{cases} \delta \mathbf{p}_{t+\triangle t}&=\delta \mathbf{p}_t+\triangle t\delta \dot{\mathbf{p}}=\delta \mathbf{p}_t-\triangle tR\bar{\mathbf{v}}^\wedge \delta \theta_t+\triangle tR\eta_v \\ \delta \theta_{t+\triangle t}&=\delta \theta_t+\triangle t\delta\dot{\theta}=\delta \theta_t-\triangle t(\bar{\mathbf{w}}-\mathbf{b})^\wedge\delta\theta_t-\triangle t(\delta\mathbf{b}_t+\eta_w) \\ \delta\mathbf{b}_{t+\triangle t}&=\delta\mathbf{b}_t+\triangle t\delta\dot{\mathbf{b}}=\delta\mathbf{b}_t+\triangle t\eta_w \end{cases} \\ &\Downarrow \\ &F=\begin{bmatrix} I &-\triangle tR\bar{\mathbf{v}}^\wedge &\mathbf{0} \\ \mathbf{0} & I-\triangle t(\bar{\mathbf{w}}-\mathbf{b})^\wedge &-\triangle tI \\ \mathbf{0}&\mathbf{0} & I \end{bmatrix} \approx \begin{bmatrix} I &-\triangle tR\bar{\mathbf{v}}^\wedge &\mathbf{0} \\ \mathbf{0} & \exp(-\triangle t(\bar{\mathbf{w}}-\mathbf{b})^\wedge) &-\triangle tI \\ \mathbf{0}&\mathbf{0} & I \end{bmatrix} \\ &F_i=\triangle t\begin{bmatrix} R &\mathbf{0} \\ \mathbf{0} &-I \\ \mathbf{0} & I \end{bmatrix} \end{aligned}$
接下来，以GPS位置 $\bar{\mathbf{p}}$ 作为观测，因此建立观测函数
(8)
$\begin{aligned} \bar{\mathbf{p}} &=z(\mathbf{x},\delta \mathbf{x}) \\ &=\mathbf{p}_t+\triangle tR_t\bar{\mathbf{v}} \\ &=\mathbf{p}+\delta\mathbf{p}+\triangle tR\exp(\delta\theta^\wedge)\bar{\mathbf{v}} \\ &\Downarrow \\ &\begin{cases} \dfrac{\partial\bar{\mathbf{p}}}{\partial\delta \mathbf{p}}&=I \\ \\ \dfrac{\partial\bar{\mathbf{p}}}{\partial\delta \theta}&=\triangle tR\dfrac{\partial(\exp(\delta\theta^\wedge)\bar{\mathbf{v}})}{\partial\delta \theta}\approx-\triangle tR(\exp(\delta\theta^\wedge)\bar{\mathbf{v}})^\wedge \\ \\ \dfrac{\partial\bar{\mathbf{p}}}{\partial\delta \mathbf{b}}&=\mathbf{0} \end{cases} \\ &\Downarrow \\ H&=\begin{bmatrix} I & -\triangle tR(\exp(\delta\theta^\wedge)\bar{\mathbf{v}})^\wedge &\mathbf{0} \end{bmatrix}\approx \begin{bmatrix} I & -\triangle tR\bar{v}^\wedge&\mathbf{0} \end{bmatrix} \end{aligned}$
注意， $H$ 计算中，忽略了二阶小量，这里 $\triangle t、\delta\theta$ 均为小量。

EKF更新完成后，需要对协方差矩阵 $P$ 进行重置。设 $\delta \mathbf{x}'=[\delta \mathbf{p}’,\delta \theta’,\delta\mathbf{b}’]$ 为 $\delta \mathbf{x}$ 受到均值 $\delta \bar{\mathbf{x}}=[\delta \bar{\mathbf{p}},\delta \bar{\theta},\delta\bar{\mathbf{b}}]$ 的影响,因此按照逆重构形式(减法)找到一个满足 $\delta \mathbf{x}'=G\delta\mathbf{x}+…$ 形式的重置矩阵 $G$ :
(9)
$\begin{aligned} &\begin{cases} \delta \mathbf{p}'&=\delta\mathbf{p}-\delta\bar{\mathbf{p}} \\ \\ \delta \theta'&=\log(\exp(\delta\theta'^\wedge))^\vee \\ &\approx \log(\exp(\delta\theta^\wedge)\exp(-\delta\bar{\theta})^\wedge)^\vee \\ &\approx (I-\dfrac{1}{2}\delta\bar{\theta}^\wedge)\delta\theta-\delta\bar{\theta} \\ \\ \delta\mathbf{b}'&=\delta\mathbf{b}-\delta\bar{\mathbf{b}} \end{cases} \\ &\Downarrow \\ &G=\begin{bmatrix} I &\mathbf{0} & \mathbf{0} \\ \mathbf{0} &I-\dfrac{1}{2}\delta\bar{\theta}^\wedge&\mathbf{0} \\ \mathbf{0} & \mathbf{0} & I \end{bmatrix} \end{aligned}$

3 算法过程
因此，最终的ESKF过程为
(10)
$\begin{aligned} \text{预测}:&\begin{cases} \delta \mathbf{x}&=F\delta\mathbf{x} \\ P&=FPF^T+F_iQF_i^T \end{cases} \\ \text{增益}:&\begin{cases} K&=PH^T(HPH^T+V)^{-1} \end{cases} \\ \text{更新}:&\begin{cases} \delta \mathbf{x}&=K(\bar{\mathbf{p}}-z(\mathbf{x},\delta\mathbf{x})) \\ \mathbf{x}_{t+\triangle t}&=\mathbf{x}_t+\delta\mathbf{x} \\ P&=(I-KH)P(I-KH)^T+KVK^T \end{cases} \\ \text{重置}:&\begin{cases} P&=GPG^T \end{cases} \end{aligned}$
公式里 $V$ 为 $3\times 3$ 的GPS观察的协方差矩阵，而 $Q$ 是噪声协方差矩阵， $Q=\mathbf{Diag}(Cov(\eta_v),Cov(\eta_w))$ ，特别的，对于如下形式的 $Q$ 可进行简化
(11)
$\begin{aligned} Q&=\begin{bmatrix} \alpha I&\mathbf{0} \\ \mathbf{0} &\beta I \end{bmatrix} \\ &\Downarrow \\ F_iQF_i^T&=\triangle t^2\begin{bmatrix} \alpha I &\mathbf{0} & \mathbf{0} \\ \mathbf{0} &\beta I & \mathbf{0} \\ \mathbf{0} & \mathbf{0} &\beta I \end{bmatrix} \end{aligned}$
注意:
① 公式(10)当中 $P$ 的表达式与参考[2]里的不一致，公式(10)里的表达式不局限于 $P$ 是否为方阵，且其有更好的数值稳定性。
② 由于 $\delta \bar{\theta}$ 为0附近一个小量，因此在大部分场景里，可以忽略不计，这时 $G$ 就等价于单位阵，因此不使用重置步骤。

③ $Q、V$ 由仪器提供，或者按经验设置。

④ 计算过程中，注意上面公式里的位置 $\mathbf{p}$ 是全局坐标系， $\bar{\mathbf{v}}、\mathbf{w}、\mathbf{b}$ 为车辆局部坐标系，旋转矩阵 $R$ 为局部坐标系到世界坐标系的表示方式。

参考
[1] Sola J. Quaternion kinematics for the error-state Kalman filter[J]. arXiv preprint arXiv:1711.02508, 2017.
[2] 高翔. 简明ESKF推导. 2022

二维平面的旋转表示与性质

2022年11月18日2024年4月11日 shikang999 评论

1 定义
有时，我们需要在二维平面上处理旋转与平移问题。因此，为了方便计算，这里考虑二维平面上的表示。
在表示之前，这里对一个2维向量 $\mathbf{p}$ ，定义如下运算式
(1)
$\mathbf{p}^\wedge=\begin{bmatrix} p_x \\ p_y \end{bmatrix}^\wedge =\begin{bmatrix} 0 & 1 \\ -1 & 0 \end{bmatrix} \mathbf{p} =\begin{bmatrix} p_y \\ -p_x \end{bmatrix}$
根据(1)的定义，可以得到如下结论
(2)
$\begin{aligned} \mathbf{p} &=-\mathbf{p}^{\wedge \wedge} =\mathbf{p}^{\wedge \wedge \wedge \wedge} \\ (\mathbf{a}^\wedge)^T\mathbf{b}&=\mathbf{b}^T\mathbf{a}^\wedge=-\mathbf{a}^T\mathbf{b}^\wedge \end{aligned}$

1.1 SO(2)
1.1.1 SO(2)定义
在平面坐标系里，只要绕着垂直平面的轴旋转指定角度，就可以得到一个旋转变换，也就是说，可以只用1个旋转角度来表示一个旋转变换。为了统一，这里约定，以右手坐标系里的x-y为平面，设绕z轴逆时针旋转 $\theta$ 角度时，得到的变换为对应为旋转变换。类似SO(3)，这里定义如下SO(2)指数映射
(3)
$\begin{aligned} \exp(\theta) &= R =\begin{bmatrix} \cos \theta & -\sin\theta \\ \sin\theta &\cos\theta \end{bmatrix} \\ \log(R) &=\theta \end{aligned}$
注意:

① (3)中的 $\exp、\log$ 函数本身只表示一种映射关系，也就是说 $\theta$ 与 $R$ 一一对应。

② 如果以正北方向为起始绕z轴逆时针旋转 $\theta$ ，按(3)得到的旋转矩阵表示局部到世界的表示方式，其可以直接用于坐标变化，这时得到的值可直接在一些地图软件上显示。

1.1.2 SO(2)性质
根据(3)中的定义，对于整数 $n$ 有如下公式成立
(4)
$\begin{aligned} \\ \theta &= \arcsin \dfrac{R_{10}-R_{01}}{2}+2n\pi \\ \exp(-\theta+2n\pi) &= R^T \\ \exp(\theta_1+\theta_2+2n\pi)&=R_1R_2=R_2R_1 \\ \exp(\theta_1-\theta_2+2n\pi)&=R_1R_2^T=R_2^TR_1 \\ \exp(\theta_2-\theta_1+2n\pi)&=R_1^TR_2=R_2R_1^T \end{aligned}$

1.1.3 SO(2)求导
由于SO(2)本质上只有一个的 $\theta$ 变量，从公式(4)可以发现其有很好的性质，因此这里直接采用常规的加法更新求导即可。这里对常见的模型，采用常规加法规则，列举其求导结果如下
(5)
$\begin{aligned} \dfrac{\partial R \mathbf{p}}{\partial \theta}&= \begin{bmatrix} \sin\theta & -\cos\theta \\ \cos\theta &\sin\theta \end{bmatrix}\mathbf{p}\\ &=R^T\begin{bmatrix} 0 & 1 \\ -1 & 0 \end{bmatrix}^T\mathbf{p} \\ &=R^T(-\mathbf{p})^\wedge \\ \\ \dfrac{\partial R^T \mathbf{p}}{\partial \theta}&= \begin{bmatrix} \sin\theta & \cos\theta \\ -\cos\theta &\sin\theta \end{bmatrix}\mathbf{p} \\ &=R\begin{bmatrix} 0 & 1 \\ -1 & 0 \end{bmatrix}\mathbf{p} \\ &=R\mathbf{p}^\wedge \\ \\ \dfrac{\partial \log(R_1R_2R_3)}{\partial \theta_2}&=\dfrac{\theta_1+\theta_2+\theta_3+2n\pi}{\partial\theta_2} \\&=1 \\ \\ \dfrac{\partial \log(R_1R_2^TR_3)}{\partial \theta_2}&=\dfrac{\theta_1-\theta_2+\theta_3+2n\pi}{\partial\theta_2} \\&=-1 \end{aligned}$

1.2 SE(2)
1.2.1 SE(2)定义
由于SO(2)只能表示一个旋转，为了同时表示旋转 $\theta$ 与平移 $\mathbf{t}$ ，这里使用3维度变量 $\xi$ 来表示，即
(6)
$\xi =\begin{bmatrix} \theta \\ \mathbf{t} \end{bmatrix}$
注意，上面定义变量时直接使用旋转 $\theta$ 与平移 $\mathbf{t}$ 来表示，这与SE(3)不同。在SE(3)中，直接使用李代数向量来表示，里面并未直接使用 $\mathbf{t}$ ，因为 $\mathbf{t}$ 里面还包含有旋转部分信息。这里之所以直接使用 $\theta$ 与 $\mathbf{t}$ ，因为下面定义的SE(2)具有很好的性质，在向量与矩阵间转换中直接使用定义的映射就能快速计算。另一方面，在构建边求导过程中，这种定义也不冲突。

对于矩阵形式，参照SE(3)的构建方式，这里定义如下SE(2)映射
(7)
$\begin{aligned} \exp(\xi) &= T = \begin{bmatrix} R & \mathbf{t} \\ \mathbf{0}^T &1 \end{bmatrix} \\ \xi &=\log(T) \end{aligned}$
注意，上面的函数 $\exp$ 与 $\log$ 仅表示一种映射关系。

1.2.2 SE(2)性质
根据(7)的定义，很容易得到如下性质
(8)
$\begin{aligned} T^{-1}&= \exp(\begin{bmatrix} -\theta+2n\pi \\ -R^T\mathbf{t} \end{bmatrix}) \\ T_1T_2&=\exp(\begin{bmatrix} \theta_1+\theta_2+2n\pi \\ R_1\mathbf{t}_2+\mathbf{t}_1 \end{bmatrix}) \end{aligned}$

1.2.3 SE(2)求导
由于SO(2)使用的常规加法更新求导，且(7)、(8)对加法更新具有很好的适应度，因此这里还是采用常规的加法更新求导模式，对于常见的函数，这里列举如下求导结果
(9)
$\begin{aligned} \dfrac{\partial (T\mathbf{p}')}{\partial \xi} &=\dfrac{\partial \begin{bmatrix} R\mathbf{p}+\mathbf{t} \\ 1 \end{bmatrix}}{\partial \xi} \\ &=\begin{bmatrix} R\mathbf{p}^\wedge & \mathbf{I} \\ 0 & \mathbf{0}^T \end{bmatrix} \\ \\ \dfrac{\partial \log(T_1T_2T_3)}{\partial \xi_2} &=\dfrac{\partial \log(\begin{bmatrix} R_1R_2R_3 &R_1R_2\mathbf{t}_3+R_1\mathbf{t}_2+\mathbf{t}_1 \\ \mathbf{0}^T & 1 \end{bmatrix})}{\partial \xi_2} \\ &=\dfrac{\partial \begin{bmatrix} \theta_1+\theta_2+\theta_3+2n\pi \\R_1R_2\mathbf{t}_3+R_1\mathbf{t}_2+\mathbf{t}_1 \end{bmatrix}}{\partial \xi_2} \\ &=\begin{bmatrix} 1 & \mathbf{0}^T \\ R_1R_2^T(-\mathbf{t}_3)^\wedge & R_1 \end{bmatrix} \\ \\ \dfrac{\partial \log(T_1T_2^{-1}T_3)}{\partial \xi_2} &=\dfrac{\partial \log(\begin{bmatrix} R_1R_2^TR_3 &R_1R_2^T(\mathbf{t}_3-\mathbf{t}_2)+\mathbf{t}_1 \\ \mathbf{0}^T & 1 \end{bmatrix})}{\partial \xi_2} \\ &=\dfrac{\partial \begin{bmatrix} \theta_1-\theta_2+\theta_3+2n\pi \\R_1R_2^T(\mathbf{t}_3-\mathbf{t}_2)+\mathbf{t}_1 \end{bmatrix}}{\partial \xi_2} \\ &=\begin{bmatrix} -1 & \mathbf{0}^T \\ R_1R_2(\mathbf{t}_3-\mathbf{t}_2)^\wedge & -R_1R_2^T \end{bmatrix} \end{aligned}$

IMU预积分

2022年11月15日2023年7月25日 shikang999 评论

1 背景
在一般的车载传感器上，都会提供IMU惯性测量单元，它主要提供各个时刻的线性加速度(沿着x、y、z的加速度)以及角速度(绕着x、y、z方向的角速度)测量值。由于这些测量值之间与车本身的位姿有一定关系，因此可以通过IMU测量值来估计车本身的位姿。

2 原理
学过初中物理就应该知道，一个物体，已知速度与加速度，这时经过一段时间后，可以计算出各个时间点的速度以及位移值，在整个过程计算中速度、加速度在不断变化，因此求每个时刻的值需要用到积分。由于处理的离散数据，这里的积分可直接累计（累加）的方式进行积分近似。因此所有公式均是基于此推导出来。唯一不同的是，公式里会涉及到旋转矩阵。这里根据文献^[1]，提供如下的IMU的数学模型
(1)
$\begin{aligned} \bar{\omega}_b(t) &= \omega_b(t) + b^\omega(t)+\eta^\omega(t) \\ \bar{a}_b(t)&=R_{wb}^T(a_w(t)-g_w(t)) + b^a(t)+\eta^a(t) \end{aligned}$
公式中参数含义如下：
$\bar{\omega}_b(t)$ :表示 $t$ 时刻测量到车载坐标系下的角速度。
$\omega_b(t)$ :表示 $t$ 时刻计算到的车载坐标系下的角速度。
$b^\omega(t)$ :表示 $t$ 时刻角速度的偏置，这个参数需要优化。
$\eta^\omega(t)$ :表示 $t$ 时刻角速度的白噪声。
$\bar{a}_b(t)$ :表示 $t$ 时刻测量到车载坐标系下的线性加速度。
$a_w(t)$ :表示 $t$ 时刻计算到的世界坐标系下的线性加速度。
$g_w(t)$ :表示 $t$ 时刻世界坐标系下的重力加速度。
$b^a(t)$ :表示 $t$ 时刻线性加速度的偏置，这个参数需要优化。
$\eta^a(t)$ :表示 $t$ 时刻线性加速度的白噪声。
$R_{wb}(t)$ :表示 $t$ 时刻从车载坐标系到世界坐标系的旋转变换。

对于世界坐标系下的速度 $v_w(t)$ 以及位置 $p_w(t)$ ，根据运动方程有
(2)
$\begin{aligned} \dot{v}_w(t) &= a_w(t) \\ \dot{p}_w(t) &=v_w(t) \\ \dot{R}_{wb}&=R_{wb}\omega_b^\wedge \end{aligned}$
对上面的公式采用欧拉积分有
(3)
$\begin{aligned} v_w(t+\Delta t) &= v_w(t) + a_w(t)\Delta t \\ p_w(t+\Delta t)&=p_w(t)+v_w(t)\Delta t+\dfrac{1}{2}a_w(t)\Delta t^2 \\ R_{wb}(t+\Delta t)&= R_{wb}(t)\exp(\omega_b(t)\Delta t) \end{aligned}$
将公式(1)代入公式(3)有
(4)
$\begin{aligned} v_w(t+\Delta t) &= v_w(t)+g_w(t)\Delta t+R_{wb}(t)(\bar{a}_b(t)-b^a(t)-\eta^a(t))\Delta t \\ p_w(t+\Delta t)&=p_w(t)+v_w(t)\Delta t+\dfrac{1}{2}g_w(t)\Delta t^2+\dfrac{1}{2}R_{wb}(t)(\bar{a}_b(t)-b^a(t)-\eta^a(t))\Delta t^2 \\ R_{wb}(t+\Delta t)&= R_{wb}(t)\exp((\bar{\omega}_b(t)-b^\omega(t) – \eta^\omega(t))\Delta t) \end{aligned}$
这里记
(5)
$\begin{aligned} R_i&=R_{wb}(t)|_{t=i} \\ p_i&=p_w(t)|_{t=i} \\ v_i&=v_w(t)|_{t=i} \\ \bar{\omega}_i&=\bar{\omega}_b(t)|_{t=i} \\ \omega_i&=\omega_b(t)|_{t=i} \\ \bar{a}_i&=\bar{a}_b(t)|_{t=i} \\ a_i&=a_w(t)|_{t=i} \\ b^\omega_i&=b^\omega(t)|_{t=i} \\ \eta^\omega_i&=\eta^\omega(t)|_{t=i} \\ b^a_i&=b^a(t)|_{t=i} \\ \eta^a_i&=\eta^a(t)|_{t=i} \\ g&=g_w(t) \\ \Delta t_{ij}&=\sum_{k=i}^{j-1} \Delta t \end{aligned}$
上面假设重力加速度 $g_w(t)$ 为常量。
这里定义如下增量公式
(6)
$\begin{aligned} \Delta R_{ij} &=R_i^TR_j \\ &=\prod_{k=i}^{j-1}\exp((\bar{\omega}_k-b^\omega_k – \eta^\omega_k)\Delta t) \\ \\ \Delta v_{ij}&=v_j-v_i \\ &=R_i^T(v_j-v_i-g\Delta t_{ij}) \\ &= \sum_{k=i}^{j-1}\Delta R_{ik}(\bar{a}_k-b^a_k-\eta^a_k)\Delta t \\ \\ \Delta p_{ij}&=R_i^T(p_j-p_i-v_i\Delta t_{ij}-\dfrac{1}{2}g\Delta t_{ij}^2) \\ &=\sum_{k=i}^{j-1}[\Delta v_{ik}\Delta t+\dfrac{1}{2}\Delta R_{ik}(\bar{a}_k-b^a_k-\eta^a_k)\Delta t^2] \end{aligned}$
最终根据文献[1]得到如下预积分模型(实际使用的就是如下的模型,即如下约等于符号后的表达式)
(7)
$\begin{aligned} \Delta \bar{R}_{ij}&=R_i^TR_j\exp(\delta \phi_{ij}) \\ &\approx R_i^TR_j \\ \\ \Delta \bar{v}_{ij}&=R_i^T(v_j-v_i-g\Delta t_{ij})+\delta v_{ij} \\ &\approx R_i^T(v_j-v_i-g\Delta t_{ij}) \\ \\ \Delta \bar{p}_{ij}&=R_i^T(p_j-p_i-v_i\Delta t_{ij}-\dfrac{1}{2}g\Delta t^2_{ij})+\delta p_{ij} \\ &\approx R_i^T(p_j-p_i-v_i\Delta t_{ij}-\dfrac{1}{2}g\Delta t^2_{ij}) \end{aligned}$
公式中 $\Delta \bar{R}_{ij}$ 、 $\Delta \bar{v}_{ij}$ 、 $\Delta \bar{p}_{ij}$ 为定义的预积分测量变量， $\delta R_{ij}$ 、 $\delta v_{ij}$ 、 $\delta p_{ij}$ 为对应白噪声。

如果公式(1)当中的偏置不为常数，则每次需要更新预积分测量变量，这里采用如下公式更新
(8)
$\begin{aligned} \Delta \bar{R}_{ij}&\approx \Delta \bar{R}_{ij} \exp (\dfrac{ \partial \Delta \bar{R}_{ij}}{ \partial b^\omega_i} \delta b^\omega_i) \\ \Delta \bar{v}_{ij}&\approx \Delta \bar{v}_{ij}+\dfrac{ \partial \Delta \bar{v}_{ij}}{ \partial b^\omega_i} \delta b^\omega_i+\dfrac{ \partial \Delta \bar{v}_{ij}}{ \partial b^a_i} \delta b^a_i \\ \Delta \bar{p}_{ij}&\approx \Delta \bar{p}_{ij}+\dfrac{ \partial \Delta \bar{p}_{ij}}{ \partial b^\omega_i} \delta b^\omega_i+\dfrac{ \partial \Delta \bar{p}_{ij}}{ \partial b^a_i} \delta b^a_i \end{aligned}$
上面公式中的偏导数可以参考文献[2].

接下来，我们可以将计算的 $\Delta \bar{R}_{ij}$ 、 $\Delta \bar{v}_{ij}$ 、 $\Delta \bar{p}_{ij}$ 作为测量值，和外部其它变量建立约束。对相关变量进行更新，在实际优化求解中需要优化的变量为 $R_i$ 、 $p_i$ 、 $v_i$ 、 $R_j$ 、 $p_j$ 、 $v_j$ 、 $\delta b^\omega_i$ 、 $\delta b^a_i$ 。注意变量按如下方式更新
(9)
$\begin{aligned} R_i &= R_i \exp(\delta \phi_i) \\ p_i &= p_i + R_i \delta p_i \\ v_i &= v_i + \delta v_i \\ R_j &= R_j \exp(\delta \phi_j) \\ p_j &= p_j + R_j \delta p_j \\ v_j &= v_j + \delta v_j \\ \delta b^\omega_i &= \delta b^\omega_i + \bar{\delta b^\omega_i} \\ \delta b^a_i &= \delta b^a_i + \bar{\delta b^a_i} \end{aligned}$

参考
[1] Forster C , Carlone L , Dellaert F , et al. IMU Preintegration on Manifold for Efficient Visual-Inertial Maximum-a-Posteriori Estimation (supplementary material)[J]. Georgia Institute of Technology, 2015.

[2] 苏笑云.IMU预积分的理解和推导

[3] 高翔.简明预积分推导

直线与相机位姿以及观测之间的关系

2019年12月26日2021年5月29日 shikang999 评论

约定
A. $\mathbf{a}^T\mathbf{b}$ 默认为一个数值。
B. $\mathbf{q}_i$ 表示矩阵 $Q$ 的第 $i$ 个行组成的向量。
C. $q_i$ 表示向量 $\mathbf{q}$ 的第 $i$ 个元素。
D.
$\mathbf{q}^\wedge =\begin{bmatrix} 0 & -q_2 & q_1\\ q_2 & 0 & -q_0\\ -q_1 & q_0 & 0 \end{bmatrix}$

问题
现在已知一直线，在相机平面内的一些观测点，其中相机位姿为 $R$ 、 $\mathbf{t}$ ，相机参数为 $K$ ，其中直线上一个点在相机里的像素坐标为 $(u,v)$ ，现在想建立直线和相机位姿以及观测直接的关系

这里设空间直线为如下的参数方程
(1)
$\mathbf{p} = \mathbf{n}k + \mathbf{m}$
公式中约定 $\mathbf{n}$ 为单位方向向量，然后将直线上一个点往相机里投影，根据投影方程，可以得到
(2)
$s \begin{bmatrix} u\\ v\\ 1 \end{bmatrix} = K(R\mathbf{p}+\mathbf{t}) \\ \Downarrow \\ sK^{-1}\begin{bmatrix} u\\ v\\ 1 \end{bmatrix} =R\mathbf{p}+\mathbf{t}$

这里令
(3)
$\mathbf{a} = K^{-1}\begin{bmatrix} u\\ v\\ 1 \end{bmatrix}$

将公式(3)带入(2)并约掉 $s$ 有
(4)
$\begin{bmatrix} a_0/a_2\\ a_1/a_2 \end{bmatrix} = \begin{bmatrix} (\mathbf{r}_0 \cdot \mathbf{p} + t_0)/(\mathbf{r}_2 \cdot \mathbf{p} + t_2)\\ (\mathbf{r}_1 \cdot \mathbf{p} + t_1)/(\mathbf{r}_2 \cdot \mathbf{p} + t_2) \end{bmatrix} \\ \Downarrow \\ \begin{bmatrix} (\mathbf{r}_0 – a_0/a_2 \mathbf{r}_2)\cdot \mathbf{p}\\ (\mathbf{r}_1 – a_1/a_2 \mathbf{r}_2)\cdot \mathbf{p} \end{bmatrix} = \begin{bmatrix} t_2a_0/a_2 – t_0\\ t_2a_1/a_2 – t_1 \end{bmatrix}$

进一步，令
(5)
$V = \begin{bmatrix} (\mathbf{r}_0 – a_0/a_2 \mathbf{r}_2)^T\\ (\mathbf{r}_1 – a_1/a_2 \mathbf{r}_2)^T \end{bmatrix}_{2 \times 3} \\ \mathbf{w} = \begin{bmatrix} t_2a_0/a_2 – t_0\\ t_2a_1/a_2 – t_1 \end{bmatrix}$
则将公式(1),(5)带进公式(4)有
(6)
$\mathbf{w}=V\mathbf{p}=kV\mathbf{n}+V\mathbf{m}$
消去公式(6)中的 $k$ 有
(7)
$\frac{w_0 – \mathbf{v}_0 \cdot \mathbf{m}}{w_1-\mathbf{v}_1 \cdot \mathbf{m}}=\frac{\mathbf{v}_0\cdot \mathbf{n}}{\mathbf{v}_1\cdot \mathbf{n}} \\ \Downarrow \\ (w_0 \mathbf{v}_1-w_1\mathbf{v}_0)\cdot \mathbf{n} +\mathbf{m}^T (\mathbf{v}_1\mathbf{v}_0^T-\mathbf{v}_0\mathbf{v}_1^T)\mathbf{n}=0$

为了简洁，这里记
(8)
$\mathbf{b}=w_0 \mathbf{v}_1-w_1\mathbf{v}_0 \\ \mathbf{c}^\wedge = \mathbf{v}_1\mathbf{v}_0^T-\mathbf{v}_0\mathbf{v}_1^T$
将(8)带进(7)有
(9)
$(\mathbf{b}^T + \mathbf{m}^T\mathbf{c}^\wedge)\mathbf{n} = \mathbf{n}^T(\mathbf{b} – \mathbf{c}^\wedge \mathbf{m}) =0$
由于 $\mathbf{n}$ 是单位方向向量，因此这里不妨设置
(10)
$\mathbf{n}=\begin{bmatrix} \sin \theta\\ \cos \theta \cos \beta\\ \cos \theta \sin \beta \end{bmatrix}$
则最终带入方程有
(11)
$\sin \theta (b_0 + c_2m_1 – c_1m_2) +\cos \theta \cos \beta (b_1 + c_0m_2 – c_2m_0) +\cos \theta \sin \beta(b_2+c_1m_0 – c_0m_1)=0$
从公式(11)可以看出，已知多组相机参数以及观测，则可以拟合出最佳直线参数 $\mathbf{n}$ 与 $\mathbf{m}$ 。

同样地，如果已知直线与相机参数，以及观测，则要求直线上某个点的3d位置，根据公式(6)可以得到
(12)
$k = \frac{\mathbf{n}^TV^T(\mathbf{w}-V\mathbf{m})}{\mathbf{n}^TV^TV\mathbf{n}}$
最终将 $k$ 代入公式(1)的直线方程，可得到3d点位置。

李代数求导

2019年9月12日2023年8月22日 shikang999 评论

下面主要记录一些李代数涉及到的求导，其中主要提供左扰动与常规加法更新求导两种方式。因为不同的求导方式，会影响变量的更新法则，所以要注意区分。

推导过程主要用到的公式可参考李群李代数工具。

1. SO(3) 求导
(1.1) 左扰动求导
$\begin{aligned} \frac{ \partial R\mathbf{p}}{ \partial \phi} &=\lim_{\delta \phi \rightarrow 0} \frac{\exp(\delta \phi^\wedge)R\mathbf{p} – R\mathbf{p}}{\delta \phi}\\ & \approx \lim_{\delta \phi \rightarrow 0} \frac{(I + \delta \phi^\wedge)R\mathbf{p} – R\mathbf{p}}{\delta \phi}\\ &= \lim_{\delta \phi \rightarrow 0} \frac{\delta \phi^\wedge R\mathbf{p}}{\delta \phi}\\ &= \lim_{\delta \phi \rightarrow 0} \frac{-(R\mathbf{p})^\wedge \delta \phi}{\delta \phi}\\ &= -(R\mathbf{p})^\wedge \end{aligned}$

(1.2) 常规加法更新求导
$\begin{aligned} \frac{ \partial R\mathbf{p}}{ \partial \phi} &=\frac{ \partial \exp(\phi^\wedge)\mathbf{p}}{ \partial \phi}\\ &=\lim_{\delta \phi \rightarrow 0} \frac{\exp((\phi +\delta \phi)^\wedge)\mathbf{p} – R\mathbf{p}}{\delta \phi}\\ & \approx \lim_{\delta \phi \rightarrow 0} \frac{\exp((J_l \delta \phi)^\wedge)R\mathbf{p} – R\mathbf{p}}{\delta \phi}\\ & \approx \lim_{\delta \phi \rightarrow 0} \frac{(I+(J_l \delta \phi)^\wedge)R\mathbf{p} – R\mathbf{p}}{\delta \phi}\\ &= \lim_{\delta \phi \rightarrow 0} \frac{(J_l \delta \phi)^\wedge R\mathbf{p}}{\delta \phi}\\ &= \lim_{\delta \phi \rightarrow 0} \frac{-(R\mathbf{p})^\wedge J_l \delta \phi}{\delta \phi}\\ &= -(R\mathbf{p})^\wedge J_l \end{aligned}$

(1.3) 左扰动求导
$\begin{aligned} \frac{ \partial R^T\mathbf{p}}{ \partial \phi} &=\lim_{\delta \phi \rightarrow 0} \frac{(\exp(\delta \phi^\wedge)R)^T\mathbf{p} – R^T\mathbf{p}}{\delta \phi}\\ &=\lim_{\delta \phi \rightarrow 0} \frac{R^T\exp(-\delta \phi^\wedge)\mathbf{p} – R^T\mathbf{p}}{\delta \phi}\\ & \approx \lim_{\delta \phi \rightarrow 0} \frac{R^T(I – \delta \phi^\wedge)\mathbf{p} – R^T\mathbf{p}}{\delta \phi}\\ &= \lim_{\delta \phi \rightarrow 0} \frac{-R^T\delta \phi^\wedge \mathbf{p}}{\delta \phi}\\ &= \lim_{\delta \phi \rightarrow 0} \frac{R^T \mathbf{p}^\wedge \delta \phi}{\delta \phi}\\ &= R^T \mathbf{p}^\wedge \end{aligned}$

(1.4) 常规加法更新求导
$\begin{aligned} \frac{ \partial R^T\mathbf{p}}{ \partial \phi} &=\frac{ \partial \exp(\phi^\wedge)^T\mathbf{p}}{ \partial \phi}\\ &=\lim_{\delta \phi \rightarrow 0} \frac{\exp((\phi +\delta \phi)^\wedge)^T\mathbf{p} – R^T\mathbf{p}}{\delta \phi}\\ & \approx \lim_{\delta \phi \rightarrow 0} \frac{\exp(-(J_r \delta \phi)^\wedge)R^T\mathbf{p} – R^T\mathbf{p}}{\delta \phi}\\ & \approx \lim_{\delta \phi \rightarrow 0} \frac{(I-(J_r \delta \phi)^\wedge)R^T\mathbf{p} – R^T\mathbf{p}}{\delta \phi}\\ &= \lim_{\delta \phi \rightarrow 0} \frac{-(J_r \delta \phi)^\wedge R^T\mathbf{p}}{\delta \phi}\\ &= \lim_{\delta \phi \rightarrow 0} \frac{(R^T\mathbf{p})^\wedge J_r \delta \phi}{\delta \phi}\\ &= (R^T\mathbf{p})^\wedge J_r \end{aligned}$
上面公式中， $\phi$ 为 $R$ 对应的李代数向量， $\mathbf{p}$ 与 $R$ 无关。

(1.5) 左扰动求导
$\begin{aligned} \dfrac{\partial \log(R_1R_2R_3)^\vee}{\partial \phi_2} &= \lim_{\delta \phi_2 \rightarrow 0} \dfrac{\log(R_1\exp(\delta\phi_2^\wedge)R_2R_3)^\vee-\log(R_1R_2R_3)^\vee}{\delta \phi_2} \\ &= \lim_{\delta \phi_2 \rightarrow 0}\dfrac{\log(R_1R_2R_3\exp(((R_2R_3)^T\delta \phi_2)^\wedge))^\vee-\log(R_1R_2R_3)^\vee}{\delta \phi_2} \\ &= \lim_{\delta \phi_2 \rightarrow 0}\dfrac{\phi'+J_r'^{-1}(R_2R_3)^T\delta \phi_2-\phi'}{\delta \phi_2} \\ &=J_r'^{-1}(R_2R_3)^T \end{aligned}$

(1.6) 常规加法更新求导
$\begin{aligned} \dfrac{\partial \log(R_1R_2R_3)^\vee}{\partial \phi_2} &= \lim_{\delta \phi_2 \rightarrow 0} \dfrac{\log(R_1\exp((\delta\phi_2+\phi_2)^\wedge)R_3)^\vee-\log(R_1R_2R_3)^\vee}{\delta \phi_2} \\ &= \lim_{\delta \phi_2 \rightarrow 0} \dfrac{\log(R_1R_2\exp((J_{r2}\delta\phi_2)^\wedge)R_3)^\vee-\log(R_1R_2R_3)^\vee}{\delta \phi_2} \\ &= \lim_{\delta \phi_2 \rightarrow 0} \dfrac{\log(R_1R_2R_3\exp((R_3^TJ_{r2}\delta\phi_2)^\wedge))^\vee-\log(R_1R_2R_3)^\vee}{\delta \phi_2} \\ &= \lim_{\delta \phi_2 \rightarrow 0} \dfrac{\phi'+J_r'^{-1}R_3^TJ_{r2}\delta\phi_2-\phi'}{\delta \phi_2} \\ &=J_r'^{-1}R_3^TJ_{r2} \end{aligned}$
上面公式(1.5)-(1.6)中， $R_1,R_2,R_3$ 相互之间无关， $\phi'$ 为 $R_1R_2R_3$ 对应的李代数向量， $J_r'$ 为 $R_1R_2R_3$ 对应右雅克比矩阵。

(1.7) 左扰动求导
$\begin{aligned} \dfrac{\partial \log(R_1R_2^TR_3)^\vee}{\partial \phi_2} &= \lim_{\delta \phi_2 \rightarrow 0} \dfrac{\log(R_1(\exp(\delta \phi_2^\wedge)R_2)^TR_3)^\vee-\log(R_1R_2^TR_3)^\vee}{\delta \phi_2} \\ &= \lim_{\delta \phi_2 \rightarrow 0} \dfrac{\log(R_1R_2^TR_3\exp(-(R_3^T\delta\phi_2)^\wedge)^\vee-\log(R_1R_2^TR_3)^\vee}{\delta \phi_2} \\ &= \lim_{\delta \phi_2 \rightarrow 0} \dfrac{\phi''-J_r''^{-1}R_3^T\delta\phi_2-\phi''}{\delta \phi_2} \\ &=-J_r''^{-1}R_3^T \end{aligned}$

(1.8) 常规加法更新求导
$\begin{aligned} \dfrac{\partial \log(R_1R_2^TR_3)^\vee}{\partial \phi_2} &= \lim_{\delta \phi_2 \rightarrow 0} \dfrac{\log(R_1\exp((\delta\phi_2+\phi_2)^\wedge)^TR_3)^\vee-\log(R_1R_2^TR_3)^\vee}{\delta \phi_2} \\ &= \lim_{\delta \phi_2 \rightarrow 0} \dfrac{\log(R_1R_2^T\exp((-J_{l2}\delta\phi_2)^\wedge)R_3)^\vee-\log(R_1R_2^TR_3)^\vee}{\delta \phi_2} \\ &= \lim_{\delta \phi_2 \rightarrow 0} \dfrac{\log(R_1R_2^TR_3\exp((-R_3^TJ_{l2}\delta\phi_2)^\wedge))^\vee-\log(R_1R_2^TR_3)^\vee}{\delta \phi_2} \\ &= \lim_{\delta \phi_2 \rightarrow 0} \dfrac{\phi''-J_r''^{-1}R_3^TJ_{l2}\delta\phi_2-\phi''}{\delta \phi_2} \\ &=-J_r''^{-1}R_3^TJ_{l2} \end{aligned}$

上面公式(1.7)-(1.8)中， $R_1,R_2,R_3$ 相互之间无关， $\phi''$ 为 $R_1R_2^TR_3$ 对应的李代数向量， $J_r''$ 为 $R_1R_2^TR_3$ 对应右雅克比矩阵。

2. SE(3) 求导
(2.1)
$\mathbf{z} = R \mathbf{p} + \mathbf{t}\\ \Downarrow \\ \begin{bmatrix} \mathbf{z}\\ 1 \end{bmatrix} = \begin{bmatrix} R & \mathbf{t} \\ \mathbf{0}^T & 1 \end{bmatrix} \begin{bmatrix} \mathbf{p}\\ 1 \end{bmatrix} = T\mathbf{p}'$

(2.2) 左扰动求导
$\begin{aligned} \frac{\partial T \mathbf{p}'}{ \partial \xi} &=\lim_{\delta \xi \rightarrow 0} \frac{\exp(\delta \xi^\wedge)T\mathbf{p}' – T \mathbf{p}'}{\delta \xi}\\ & \approx \lim_{\delta \xi \rightarrow 0} \frac{(I + \delta \xi^\wedge)T\mathbf{p}' – T \mathbf{p}'}{\delta \xi}\\ &= \lim_{\delta \xi \rightarrow 0} \frac{\delta \xi^\wedge T\mathbf{p}'}{\delta \xi}\\ &= \lim_{\delta \xi \rightarrow 0} \frac{ \begin{bmatrix} \delta \phi^\wedge & \delta \rho \\ \mathbf{0}^T & 0 \end{bmatrix} \begin{bmatrix} R & \mathbf{t} \\ \mathbf{0}^T & 1 \end{bmatrix} \begin{bmatrix} \mathbf{p} \\ 1 \end{bmatrix} }{\delta \xi}\\ &= \lim_{\delta \xi \rightarrow 0} \frac{ \begin{bmatrix} \delta \phi^\wedge (R\mathbf{p} + \mathbf{t}) + \delta \rho \\ 0 \end{bmatrix} }{\delta \xi}\\ &= \lim_{\delta \xi \rightarrow 0} \frac{ \begin{bmatrix} -(R\mathbf{p} + \mathbf{t})^\wedge \delta \phi + \delta \rho \\ 0 \end{bmatrix} }{\delta \xi}\\ &=\begin{bmatrix} I & -(R\mathbf{p} + \mathbf{t})^\wedge\\ 0 & 0 \end{bmatrix} \end{aligned} \\ \Downarrow \\ \frac{\partial (R \mathbf{p} + \mathbf{t})}{ \partial \xi}= \begin{bmatrix} I & -(R\mathbf{p} + \mathbf{t})^\wedge \end{bmatrix}$

(2.3) 常规加法更新求导
$\begin{aligned} \frac{\partial T \mathbf{p}'}{ \partial \xi} &=\lim_{\delta \xi \rightarrow 0} \frac{\exp((\xi + \delta \xi)^\wedge)\mathbf{p}' – T \mathbf{p}'}{\delta \xi}\\ & \approx\lim_{\delta \xi \rightarrow 0} \frac{\exp((\mathcal{J}_l \delta \xi)^\wedge)T\mathbf{p}' – T \mathbf{p}'}{\delta \xi}\\ & \approx \lim_{\delta \xi \rightarrow 0} \frac{(I + (\mathcal{J}_l\delta \xi)^\wedge)T\mathbf{p}' – T \mathbf{p}'}{\delta \xi}\\ &= \lim_{\delta \xi \rightarrow 0} \frac{(\mathcal{J}_l\delta \xi)^\wedge T\mathbf{p}'}{\delta \xi}\\ &= \lim_{\delta \xi \rightarrow 0} \frac{ \begin{bmatrix} (J_l\delta \phi)^\wedge & J_l \delta \rho + Q_l \delta \phi \\ \mathbf{0}^T & 0 \end{bmatrix} \begin{bmatrix} R & \mathbf{t} \\ \mathbf{0}^T & 1 \end{bmatrix} \begin{bmatrix} \mathbf{p} \\ 1 \end{bmatrix} }{\delta \xi}\\ &= \lim_{\delta \xi \rightarrow 0} \frac{ \begin{bmatrix} (J_l \delta \phi)^\wedge (R\mathbf{p} + \mathbf{t}) + J_l \delta \rho + Q_l \delta \phi \\ 0 \end{bmatrix} }{\delta \xi}\\ &= \lim_{\delta \xi \rightarrow 0} \frac{ \begin{bmatrix} -(R\mathbf{p} + \mathbf{t})^\wedge (J_l\delta \phi) + J_l \delta \rho + Q_l \delta \phi \\ 0 \end{bmatrix} }{\delta \xi}\\ &=\begin{bmatrix} J_l & Q_l -(R\mathbf{p} + \mathbf{t})^\wedge J_l\\ 0 & 0 \end{bmatrix} \end{aligned} \\ \Downarrow \\ \frac{\partial (R \mathbf{p} + \mathbf{t})}{ \partial \xi}= \begin{bmatrix} J_l & Q_l -(R\mathbf{p} + \mathbf{t})^\wedge J_l \end{bmatrix}$

结合(1.1),(1.2),(2.2),(2.3)可以得到，对于同属于一个SE3中的变量，有如下结果

(2.4) 左扰动求导
$\begin{aligned} \frac{\partial J_l \rho}{ \partial \phi} &= \frac{\partial \mathbf{t}}{ \partial \phi} = -\mathbf{t}^\wedge \end{aligned}$

(2.5) 常规加法更新求导
$\frac{\partial \mathbf{t}}{ \partial \phi} = Q_l -\mathbf{t}^\wedge J_l$

(2.4)(2.5)不仅给出了偏移与 $\phi$ 的求导关系，还给出了雅可比矩阵求导与 $\phi$ 的关系

(2.6) 左扰动求导
$\begin{aligned} \frac{\partial \mathbf{t}}{ \partial \rho} &= I \end{aligned}$

(2.7) 常规加法更新求导
$\frac{\partial \mathbf{t}}{ \partial \rho} = J_l$

从公式(2.4),(2.5)可以得到左雅克比矩阵的求导

(2.8)左扰动求导

$\begin{aligned} \frac{\partial J_l \mathbf{p}}{ \partial \phi} &= -(J_l \mathbf{\mathbf{p}})^\wedge \end{aligned}$

(2.9) 常规加法更新求导

$\begin{aligned} \frac{\partial J_l \mathbf{p}}{ \partial \phi} &=Q_l -(J_l \mathbf{\mathbf{p}})^\wedge J_l \end{aligned}$

注意，这里 $Q_l$ 当中的 $\rho$ 用 $\mathbf{p}$ 代替。

而对于右雅克比矩阵，有

(2.10)

$\begin{aligned} \frac{\partial J_r \mathbf{p}}{ \partial \phi} = \frac{\partial R^T J_l \mathbf{p}}{ \partial \phi}= \frac{\partial R^T (J_l \mathbf{p})}{ \partial \phi} + R^T \frac{\partial J_l \mathbf{p}}{ \partial \phi} \end{aligned}$

将(1.3),(1.4),(2.8),(2.9)代入公式(2.10)可以得到

(2.11)左扰动求导

$\frac{\partial J_r \mathbf{p}}{ \partial \phi} = \mathbf{0}$

(2.12)常规加法更新求导

$\frac{\partial J_r \mathbf{p}}{ \partial \phi} =R^T(\mathbf{p}^\wedge J_l + Q_l – (J_l\mathbf{p})^\wedge J_l)$

(2.13) 左扰动求导

$\begin{aligned} \dfrac{\partial \log(T_1T_2T_3)^\vee}{\partial\xi_2} &\approx \lim_{\delta \xi_2 \rightarrow 0} \dfrac{\log(T_1\exp(\delta \xi_2^\wedge)T_2T_3)^\vee – \log(T_1T_2T_3)^\vee}{\delta \xi_2} \\ &= \lim_{\delta \xi_1 \rightarrow 0} \dfrac{\log(T_1T_2T_3\exp((\mathcal{T}(T_2T_3)^{-1} \delta \xi_2)^\wedge))^\vee-\log(T_1T_2T_3)^\vee}{\delta \xi_2} \\ &\approx \lim_{\delta \xi_2 \rightarrow 0} \dfrac{\log(\exp((\xi_{123}+\mathcal{J}_{r123}^{-1}\mathcal{T}(T_2T_3)^{-1} \delta \xi_2)^\wedge))^\vee-\log(\exp(\xi_{123}^\wedge))^\vee}{\delta \xi_2} \\ &=\mathcal{J}_{r123}^{-1}\mathcal{T}(T_2T_3)^{-1} \end{aligned}$

(2.14) 常规加法求导
$\begin{aligned} \dfrac{\partial \log(T_1T_2T_3)^\vee}{\partial\xi_2} &\approx \lim_{\delta \xi_2 \rightarrow 0} \dfrac{\log(T_1\exp((\xi_2 +\delta \xi_2)^\wedge)T_3)^\vee – \log(T_1T_2T_3)^\vee}{\delta \xi_2} \\ &\approx \lim_{\delta \xi_1 \rightarrow 0} \dfrac{\log(T_1T_2\exp((\mathcal{J}_{r2}\delta \xi_2)^\wedge)T_3)^\vee-\log(T_1T_2T_3)^\vee}{\delta \xi_2} \\ &= \lim_{\delta \xi_1 \rightarrow 0} \dfrac{\log(T_1T_2T_3\exp((\mathcal{T}(T_3)^{-1}\mathcal{J}_{r2}\delta \xi_2)^\wedge))^\vee-\log(T_1T_2T_3)^\vee}{\delta \xi_2} \\ &\approx \lim_{\delta \xi_2 \rightarrow 0} \dfrac{\log(\exp((\xi_{123}+\mathcal{J}_{r123}^{-1}\mathcal{T}(T_3)^{-1}\mathcal{J}_{r2} \delta \xi_2)^\wedge))^\vee-\log(\exp(\xi_{123}^\wedge))^\vee}{\delta \xi_2} \\ &=\mathcal{J}_{r123}^{-1}\mathcal{J}_{r2}\mathcal{T}(T_3)^{-1} \end{aligned}$
上面公式中 $\mathcal{J}_{r123}$ 为 $T_1T_2T_3$ 的右雅可比矩阵， $\mathcal{J}_{r2}$ 为 $T_2$ 的右雅可比矩阵。

(2.15) 左扰动求导
$\begin{aligned} \dfrac{\partial \log(T_1T_2^{-1}T_3)^\vee}{\partial\xi_2} &\approx \lim_{\delta \xi_2 \rightarrow 0} \dfrac{\log(T_1(\exp(\delta \xi_2^\wedge)T_2)^{-1}T_3)^\vee – \log(T_1T_2^{-1}T_3)^\vee}{\delta \xi_2} \\ &=\lim_{\delta \xi_2 \rightarrow 0} \dfrac{\log(T_1T_2^{-1}\exp(-\delta \xi_2^\wedge)T_3)^\vee – \log(T_1T_2^{-1}T_3)^\vee}{\delta \xi_2} \\ &= \lim_{\delta \xi_1 \rightarrow 0} \dfrac{\log(T_1T_2^{-1}T_3\exp((-\mathcal{T}(T_3)^{-1} \delta \xi_2)^\wedge))^\vee-\log(T_1T_2^{-1}T_3)^\vee}{\delta \xi_2} \\ &\approx \lim_{\delta \xi_2 \rightarrow 0} \dfrac{\log(\exp((\xi_{123}'-\mathcal{J}_{r123}'^{-1}\mathcal{T}(T_3)^{-1} \delta \xi_2)^\wedge))^\vee-\log(\exp(\xi_{123}'^\wedge))^\vee}{\delta \xi_2} \\ &=-\mathcal{J}_{r123}'^{-1}\mathcal{T}(T_3)^{-1} \end{aligned}$

(2.16) 常规加法求导
$\begin{aligned} \dfrac{\partial \log(T_1T_2^{-1}T_3)^\vee}{\partial\xi_2} &\approx \lim_{\delta \xi_2 \rightarrow 0} \dfrac{\log(T_1(\exp((\xi_2+\delta \xi_2)^\wedge)T_2)^{-1}T_3)^\vee – \log(T_1T_2^{-1}T_3)^\vee}{\delta \xi_2} \\ &\approx \lim_{\delta \xi_2 \rightarrow 0} \dfrac{\log(T_1(T_2\exp((\mathcal{J}_{r2}\delta \xi_2)^\wedge))^{-1}T_3)^\vee – \log(T_1T_2^{-1}T_3)^\vee}{\delta \xi_2} \\ &= \lim_{\delta \xi_2 \rightarrow 0} \dfrac{\log(T_1\exp(-(\mathcal{J}_{r2}\delta \xi_2)^\wedge))T_2^{-1}T_3)^\vee – \log(T_1T_2^{-1}T_3)^\vee}{\delta \xi_2} \\ &= \lim_{\delta \xi_1 \rightarrow 0} \dfrac{\log(T_1T_2^{-1}T_3\exp((-\mathcal{T}(T_2^{-1}T_3)^{-1}\mathcal{J}_{r2} \delta \xi_2)^\wedge))^\vee-\log(T_1T_2^{-1}T_3)^\vee}{\delta \xi_2} \\ &\approx \lim_{\delta \xi_2 \rightarrow 0} \dfrac{\log(\exp((\xi_{123}'-\mathcal{J}_{r123}'^{-1}\mathcal{T}(T_2^{-1}T_3)^{-1}\mathcal{J}_{r2} \delta \xi_2)^\wedge))^\vee-\log(\exp(\xi_{123}'^\wedge))^\vee}{\delta \xi_2} \\ &=-\mathcal{J}_{r123}'^{-1}\mathcal{T}(T_2^{-1}T_3)^{-1}\mathcal{J}_{r2} \end{aligned}$
上面公式中 $\mathcal{J}_{r123}'$ 为 $T_1T_2^{-1}T_3$ 的右雅可比矩阵， $\mathcal{J}_{r2}$ 为 $T_2$ 的右雅可比矩阵

(2.17) 左扰动求导

$\begin{aligned} \dfrac{ \partial T^{-1}\mathbf{p}'}{ \partial \xi}&=\lim_{\delta \xi \rightarrow 0}\dfrac{(\exp(\delta \xi^\wedge)T)^{-1}\mathbf{p}'-T^{-1}\mathbf{p}'}{\delta \xi} \\ &=\lim_{\delta \xi \rightarrow 0}\dfrac{T^{-1}\exp(-\delta \xi^\wedge)\mathbf{p}'-T^{-1}\mathbf{p}'}{\delta \xi} \\ &\approx \lim_{\delta \xi \rightarrow 0}\dfrac{T^{-1}(I-\delta \xi^\wedge)\mathbf{p}'-T^{-1}\mathbf{p}'}{\delta \xi} \\ &=\lim_{\delta \xi \rightarrow 0}\dfrac{-T^{-1}\delta \xi^\wedge\mathbf{p}'}{\delta \xi} \\ &=\lim_{\delta \xi \rightarrow 0}-\dfrac{ \begin{bmatrix} R^T&-R^T\mathbf{t} \\ \mathbf{0}^T&1 \end{bmatrix} \begin{bmatrix} \delta \phi^\wedge & \delta \rho \\ \mathbf{0}^T & 0 \end{bmatrix} \begin{bmatrix} \mathbf{p} \\ 1 \end{bmatrix} }{\delta \xi} \\ &=\lim_{\delta \xi \rightarrow 0}-\dfrac{ \begin{bmatrix} R^T(\delta \phi^\wedge \mathbf{p} + \delta \rho) \\ 0 \end{bmatrix} }{\delta \xi} \\ &=\begin{bmatrix} -R^T & R^T\mathbf{p}^\wedge \\ 0&0 \end{bmatrix} \end{aligned}$

(2.18)左扰动求导

$\begin{aligned} \dfrac{\partial ((T^{-1})^T\mathbf{p}')}{\partial \xi} &= \lim_{\delta \xi \rightarrow 0} \dfrac{((\exp(\delta \xi^\wedge)T)^{-1})^T\mathbf{p}'-(T^{-1})^T\mathbf{p}'}{\delta \xi} \\ &= \lim_{\delta \xi \rightarrow 0} \dfrac{\exp(-\delta \xi^\wedge)^T(T^{-1})^T\mathbf{p}'-(T^{-1})^T\mathbf{p}'}{\delta \xi} \\ &\approx \lim_{\delta \xi \rightarrow 0} \dfrac{(I-\delta \xi^\wedge)^T(T^{-1})^T\mathbf{p}'-(T^{-1})^T\mathbf{p}'}{\delta \xi} \\ &= \lim_{\delta \xi \rightarrow 0} \dfrac{(-\delta \xi^\wedge)^T(T^{-1})^T\mathbf{p}'}{\delta \xi} \\ &=\lim_{\delta \xi \rightarrow 0} \dfrac{ \begin{bmatrix} (-\delta \phi^\wedge)^T &\mathbf{0} \\ -\delta \rho^T & 0 \end{bmatrix} \begin{bmatrix} R & \mathbf{0} \\ -\mathbf{t}^TR & 1 \end{bmatrix} \begin{bmatrix} \mathbf{p} \\ 1 \end{bmatrix} }{\delta \xi} \\ &=\lim_{\delta \xi \rightarrow 0}\dfrac{\begin{bmatrix} \delta \phi^\wedge R\mathbf{p} \\ -\delta \rho^T R\mathbf{p} \end{bmatrix} }{\delta \xi} \\ &=\lim_{\delta \xi \rightarrow 0}\dfrac{\begin{bmatrix} – (R\mathbf{p})^\wedge \delta \phi \\ – (R\mathbf{p})^T\delta \rho \end{bmatrix} }{\delta \xi} \\ &=\begin{bmatrix} \mathbf{I} \times 0 & -(R \mathbf{p})^\wedge \\ -(R\mathbf{p})^T & \mathbf{0}^T \end{bmatrix} \end{aligned}$

(2.19)左扰动求导

$\begin{aligned} \dfrac{\partial (T^T\mathbf{p}')}{\partial \xi} &=\lim_{\delta \xi\rightarrow 0}\dfrac{(\exp(\delta \xi^\wedge)T)^T\mathbf{p}'-T^T\mathbf{p}'}{\delta \xi} \\ &=\lim_{\delta \xi\rightarrow 0}\dfrac{T^T( I+\delta \xi^\wedge)^T\mathbf{p}'-T^T\mathbf{p}'}{\delta \xi} \\ &=\lim_{\delta \xi\rightarrow 0}\dfrac{ \begin{bmatrix} R^T & \mathbf{0} \\ \mathbf{t}^T & 1 \end{bmatrix} \begin{bmatrix} -\delta \phi^\wedge & \mathbf{0} \\ \delta \rho^T & 0 \end{bmatrix} \begin{bmatrix} \mathbf{p} \\ 1 \end{bmatrix} }{\delta \xi} \\ &=\lim_{\delta \xi\rightarrow 0}\dfrac{ \begin{bmatrix} R^T\mathbf{p}^\wedge \delta\phi \\ \mathbf{t}^T\mathbf{p}^\wedge\delta \phi+\mathbf{p}^T\delta \rho \end{bmatrix} }{\delta \xi} \\ &=\begin{bmatrix} \mathbf{I} \times 0 & R^T\mathbf{p}^\wedge \\ \mathbf{p}^T & \mathbf{t}^T\mathbf{p}^\wedge \end{bmatrix} \end{aligned}$

线性EKF

2019年9月3日2020年5月13日 shikang999 评论

PS：EKF本身是一种数学工具，具体的原理推导可以参考文献[1]。对于使用者来说，只要理解这个工具对应的数学模型，以及对应系数的更新方式，就可以套用EKF的求解模式进行求解。

在离散线性系统中，对于某种状态 $\mathcal{x}$

定义运动方程
(1.1)
$\mathcal{x}_{k} = A_{k-1} \mathcal{x}_{k-1} + \mathcal{v}_k + \mathcal{w}_k$

公式中 $\mathcal{w}_k \in \mathcal{N}(\mathbf{0}, Q_k)$ 的过程噪声，其中 $A_{k-1}$ 称为转移矩阵， $\mathcal{x}_0 \in \mathcal{N}(\mathbf{0}, P_0)$ , $P_0$ 为 $\mathcal{x}_0$ 的初始协方差矩阵。

同样，定义观测方程
(1.2)
$\mathcal{y}_{k} = C_k \mathcal{x}_k + \mathcal{n}_k$
公式中 $\mathcal{n}_k \in \mathcal{N}(\mathbf{0}, R_k)$ 的测量噪声,其中 $C_{k}$ 称为观测矩阵。

2 卡尔曼滤波
下面为常规的扩展卡尔曼滤波更新过程[1]
1.预测
(2.1)
$\begin{aligned} P_k &= A_{k-1}P_{k-1}A_{k-1}^T + Q_k\\ \mathcal{x}_k &=A_{k-1}\mathcal{x}_{k-1}+\mathcal{v}_k \end{aligned}$

2.卡尔曼增益
(2.2)
$\begin{aligned} K &= P_kC_k^T(C_kP_kC_k^T+R_k)^{-1}\\ \end{aligned}$

3.更新
(2.3)
$\begin{aligned} P_k&= (I – KC_k)P_k\\ \mathcal{x}_k &= \mathcal{x}_k + K(\mathcal{y}_k – C_k\mathcal{x}_k) \end{aligned}$

即，每次可以使用公式(2.1),(2.2),(2.3)进行过程更新。

3 理解
在每一轮更新中，先根据运动方程进行预测，然后结合观测方程估计出一个修正系数，最后使用系数对变量进行修正。

仔细观察上面更新过程以及对应数学模型，可以发现，在本质上来说可以通过运动方程直接递推出下一个状态，但是考虑到一些噪音（为了提高精度），这里会使用观测方程来对递推出的状态进行修正，也因此可以理解成两类方程耦合

注意，上面公式中协方差矩阵 $P_{k}$ 本应该服务的对象，下面将以SLAM当中的例子加以说明。

4 SLAM当中的EKF

4.1 运动方程
对于位姿 $T$ ，以及它对应的广义速度 $\varpi$ ，它们满足运动学方程
(4.1)
$\dot{T} = \varpi ^\wedge T$
对上面的两个变量，分边添加一个微小的扰动，然后忽略二阶小量有
(4.2)
$\begin{aligned} \frac{d}{dt}((I + \delta \xi^\wedge)T) &= (\delta \varpi + \varpi)^\wedge ((I +\delta \xi ^\wedge) T)\\ \delta \dot{\xi}^\wedge T + \dot{T} + \delta \xi ^\wedge \dot{T} &=\varpi ^\wedge T + \varpi ^\wedge \delta \xi^\wedge T + \delta \varpi^\wedge T + \delta \varpi^\wedge \delta \xi ^\wedge T\\ & \approx \varpi ^\wedge T + \varpi ^\wedge \delta \xi^\wedge T + \delta \varpi^\wedge T \end{aligned}$

将(4.1)带入(4.2)有
(4.3)
$\begin{aligned} \delta \dot{\xi}^\wedge &= \varpi ^\wedge \delta \xi ^\wedge – \delta \xi ^\wedge \varpi ^\wedge + \delta \varpi ^\wedge\\ &=(\varpi ^\curlywedge \delta \xi )^\wedge+ \delta \varpi ^\wedge\\ &=(\varpi ^\curlywedge \delta \xi + \delta \varpi)^\wedge \end{aligned} \\ \Downarrow \\ \delta \dot{\xi} = \varpi ^\curlywedge \delta \xi + \delta \varpi$
一般把(4.1)称为标称运动学方程，(4.2)称为扰动运动学方程。
对上面公式进行离散化可得到
(4.4)
$\begin{aligned} T_k &= \exp((t_k – t_{k-1}) \varpi ^\wedge)T_{k-1}\\ \delta \xi_k &= \exp((t_k – t_{k-1})\varpi ^\curlywedge) \delta \xi _{k-1} + \mathcal{w}_k \end{aligned}$

$t_{k}$ 表示对应时刻值， $\mathcal{w}_{k} \in \mathcal{N}(0, Q_k)$ 为过程噪声。

4.2 观测方程
这里假设具有如下的观测模型
(4.5)
$\mathcal{y} = T \mathcal{p} + n$
同样，两边同时加一个微小的扰动有
(4.6)
$\begin{aligned} \mathcal{y} + \delta \mathcal{y} &= (I+ \delta \xi^\wedge)Tp + n\\ &= Tp + \delta \xi ^\wedge Tp + n\\ &= Tp + (Tp)^ {\odot} \delta \xi + n \end{aligned}$
这里将(4.5)的标称解带入(4.6)有
(4.7)
$\delta y = (Tp)^{\odot} \delta \xi + n$
即有最终离散化公式
(4.8)
$\delta y_k = (Tp)^{\odot} \delta \xi_k + n_k$

上面 $\mathcal{n}_k \in \mathcal{N}(\mathbf{0}, R_k)$

4.3 EKF过程
这里先约定如下变量
(4.9)
$\begin{aligned} O_k &= \exp((t_k – t_{k-1}) \varpi_{k-1} ^\wedge) \\ G_k &= \exp((t_k – t_{k-1})\varpi_{k-1} ^\curlywedge)\\ C_k &= (T_kp_k)^{\odot} \end{aligned}$

最终结果如下
4.3.1 预测
(4.10)
$\begin{aligned} T_k &= O_k T_{k-1}\\ P_k &= G_k P_{k-1}G_k^T + Q_k \end{aligned}$

4.3.2 卡尔曼增益
(4.11)
$\begin{aligned} K = P_k C_k^T (C_k P_k C_k^T + R_k)^{-1} \end{aligned}$

4.3.3 矫正
(4.12)
$\begin{aligned} P_k &= (I – KC_k)P)k\\ \mathcal{y}_k' &= T_k \mathcal{p}_k\\ T_k &= \exp((K(\mathcal{y}_k – \mathcal{y}_k'))^\wedge)T_k \end{aligned}$
参考
[1] 高翔,谢晓佳. 机器人学中的状态估计[M]. 西安交通大学出版社,2018

位姿的刚体变换与坐标系转换

2019年9月2日2022年10月31日 shikang999 6 条评论

1 前言
在一些场景里，可能会遇到坐标系转换与刚体变换的问题，对于空间点来说，它们的变换形式是一致的，而对于带旋转的位姿来说，它们的变换方式却不一致。

一个对象进行刚体变换，整体表现为旋转与平移，不改变坐标系本身约定的性质（各个轴之间的相对关系不会改变）。刚体变换可以理解成在同一个约定的坐标系下，从一个相对坐标系到另一个相对坐标系的变换过程！（PS：世界坐标系也可看成一个特殊的相对坐标系）

坐标系转换，从名字上就可以看出，其本身是对约定的系统进行改变。比如，左右坐标系的转换，它们各个轴的相对关系因坐标系的不同而不同。

不管是刚体变换还是坐标系之间的转换，主要的难点是旋转矩阵的表现形式。本文这里仅简单记录。

注意：
(1) 本文中没有特别说明的，其表示方式均为世界坐标系的表示方式。
(2) 本文当中的3D点 $\mathbf{p}$ 为了表示方便，均以齐次坐标形式表示，即
(1.1)
$\mathbf{p}=\begin{bmatrix} x\\ y\\ z\\ 1 \end{bmatrix}$

2 刚体变换

刚体变换的主体思想是，对操作对象进行旋转与平移，这里约定有如下(2.1)的变换矩阵，然后用这个矩阵对操作对象进行操作即达到刚体变换效果。
(2.1)
$T = \begin{bmatrix} R & \mathbf{t}\\ \mathbf{0}^T & 1 \end{bmatrix}$

2.1 点的变换
对于空间点 $\mathbf{p}_0$ ，假设在刚体变换 $T$ 后变为 $\mathbf{p}_1$ ，那么变换前后的关系可以表示为
(2.2)

$\mathbf{p}_1 = T \mathbf{p}_0$

2.2 位姿的变换
对于空间中，有一个相机的位姿为 $T_0$ ，假设在刚体变换 $T$ 后变为 $T_1$ 。同样，空间点 $\mathbf{p}_0$ ，在刚体变换 $T$ 后变为 $\mathbf{p}_1$ 。由于刚体变换不会改变空间中对象的相对位置信息，因此可知点 $\mathbf{p}_0$ 在相机 $T_0$ 里的相对位置不会改变，因此可以得到
(2.3)

$T_0\mathbf{p}_0 = T_1\mathbf{p}_1=T_1T\mathbf{p}_0$

由于对任意 $\mathbf{p}_0$ 均要满足公式(2.3)，因此有
(2.4)

$T_1 = T_0 T^{-1}$

注意，这里的位姿 $T_0、T_1$ 是世界坐标系到相机坐标系的表示方式, 即如果一个世界坐标系的点 $\mathbf{p}_0$ ，通过公式 $T_0 \mathbf{p}_0$ 将变换到相机坐标系下的位置。如果 $T_0、T_1$ 相机坐标系到世界坐标系的表示方式, 即如果一个世界坐标系的点 $\mathbf{p}_0$ ，通过公式 $T_0^{-1} \mathbf{p}_0$ 将变换到相机坐标系下的位置，那么根据公式(2.4)，可以得到如下位姿变换结果

(2.5)

$T_1 = TT_0$

3 坐标系变换
有时我们会在左右手坐标系之间进行转换，有时我们需要将x、y轴进行对调，有时我们需要将当前坐标系按某种形式进行旋转……这一系列的坐标系变换，可以看成一个镜像、旋转、偏移的组合，这里以如下的变换矩阵来表示
(3.1)
$T = \begin{bmatrix} R' & \mathbf{t}\\ \mathbf{0}^T & 1 \end{bmatrix}$
注意：这里的 $R'$ 的行列式不一定为1，也可能为-1。

3.1 点的坐标系变换
对于空间点 $\mathbf{p}_0$ ，假设在坐标系变换 $T$ 后变为 $\mathbf{p}_1$ ，那么变换前后的关系可以表示为
(3.2)

$\mathbf{p}_1 = T \mathbf{p}_0$

3.2 位姿的坐标系变换

3.2.1 相机坐标系按约定变换，世界坐标系按约定变换
对于空间中，有一个相机的位姿为 $T_0$ ，假设经过坐标系变换系数 $T$ 后变为 $T_1$ 。同样，空间点 $\mathbf{p}_0$ ，在经过坐标系变换 $T$ 后变为 $\mathbf{p}_1$ 。由于 $\mathbf{p}_0$ 在相机 $T_0$ 里的相对位置不会改变。但是，需要注意的是，虽然相对位置不会改变，但是按约定，坐标系进行了变化（例如，在世界坐标系，我们约定x轴向前，y轴向右，z轴向上；在相机坐标系，我们也会默认x轴向前，y轴向右，z轴向上），则可得到如下结果

这里假设，在变换前的坐标系下， $\mathbf{p}_0$ 相对于 $T_0$ 的位置为 $\mathbf{p}'$ ，则可以得到
(3.3)

$\mathbf{p}' = T_0 \mathbf{p}_0$

$\mathbf{p}'$ 在经过坐标系变换 $T$ 后变为 $\mathbf{p}''$ ，则有
(3.4)

$\mathbf{p}'' = T \mathbf{p}'$

由于在变换后的坐标系下， $\mathbf{p}_1$ 相对于 $T_1$ 的位置也为 $\mathbf{p}''$ ，即
(3.5)

$\mathbf{p}'' = T_1 \mathbf{p}_1$
根据公式(3.2)-(3.5)可得到
(3.6)

$(T_1T – TT_0)\mathbf{p}_0 = \mathbf{0}$
由于对任意 $\mathbf{p}_0$ 均要满足公式(3.6)，因此有
(3.7)

$T_1 = T T_0 T^{-1}$

对(3.7)进行展开有
(3.8)

$\begin{bmatrix} R_1 & \mathbf{t}_1\\ \mathbf{0}^T & 1 \end{bmatrix} = \begin{bmatrix} RR_0R^{-1} &R\mathbf{t}_0 + \mathbf{t} – RR_0R^{-1}\mathbf{t}\\ \mathbf{0}^T & 1 \end{bmatrix}$

即旋转部分与偏移部分的变换结果分别为
(3.9)

$\begin{aligned} R_1 &= RR_0R^{-1}\\ \mathbf{t}_1 &= R\mathbf{t}_0 + \mathbf{t} – RR_0R^{-1}\mathbf{t} \end{aligned}$

特别地，当 $\mathbf{t}=\mathbf{0}$ 时，有
(3.10)
$\begin{aligned} R_1 &= RR_0R^{-1}\\ \mathbf{t}_1 &= R\mathbf{t}_0 \end{aligned}$

3.2.2 相机坐标系不变，世界坐标系按约定变换

这里同样使用3.2.1当中的符号表达，由于这里约定相机坐标系不变，因此(3.5)式变为

(3.11)

$\mathbf{p}' = T_1 \mathbf{p}_1$

由公式(3.2),(3.3),(3.11)可以得到

(3.12)

$(T_1T – T_0)\mathbf{p}_0 = \mathbf{0}$

由于对任意 $\mathbf{p}_0$ 均要满足公式(3.12)，因此有
(3.13)

$T_1 = T_0T^{-1}$

3.2.3 相机坐标系按约定变换，世界坐标系不变

这里同样使用3.2.1当中的符号表达，由于这里约定世界坐标系不变，因此(3.5)式变为

(3.14)

$\mathbf{p}'' = T_1 \mathbf{p}_0$

由公式(3.3),(3.4),(3.14)可以得到

(3.15)

$(TT_0 – T_1)\mathbf{p}_0 = \mathbf{0}$

由于对任意 $\mathbf{p}_0$ 均要满足公式(3.15)，因此有
(3.16)

$T_1 = TT_0$

3.3 相机坐标系变换总结

最终，相机坐标系变换方式，可分3种情况进行：

情况1：相机坐标系按约定变换，世界坐标系按约定变换，这时使用公式(3.7)

情况2：相机坐标系不变，世界坐标系按约定变换，这时使用公式(3.13)

情况3：相机坐标系按约定变换，世界坐标系不变，这时使用公式(3.16)

现在有一个原始的相机位姿为 $T_0$
(4.1)
$T_0 = \begin{bmatrix} R_0 & \mathbf{t}_0\\ \mathbf{0}^T & 1 \end{bmatrix}$
因为一些接口需要，我们希望将原始坐标系的x轴指向新坐标系的z轴反向，原坐标系的y轴指向新坐标系的x轴反向，原坐标系的z轴指向新坐标系y轴。根据需求，可得到变换矩阵的旋转部分
(4.2)

$R = \begin{bmatrix} 0 & -1 & 0\\ 0 & 0 & 1\\ -1 & 0 & 0 \end{bmatrix}$
根据需求，偏移部分为
(4.3)

$\mathbf{t} = \begin{bmatrix} 0\\ 0\\ 0 \end{bmatrix}$
因此最终得到扩展后的变换矩阵
(4.4)
$T = \begin{bmatrix} 0 & -1 & 0 & 0\\ 0 & 0 & 1 &0 \\ -1 & 0 & 0 &0\\ 0 & 0 & 0 & 1 \end{bmatrix}$

按公式(3.7)，可得到最终的坐标系变换结果
$T_1 = T T_0 T^{-1}$

5 延伸

5.1 按指定向量旋转

很多时候，我们可能希望得到某些点以 $\mathbf{p}_0$ 为原心，由向量 $\mathbf{n}_1$ 旋转到向量 $\mathbf{n}_2$ 后的位置，这个本质上是求公式（3.2）当中的变换矩阵 $T$ 。

很明显，第一步，可以将所有点以 $\mathbf{p}_0$ 为原心，进行平移；第二步，由于向量 $\mathbf{n}_1$ 与向量 $\mathbf{n}_2$ 叉乘后的单位轴向量 $\mathbf{a}$ 同时垂直于 $\mathbf{n}_1$ 、 $\mathbf{n}_2$ ，因此 $\mathbf{a}$ 可以作为旋转轴，而旋转角度，可以通过余弦公式计算得出。因此可先按如下方式确定对应变量：

(5.1)

$\begin{aligned} \mathbf{a} &=\frac{ \mathbf{n}_1 \times \mathbf{n}_2}{|\mathbf{n}_1||\mathbf{n}_2|}\\ \theta &= \mathbf{arccos}(\frac{\mathbf{n}_1 \cdot \mathbf{n}_2}{|\mathbf{n}_1||\mathbf{n}_2|}) \end{aligned}$

结合SLAM之李群李代数工具中的公式(1.5)，可以得到旋转矩阵 $R$ ，最终变换矩阵形式如下

(5.2)

$T = \begin{bmatrix} R & -R\mathbf{p}_0\\ \mathbf{0} & 1 \end{bmatrix}$

SO(3)与Sim(3)插值

2019年6月22日2022年11月25日 shikang999 2 条评论

在常规的插值中，我们会根据n个已知点的值，插值出给定点的结果。其中主要利用的思想是，通过这n个点建立某种数学模型，进而推导出这个待插值点的结果。本文这里仅考虑2个已知点的情况，对应到我们常规插值中，就表现为线性插值。但本文这里，由于插值出的结果不是一个数值，是一个需要满足某种性质的矩阵，因此，不能单纯采用矩阵的线性加减。

1 SO(3)旋转矩阵插值

这里直接给出一种插值模型

(1) $\begin{aligned} R &= (R_1R_0^T)^aR_0\\ &= R_{10}^aR_0\\ &=\exp(\varphi ^ \wedge)^aR_0\\ &=\exp(a \varphi ^ \wedge)R_0 \\ &=\exp((a \varphi )^ \wedge)R_0 \end{aligned}$

上面公式中的 $a$ 表示插值点的值,其取值范围在[0,1]，当 $a = 0$ 时，对应值为旋转矩阵 $R_0$ ，当 $a = 1$ 时，对应值为旋转矩阵 $R_1$ ，公式中的 $\varphi$ 对应的矩阵为 $R_1R_0^T$

2 Sim(3)位姿矩阵插值

先申明如下SE(3)矩阵格式

(2) $T_0 = \begin{bmatrix} s_0R_0 & t_0\\ 0 & 1 \end{bmatrix}\\T_1 = \begin{bmatrix} s_1R_1 & t_1\\ 0 & 1 \end{bmatrix}\\T = \begin{bmatrix} sR & t\\ 0 & 1 \end{bmatrix}$

即，现在我们想找到一种插值模型，使得 $a = 0$ 时，插值的 $T = T_0$ ;当 $a = 1$ 时， $T = T_1$ ，当 $a$ 取其它值时，插值的 $T$ 满足Sim(3)性质。其中插值点 $a$ 取值在[0,1]。

即现在需要通过 $T_0,T_1$ 插值出 $T$ 当中的 $s,R,t$

2.1 无光心约束插值

与旋转矩阵插值类似，可以构建如下的插值模型

(3) $\begin{aligned} T &= (T_1T_0^{-1})^aT_0\\ &= T_{10}^aT_0\\ &=\exp(\xi ^ \wedge)^aT_0\\ &=\exp(a \xi ^ \wedge)T_0 \\ &=\exp((a \xi) ^ \wedge)T_0 \end{aligned}$

这里将公式(3)展开有

(4) $T=\begin{bmatrix} (s_1/s_0)^a(R_1R_0^T)^a & a(t_1 – (s_1/s_0)R_1R_0^Tt_0)\\ 0 & 1 \end{bmatrix} \begin{bmatrix} s_0R_0 & t_0\\ 0 & 1 \end{bmatrix}$

通过公式(4)可以得到最终的插值结果

(5) $\begin{aligned} s &= s_0(\frac{s_1}{s_0})^a\\ R &= (R_1R_0^T)^aR_0\\ t &= (\frac{s_1}{s_0})^a(R_1R_0^T)^at_0 + a(t_1-\frac{s_1}{s_0}R_1R_0^Tt_0) \end{aligned}$

2.2 有光心约束插值

当我们使用Sim(3)来表示一个位姿的时候，我们知道一种位姿在空间会对应一个相机中心坐标。当给定两个位姿，然后在它们之间进行插值时，我们可以假设它们插值的相机中心也满足两个位姿相机中心的线性插值。即有如下约束

(6) $\frac{R^Tt}{s} =(1-a) \frac{R_0^Tt_0}{s_0} + a\frac{R_1^Tt_1}{s_1}$

公式(6)是一个含有3个等式的约束，如果插值结果的旋转 $R$ 与缩放部分 $s$ 采用公式(5)的结果，那结合公式(6)刚好可以求出插值的 $t$ ,因此最终的插值结果可表示为

(7) $\begin{aligned} s &= s_0(\frac{s_1}{s_0})^a\\ R &= (R_1R_0^T)^aR_0\\ t &=sR ((1-a) \frac{R_0^Tt_0}{s_0} + a\frac{R_1^Tt_1}{s_1}) \end{aligned}$

位姿与平面耦合

2019年3月30日2020年5月13日 shikang999 评论

1 前言
在使用单目相机的无人驾驶中，有时我们需要构建位姿与现实中某一个平面的关系，以便为后续其它操作提供基础！

2 原理

2.1 位姿与平面间的耦合

假设有相机1（ $s_1$ 、 $R_1$ 、 $t_1$ ）与相机2（ $s_2$ 、 $R_2$ 、 $t_2$ ），一个平面在相机1坐标系下的方程为
(1)
$n^Tp+d=0$
上面公式中 $n$ 是相机平面法向量， $p$ 是一个在相机1坐标系下路平面上的点， $d$ 实际就是相机到平面的距离。对公式(1)进行变形有
(2)
$1=-\frac{n^Tp}{d}$

根据SLAM之位姿到位姿的相对测量中的公式(5)可以得到相机2与相机1的相对位姿关系
(3)
$\begin{aligned} R &= R_2R_1^Ts_2/s_1 \\ t &= t_2 – Rt_1 \\ s_2R_2 &= s_1RR_1 \\ t_2 &= t + Rt_1 \end{aligned}$

现在(1)的平面上，有一个点被相机1与相机2看到，其在世界坐标系下的位置为 $p_w$ ，其在相机1坐标系下的坐标为 $p_c$ ，其在相机1平面上看到的坐标为 $c_1(u_1,v_1,1)$ ，在相机2平面上看到点坐标为 $c_2(u_2,v_2,1)$ ，假设相机1与相机2的内参分别为 $K_1$ 、 $K_2$ ，现在令
(4)
$p_1=K_1^{-1}c_1\\ p_2=K_2^{-1}c_2$

根据针孔相机模型可以得到
(5)
$z_1c_1 = K_1(s_1R_1p_w+t_1)=K_1p_c\\ \Downarrow \\ p_c = z_1K_1^{-1}c_1 = z_1p_1$

(6)
$\begin{aligned} z_2c_2&=K_2(s_2R_2p_w+t_2) \\ &=K_2(s_1RR_1p_w+t+Rt_1) \\ &=K_2(R(s_1R_1p_w+t1)+t) \\ &=K_2(Rp_c+t) \\ &=K_2(Rp_c+t(-\frac{n^Tp_c}{d})) \\ &=K_2(R-\frac{tn^T}{d})p_c \\ &=K_2(R-\frac{tn^T}{d})z_1p_1 \end{aligned} \\ \Downarrow \\ z_2p_2=z_2K_2^{-1}c_2=(R-\frac{tn^T}{d})z_1p_1$

公式(6)建立了平面与位姿的关系。这里需要理解：

1)公式当中是2个位姿共同耦合1个平面。

2)耦合的方程中还包含两个相机共同观测到平面上的点。

3)公式当中的平面是相机1坐标系下的平面，如果要建立世界坐标系下平面与位姿的关系，则将平面方程进行坐标系转换一下即可（相机1坐标系转到世界坐标系）

2.2 根据观测求取相对测量与平面
公式(5)、(6)当中的 $z_1$ 、 $z_2$ 是使得相机归一化后的最后一维的值，这里令 $s = z_2/z_1$ 则公式(6)最终可表示为
(7)
$sp_2=(R-\frac{tn^T}{d})p_1$

且复原到 $c_1$ 、 $c_2$ 有
(8)
$sc_2=K_2(R-\frac{tn^T}{d})K_1^{-1}c_1=Hc_1$
SLAM当中将 $H$ 叫做单应矩阵，一般会使用这个矩阵来恢复出相对测量 $R$ 、 $t$ ，下面将公式(8)展开有
(9)
$s\begin{bmatrix} u_2\\ v_2\\ 1 \end{bmatrix} = \begin{bmatrix} h_1 & h_2 & h_3\\ h_4 & h_5 & h_6\\ h_7 & h_8 & h_9 \end{bmatrix} \begin{bmatrix} u_1\\ v_1\\ 1 \end{bmatrix} \\ \Downarrow \\ \begin{aligned} su_2 &= h_1u_1+h_2v_1+h_3\\ sv_2 &= h_4u_1+h_5v_1+h_6\\ s&=h_7u_1+h_8v_1+h_9 \end{aligned}$

在公式(9)当中消去 $s$ 有
(10)
$\begin{aligned} u_2 &= \frac{h_1u_1+h_2v_1+h_3}{h_7u_1+h_8v_1+h_9}\\ v_2 &= \frac{h_4u_1+h_5v_1+h_6}{h_7u_1+h_8v_1+h_9} \end{aligned}$
仔细观察公式(10)可以发现，对于 $H$ 中的元素同时乘以一个非0的常数，并不改变公式(10)的结果，且这样操作后等价于 $H$ 的特征值同时乘以这个非0常数。因此这里不妨假设 $h_9=1$ ，当然也可以假设 $H$ 的其它元素值为1(这里需要注意，假设的元素的值本身可能为0，所以保险做法是取几个元素置为1分别尝试计算 $R$ 、 $t$ )，因此最终方程(10)可变为
(11)
$\begin{bmatrix} u_1 & v_1 & 1 & 0 & 0 & 0 & -u_1u_2 & -v_1u_2 \\ 0 & 0 & 0 & u_1 & v_1 & 1 & -u_1v_2 & -v_1v_2 \end{bmatrix} \begin{bmatrix} h_1\\ h_2\\ h_3\\ h_4\\ h_5\\ h_6\\ h_7\\ h_8 \end{bmatrix} = \begin{bmatrix} u_2\\ v_2 \end{bmatrix}$

当有多组观测点都落在这个平面时，可以通过组装的线性方程组求解出一个最佳的 $H$ ，由于在求解过程中假设 $h_9=1$ ，因此真实的 $H$ 可表示为 $\alpha H$

因此根据公式(8)最终可以得到
(12)
$(R-\frac{tn^T}{d}) = \alpha K_2^{-1}HK_1 = \alpha G$

对于公式(1)的平面方程来说，两边同时乘以一个非0系数，不改变平面性质，因此对于公式(12)当中的 $d$ ，不妨令其等于1(实际当中一般需要建立相机与平面的关系时，这个相机一般距离平面有一定距离，因此参数 $d$ 为0的可能性很小)，则公式(12)则变成
(13)
$(R-tn^T) = \alpha G$
在上面的公式中 $G$ 已经得到，对于公式(13)的形式，根据Ezio Malis[1]的结果，最终可以求解出 $R$ 、 $t$ 、 $n$ 、 $\alpha$

2.3 已知相对测量求平面方程

和上面类似，仔细观察公式(7)可知，同时缩放 $n$ 、 $d$ 一个非0系数，它们的平面性质不会改变(公式(1)当中两边同时乘以一个非0常数，表示的平面不变)，这时不妨设$d=1$，则公式(7)最终变为
(14)
$sp_2=Rp_1-tn^Tp_1=Rp_1-tp_1^Tn$
将公式(14)中的未知数都移动到一边有
(15)
$tp_1^Tn+sp_2=Rp_1$

从公式(15)可以看出，这个里面有3个线性方程4个未知数( $n$ 为3个未知数， $s$ 为1个未知数)。

对于一个平面上的多个匹配点对，由于每个(匹配对)点对应的 $s$ 不一样，因此如果平面上同时有 $m$ 个点被两个相机同时看见，这时根据(15)可以构建一个$3m \times (3 + m)$的线性矩阵来求解出平面方程系数 $n$ 。

如果两个相机的连线与所在平面平行，现在设两个相机连线在世界坐标系下的方向向量为 $v$ ，则它们与公式(1)当中的 $n$ 满足如下关系
(16)
$n^TR_1v=0$
上面公式(16)是一个3个未知数( $n$ )的线性方程，因此如果将公式(16)带入公式(15)， $n$ 的求解维度可以进一步降低到2维。进而可以进行求解。

参考

[1] Ezio Malis, Manuel Vargas. Deeper understanding of the homography decomposition for vision-based control. 2007

SLAM之本质矩阵分解得相对变换的R和t

2018年8月24日2020年5月13日 shikang999 2 条评论

1 前言

对极几何当中的基础矩阵 $F$ 与本质矩阵 $E$ 是SLAM当中2D-2D恢复出相对变换的重要变量,其相关推导可参看文献[1]。

在相关矩阵计算时，一般会在两幅图像中，根据特征找到对应匹配对后估计出基础矩阵 $F$ 或本质矩阵 $E$ ，如果是直接估计出基础矩阵 $F$ ，且知道两幅图中的相机参数分别为 $K_1$ 、 $K_2$ ，则可以直接得到本质矩阵 $E$

(1-1) $E=K_2^TFK_1$

对于本质矩阵与相对变换的 $R$ 和 $t$ 有如下关系(注意这里指的相对变换是从第一幅图变换到第二幅图的位姿相对变换)

(1-2) $E=t^\wedge R$

其中本质矩阵 $E$ 还具有如下的性质

(1-3) $rank(E)=2$

(1-4) $2EE^TE=tr(EE^T)E$

2 常规分解[2]

平常从 $E$ 得到两幅图像相对变换的 $R$ 和 $t$ ，主要通过奇异值分解得到，即对 $E$ 进行SVD分解可得

(2-1) $E=USV^T$

这里先放置一个常量 $W$

(2-2) $W=\begin{bmatrix} 0& -1&0 \\ 1& 0 &0 \\ 0&0 & 1 \end{bmatrix}$

那么最终可以得到如下的 $R$ 和 $t$

(2-3) $\begin{align*} t_1^\wedge &= UWSU^T \\ t_2 &= -t1\\ R_1 &=UWV^T \\ R_2 &= UW^TV^T \end{align*}$

上面总共存在4组可能的解 $(t_1,R_1)、(t_1,R_2)、 (t_2,R_1)、(t_2,R_2)$ ，在这4组解中，仅有一组满足所有投影点在两个相机中都为正深度，因此代入匹配点计算出坐标，即可选出正确的一组。

这里需要说明一点，当计算的本质矩阵 $E$ 不是严格满足其性质时，其中 $E$ 有一个性质是其特征值前两个为相等的非0值，最后一个为0，即公式(2-1)当中的 $S$ 应该为如下形式

(2-4) $S=\begin{bmatrix} \sigma & 0 & 0\\ 0& \sigma &0 \\ 0 & 0 & 0 \end{bmatrix}$

这时，可以假设一个严格满足本质矩阵的 $E'$ 去逼近给的 $E$ 矩阵，这里假设 $E'$ 为如下形式

(2-5) $E'=US'V^T$

那么可以通过最小化 $\left \| E – E' \right \|_F$ 来得到最佳的本质矩阵，即最小化如下方程

(2-6) $\begin{align*} min \left \| E – E' \right \|_F &= min \left \| U^T(E – E')V \right \|_F \\ &=min \left \| U^TEV – U^TE'V \right \|_F \\ &=min \left \| S – S' \right \|_F \\ &=min [(\sigma_1 – \sigma)^2 + (\sigma_2 – \sigma)^2 + \sigma_3^2] \end{align*} \Rightarrow \sigma = (\sigma_1+\sigma_2)/2$

即当 $S'$ 满足如下形式时，有最佳逼近

(2-6) $S'=\begin{bmatrix} (\sigma _1 + \sigma _2)/2& 0 & 0\\ 0 & (\sigma _1 + \sigma _2)/2 & 0\\ 0 & 0 & 0 \end{bmatrix}$

其中 $E$ 的特征值由大到小排列为 $\sigma _1$ 、 $\sigma _2$ 、 $\sigma _3$

因此最终使用(2-7)算式当中的 $S'$ 替换(2-3)当中的 $S$ 即可。

3 快速分解[3]

上面是通过奇异值分解得到 $R$ 和 $t$ ，这里直接求取 $R$ 和 $t$ 。

先导出一个等式

(3-1) $\begin{align*} E^Tt&=(t^\wedge R)^Tt\\ &= R^T(t^\wedge)^Tt\\ &= R^T(-t^\wedge)t\\ &= -R^T(t^\wedge t)\\ &= 0 \end{align*}$

从上面公式(3-1)中，可以发现，通过 $E$ 可以直接解一个方程 $E^Tt=0$ 得到一组非0特殊解 $t$ (真实 $t$ 为这个解的 $k$ 倍，这个 $k$ 目前还不知道，后面可以通过计算反算出真实的 $t$ )

从(2-1)可得到 $E$ 的模

(3-2) $\left \| E \right \|_F=\left \| S \right \|_F=\sqrt{2} \sigma$

而从(2-3)可以得到

(3-3) $\sqrt{2} \left \| t \right \|_2= \left \| t^\wedge \right \|_F=\left \| WS \right \|_F=\sqrt{2} \sigma$

结合(3-2)与(3-3)有

(3-4) $\left \| E \right \|_F=\sqrt{2} \left \| t \right \|_2$

从(3-4)可以发现，真实的 $E$ 的模为 $t$ 的 $\sqrt{2}$ 倍，在这个情况下，同时缩放不影响 $R$ 的旋转性质，因此不妨取 $E$ 的模为 $\sqrt{2}$ ， $t$ 的模为1，即这时将 $E$ 与 $t$ 进行缩放，得到

(3-5) $E'=\sqrt{2}E/ \left \| E \right \|_F$

(3-6) $t'=t/ \left \| t \right \|_2$

则对于公式(1-2)展开有

(3-7) $\begin{bmatrix} e_1^T\\ e_2^T\\ e_3^T \end{bmatrix}=E'=t'^\wedge R=\begin{bmatrix} t_1^T\\ t_2^T\\ t_3^T \end{bmatrix}R \Leftrightarrow \left\{\begin{matrix} Re_1=t_1\\ Re_2=t_2\\ Re_3=t_3 \end{matrix}\right.$

上面公式中的 $e_i$ 、 $t_i$ 分别表示 $E'$ 、 $t'^\wedge$ 的第 $i$ 行数据。

在(3-7)中需要注意，由于 $E'$ 矩阵不可逆(其本身性质决定，它的秩为2)因此并不能直接求得 $R$ ，但是因为 $E'$ 秩为2，因此在(3-7)中的 $e_i$ 中必有两个线性无关向量，这里假设选取的两个线性无关的向量为 $e_1$ 、 $e_2$ ,其中 $e_3$ 必定可以使用 $e_1$ 、 $e_2$ 的线性表示。

对于公式(3-7)中的变量进行如下操作

(3-8) $\begin{align*} t_1 \times t_2 &= (Re_1)\times (Re_2) \\ &= (Re_1) ^\wedge (Re_2)\\ &= Re_1^\wedge R^T(Re_2)\\ &=Re_1^\wedge R^TRe_2\\ &=Re_1^\wedge e_2\\ &=R(e_1 \times e_2) \end{align*}$

根据叉乘的定理可知 $e_1 \times e_2$ 必定与 $e_1$ 、 $e_2$ 线性无关，因此可以得到一个如下的可逆矩阵 $A$

(3-9) $A=\begin{bmatrix} e_1 & e_2 & e_1 \times e_2 \end{bmatrix}$

以及一个矩阵 $B$

(3-10) $B=\begin{bmatrix} t_1 & t_2 & t_1 \times t_2 \end{bmatrix}$

则由(3-7)到(3-10)可以得到如下方程

(3-8) $RA=B$

最终可以得到旋转矩阵

(3-9) $R = B A^{-1}$

由于求得的 $t$ 有一个缩放，如果想恢复成原本 $E$ 的大小，则可以根据公式(1-2)与(3-9)得到的 $R$ 得到 $t$

(3-10) $t^\wedge = ER^T$

需要说明，由于当 $E=-E$ 时也可以通过上面方式得到一个 $R$ ，因此最终的求解方式是：

①当 $E=E$ 时，求得一组 $R_1 , t_1$

②当 $E=-E$ 时，求得一组 $R_2 , t_2$

这时 $t_1=t_2$ 或者 $t_1=-t_2$ ，这里直接记 $t1=\left | t_1 \right |$ ， $t2=-\left | t_1 \right |$

则最终可能产生4组可能的解 $(t_1,R_1)、(t_1,R_2)、 (t_2,R_1)、(t_2,R_2)$ ，和第2点一样，可以使用正深度法选择出正确的那组解。

可以发现，这个方法分解 $R$ 、 $t$ 只有解方程与求逆，并且操作矩阵仅为3阶，都有比较简单的常规表达式，因此比起奇异值分解得到变换的 $R$ 和 $t$ ，具有更高效的特点。

4 三角测量

当通过以上方法的得到两张图对应的变换 $R$ 和 $t$ 后，需要恢复出对应点的在空间中的位置时（上面从多组解中筛选出正确的那最解就需要用到），在单目SLAM中，就需要通过三角测量来估计其深度。

配对的两个图像上的特征点，假设归一化后的坐标为 $x_1$ 与 $x_2$ ，这时根据得到的变换，则它们满足

(4-1) $s_2x_2=s_1Rx_1+t$

公式中的的 $s_1$ 、 $s_2$ 分别为两个特征点对应的深度。由于求解变量只有2个，则直接解一个线性方程组即可求得最佳的 $s_1$ 、 $s_2$

参考:

[1] 杨述强. 基于单目视觉的场景三维重建与飞行器位姿求解关键技术研究[D]. 国防科学技术大学, 2014.

[2] 高翔 , 张涛. 视觉SLAM十四讲从理论到实践[M]. 北京:电子工业出版社, 2017.3

[3]李国栋, 田国会, 王洪君,等. 弱标定立体图像对的欧氏极线校正框架[J]. 光学精密工程, 2014, 22(7):1955-1961.