0%

论文全称:ORB-SLAM3:An Accurate Open-Source Library for Visual, Visual-Inertial and Multi-Map SLAM.

首先回顾一下历史:ORB-SLAM首次在2015年被提出,它的改进版ORB-SLAM2在2017年被提出,同年提出了ORB-SLAM-VI,时隔3年,ORB-SLAM3横空出世,朋友圈、学术群里到处都在热议这个挂在ARXIV才不到3天的论文。好奇心的驱使下,本人偷瞄了一下论文,就在这里总结一下吧。

论文, Code Github, Code国内镜像, SLAM资源站

Read more »

对于经常刷Github的同学而言,是否会经常遇到图片加载不出来/GitHub访问慢等情况?反正我是经常遇到!为了解决这个问题,削微寒公布了解决方案:修改本机hosts,无需安装任何程序。下面是详细说明以及使用方法(修改自项目README)。

Read more »

译者注:这恐怕是全网有关卡尔曼滤波最简单易懂的解释,如果你认真的读完本文,你将对卡尔曼滤波有一个更加清晰的认识,并且可以手推卡尔曼滤波。原文作者使用了漂亮的图片和颜色来阐明它的原理(读起来并不会因公式多而感到枯燥),所以请勇敢地读下去!

Read more »

注意arxiv读音与archive一样,英[ˈɑːkaɪv],美[ˈɑːrkaɪv]

国内访问论文预发布平台arxiv巨慢无比,让人闹心!网上找了一个很好用的方法,按照这个方法配置之后arxiv就秒开了。原理就是将arxiv重定向到xxx.itp.ac.cn(中科院理论物理研究所镜像)。 如果此时你找到了一篇文章,地址是arxiv.org/abs/1911.11763,只需要把arxiv.org换成xxx.itp.ac.cn即可。但每次都手动配置就很麻烦,为了贯彻将懒惰进行到底的精神,我们需要将上述过程自动化。配置如下:

Read more »

从一系列的图像中恢复物体的3D结构是计算机视觉研究中一个热门课题,这使得我们可以相隔万里从google map中看到复活节岛的风景。这得益于图像来自于可控的条件,使得最终的重建效果一致性且质量都很高,但是这却限制了采集设备以及视角。畅想一下,假如我们不使用专业设备,而是利用sfm技术根据互联网上大量的图片重建出这个复杂世界。

Read more »

ETHZ ASL与Magicleap联名之作,CVPR 2020 Oral(论文见文末),一作是来自ETHZ的实习生,二作是当年CVPR2018 SuperPoint的作者Daniel DeTone。Sarlin小伙之前在MagicLeap实习,在ETHZ(苏黎世联邦理工) ASL 完成硕士,目前在 ETHZ CVG就读博士,不是TUM(慕尼黑工业大学)的CVG。

Read more »

SVD分解就是一种矩阵拆解术,它能够把任意矩阵\(A \in \mathbb{R}^{m \times n}\)拆解成3个矩阵的乘积形式,即:

\[ A = U \Sigma V^T \]

其中,\(U \in \mathbb{R}^{m \times m}\)\(V \in \mathbb{R}^{n \times n}\)都是正交矩阵,即\(U^T U = I, V^T V = I\),即列向量是正交的单位向量,\(U\)称为left single vectors\(V\)称为right single vectors\(\Sigma \in \mathbb{R}^{m \times n}\)的对角阵(奇异值),奇异值\(\geq 0\)且按照顺序降序排列。

MIT Gilbert Strang 教授对 SVD 讲解得很清晰,如下:

Read more »

PNP即“Perspective-N-Points”,是求解 3D 到 2D 点对运动的方法。它描述了当我们知道n个3D空间点以及它们在图像上的位置时,如何估计相机所在的位姿。PnP 问题有很多种求解方法,例如用三对点估计位姿的 P3P(通常需要额外一个点进行验证结果),直接线性变换(DLT),EPnP(Efficient PnP,已知内参时用),UPnP(内参未知时用) 等等)。此外,还能用非线性优化的方式,构建最小二乘问题并迭代求解,也就是万金油式的 Bundle Adjustment

Read more »

可以说整个重定位就是一个精心设计的解算当前帧位姿的模块,秉持着不抛弃不放弃的精神,ORB-SLAM的作者简直把特征匹配压榨到了极致,仿佛在说“小伙子你有很多匹配点的,不要放弃,我们优化一下位姿再找找匹配点呗”。

Read more »