0%

“Here’s to the crazy ones. The misfits. The rebels. The troublemakers. The round pegs in the square holes. The ones who see things differently. They’re not fond of rules. And they have no respect for the status quo. You can quote them, disagree with them, glorify or vilify them. About the only thing you can’t do is ignore them. Because they change things. They push the human race forward. And while some may see them as the crazy ones, we see genius. Because the people who are crazy enough to think they can change the world are the ones who do.”

— Apple’s “Think Different” commercial, 1997
Read more »

我必须告诉大家有关卡尔曼滤波器的详细信息,因为它的功能实在是太强大了!

译者注:这恐怕是全网有关卡尔曼滤波最简单易懂的解释,如果你认真的读完本文,你将对卡尔曼滤波有一个更加清晰的认识,并且可以手推卡尔曼滤波全过程。原文作者使用了漂亮的图片和颜色来阐明它的原理(读起来并不会因公式多而感到枯燥),所以请勇敢地读下去!

本人翻译水平有限,如有疑问,请阅读原文;如有错误,请在评论区指出。

Read more »

国内访问论文预发布平台arxiv巨慢无比,让人闹心!网上找了一个很好用的方法,按照这个方法配置之后arxiv就秒开了。原理就是将arxiv重定向到xxx.itp.ac.cn(中科院理论物理研究所镜像)。
如果此时你找到了一篇文章,地址是arxiv.org/abs/1911.11763,只需要把arxiv.org换成xxx.itp.ac.cn即可。但每次都手动配置就很麻烦,为了贯彻将懒惰进行到底的精神,我们需要将上述过程自动化。配置如下:

Read more »

从一系列的图像中恢复物体的3D结构是计算机视觉研究中一个热门课题,这使得我们可以相隔万里从google map中看到复活节岛的风景。这得益于图像来自于可控的条件,使得最终的重建效果一致性且质量都很高,但是这却限制了采集设备以及视角。畅想一下,假如我们不使用专业设备,而是利用sfm技术根据互联网上大量的图片重建出这个复杂世界。

为了加快这个领域的研究,更好地利用图像数据有效信息,谷歌联合 UVIC, CTU以及EPFL发表了这篇文章 “Image Matching across Wide Baselines: From Paper to Practice”,[PDF],旨在公布一种新的衡量用于3D重建方法的标准模块+数据集,这里主要是指2D图像间的匹配。这个评价模块可以很方便地集成并评估现有流行的特征匹配算法,包括传统方法或者基于机器学习的方法。

谷歌公布2020图像匹配挑战的数据集:官网博客,文末有排行榜。

Read more »

SVD分解就是一种矩阵拆解术,它能够把任意矩阵$A \in \mathbb{R}^{m \times n}$拆解成3个矩阵的乘积形式,即:

其中,$U \in \mathbb{R}^{m \times m}$,$V \in \mathbb{R}^{n \times n}$都是正交矩阵,即列向量是正交的单位向量,$\Sigma \in \mathbb{R}^{m \times n}$的对角阵(奇异值)。搬运了来自MIT OpenCourseWare的在线课程并放在了B站,讲解得很清晰。

Read more »

PNP即“Perspective-N-Points”,是求解 3D 到 2D 点对运动的方法。它描述了当我们知道n个3D空间点以及它们在图像上的位置时,如何估计相机所在的位姿。PnP 问题有很多种求解方法,例如用三对点估计位姿的 P3P(通常需要额外一个点进行验证结果),直接线性变换(DLT),EPnP(Efficient PnP,已知内参时用),UPnP(内参未知时用) 等等)。此外,还能用非线性优化的方式,构建最小二乘问题并迭代求解,也就是万金油式的 Bundle Adjustment

Read more »

可以说整个重定位就是一个精心设计的解算当前帧位姿的模块,秉持着不抛弃不放弃的精神,ORB-SLAM的作者简直把特征匹配压榨到了极致,仿佛在说“小伙子你有很多匹配点的,不要放弃,我们优化一下位姿再找找匹配点呗”。

Read more »

ORB-SLAM中使用了多种特征匹配的奇技淫巧,其中之一就是利用词袋信息进行引导匹配SearchByBoW:利用了BOW里的正向引导进行两帧之间的匹配,核心点在于位于同一个节点处的特征才有可能属于同一匹配,相较于暴力匹配匹配速度更快。

Read more »