Линейная аппроксимация комбинации линий по набору зашумленных точек

Постановка задачи

Рассмотрим задачу аппроксимации комбинации прямых линий по набору зашумленных координат точек, находящихся на данной комбинации линий (см. Рис. 1 и Рис. 2). Обычная формула линейной аппроксимации здесь не подойдет, так как точки перемешаны и результат будет некая усредненная линия между ними (см. Рис. 3).


p9tpgsa15kl5lbm2fjqsvr6u2co.png

Рис. 1 Комбинация линий и зашумленный набор координат


n-a1znn2cq0zlis5fckfu9seuii.png

Рис. 2 Комбинация линий и зашумленный набор координат в увеличенном масштабе


j1y0zo2ypv9wwwwd90v7pawy26c.png

Рис. 3 Результат линейной аппроксимации


Алгоритм

Единственный способ, который пришел в голову, это перебирать разные варианты линий. Т.е. перебираем все возможные углы, естественно на ограниченной сетке, от -90 градусов до +90 градусов (от -180 до 180 бессмысленно, т.к. линия симметрична относительно центра координат).

Таким образом, перебирая всевозможные варианты углов оцениваем тот угол наклона линии, при котором наибольшее количество точек находится на одинаковом расстоянии. Данный угол является искомым углом наклона линии, но он приблизительный, ввиду дискретности начального набора углов. Далее строим линейную аппроксимацию по полученному набору точек и получаем максимально приближенную аппроксимацию первой линии.

Для нахождения следующей линии, из рассмотрения убираются точки, использованные на предыдущем этапе. Таким образом, линия за линией, аппроксимируем все линии.


1. Набор рассматриваемых углов

На данном этапе необходимо разобраться какой набор углов будет перебираться. Зная особенности конкретной задачи можно подкорректировать данный набор углов, тем самым ускорив процесс детектирования линий. Так же можно учесть особенности угла наклона между линиями, то есть на каждом следующем шаге сужать диапазон перебираемых углов. В данной задаче будем использовать в лоб равномерный набор углов от -90 до 90 градусов с шагом 0.1 градуса.


2. Определение расстояния от точки до прямой

Для удобства перебора всевозможных вариантов линий, нам необходимо вывести формулу оценки кратчайшего расстояния от точки до линии.

Пусть уравнение линии и координаты точки, расстояние от которой измеряем, принимают следующие обозначения:

$y = kx + b, x_p, y_p$

Тогда, так как кратчайшее расстояние от точки до линии это перпендикуляр к этой линии, получаем уравнение перпендикуляра, проходящего через заданную точку следующего вида:

$y-y_p=-(x-x_p)/k =>y= -x/k+ x_p/k+y_p$» /></p>

<p>Тогда, точка пересечения этих двух прямых: </p>

<p><img src=


3. Построение гистограммы расстояний

Если мы построим просто гистограмму расстояний, она будет малоинформативной, поэтому нам необходимо построить гистограмму по скользящему окну, таким образом она будет более плавной и результат мы получим с меньшей ошибкой (см. Рис. 4–6).

По построенной гистограмме определяем расстояние с максимальным количеством точек. По полученному набору максимального количества точек для каждого угла, строим зависимость количества точек и угла наклона линии (см. Рис. 7, 8). На Рис. 7 видно четких два пика, данные пики и есть углы наклона интересующих нас линий.


b15mvrcunpnjaxszoaufnhzlutq.png

Рис. 4 Гистограмма расстояний (ошибочная линия)


e-rcqmljjwxp0w_8bxvipsq45e0.png

Рис. 5 Гистограмма расстояний (правильная линия)


xuzofm06hlz63c7l8nyl3rypy2i.png

Рис. 6 Увеличенная гистограмма расстояний (правильная линия)


_n-pypx5ic3f25ftwph8kdlsxry.png

Рис. 7 Гистограмма распределения максимального количества равноудаленных точек в зависимости от угла наклона рассматриваемой линии (Шаг 1)


cyiu8k_5ivu1_hpw3bprtzglkw4.png

Рис. 8 Гистограмма распределения максимального количества равноудаленных точек в зависимости от угла наклона рассматриваемой линии (Шаг 2)


4. Построение линейной аппроксимации

Полученный из гистограммы угол наклона линии является неточным, так как он был получен на фиксированной сетке углов. Для получения более точного угла наклона и смещения интересующей линии, необходимо выполнить линейную аппроксимацию полученного набора точек по следующим формулам (см. Рис. 9 и Рис. 10):

$$display$$k= (N∑_1^N (xy)- ∑_1^Nx ∑_1^Ny)/(N∑_1^Nx^2 — (∑_1^Nx)^2); b =(∑_1^Ny-k∑_1^Nx)/N$$display$$


hb7_y_fp3wm7gihobe9upbqicee.png

Рис. 9 Результат аппроксимации первой линии


uv_z6lgxjurqojmwtp6tlvs-1u8.png

Рис. 10 Результат аппроксимации второй линии


Примеры использования

Приведем примеры распознавания линий на произвольных наборах точек (см. Рис 11–13).


estyzhz4h2i3ns3zfxfcrfo2m3u.png

Рис. 11 Результат работы на произвольной выборке точек


cf_skoxklium68cgderlxck_uke.png

Рис. 12 Результат работы на произвольной выборке точек


liwxnw7z3z-2mgiypyxc08onx_m.png

Рис. 13 Результат работы на произвольной выборке точек


Вывод

С помощью приведенного алгоритма можно детектировать прямые линии с относительно высокой скоростью и определять их параметры (наклон и смещение). Количество линий при этом может быть неограниченное количество.

Для успешного детектирования линий, желательно чтобы точки были максимально сильно разбросаны по координатной системе, так как если все точки будут рядом, то при процедуре перехода детектирования от одной линии к другой, точки новой линии будут отброшены ввиду их близости к линии с предыдущей итерации.

Основная цель данной статьи увидеть взгляд со стороны, встречались ли у кого-либо подобные задачи и как вы их решали. Вдруг есть способы, которые в один проход умеют детектировать эти линии. Увидеть какие-нибудь интересные решения, которые можно будет использовать в других задачах.

© Habrahabr.ru