Принцип наименьшего действия. Часть 220.10.2018 08:49

В прошлый раз мы кратко рассмотрели один из самых замечательных физических принципов — принцип наименьшего действия, и остановились на примере, который, казалось бы, ему противоречит. В данной статье мы разберемся с этим принципом немного подробнее и посмотрим, что происходит в данном примере.
На этот раз нам понадобится чуть больше математики. Однако основную часть статьи я опять постараюсь изложить на элементарном уровне. Чуть более строгие и сложные моменты я буду выделять цветом, их можно пропустить без ущерба для основного понимания статьи.

Граничные условия
Начнем мы с самого простого объекта — шара, свободно двигающегося в пространстве, на который не действуют никакие силы. Такой шар, как известно, двигается равномерно и прямолинейно. Для простоты, предположим, что он двигается вдоль оси $x$ :

Чтобы точно описать его движение, как правило, задаются начальные условия. Например задается, что в начальный момент времени $t_A$ шар находился в точке $A$ с координатой $x_A$ и имел скорость $v_A$ . Задав начальные условия в таком виде, мы однозначно определяем дальнейшее движение шара — он будет двигаться с постоянной скоростью, и его положение в момент времени $t$ будет равно начальному положению плюс скорость, умноженная на прошедшее время: $x(t) = x_A + v_A \cdot (t-t_A)$ . Такой способ задания начальных условий очень естественен и интуитивно привычен. Мы задали всю необходимую информацию о движении шара в начальный момент времени, и дальше его движение определяется законами Ньютона.

Однако это не единственный способ задания движения шара. Другой альтернативный способ — это задать положение шара в два разных момента времени $t_A$ и $t_B$ . Т.е. задать, что:
1) в момент времени $t_A$ шар находился в точке $A$ (с координатой $x_A$ );
2) в момент времени $t_B$ шар находился в точке $B$ (с координатой $x_B$ ).

Выражение «находился в точке $A$ » не означает, что шар покоился в точке $A$ . В момент времени $t_A$ он мог пролетать через точку $A$ . Имеется ввиду, что его положение в момент времени $t_A$ совпадало с точкой $A$ . То же самое относится и к точке $B$ .

Эти два условия также однозначно определяют движение шара. Его движение легко вычислить. Чтобы удовлетворить обоим условиям, скорость шара, очевидно должна быть $(x_B-x_A)/(t_B-t_A)$ . Положение шара в момент времени $t$ будет опять равно начальному положению плюс скорость, умноженная на прошедшее время:

$x(t) = x_A + ((x_B-x_A)/(t_B-t_A)) \cdot (t-t_A)$

Заметьте, что в условиях задачи нам не потребовалось задавать начальную скорость. Она однозначно определилась из условий 1) и 2).

Задание условий вторым способом выглядит непривычно. Возможно, непонятно зачем вообще может потребоваться задавать их в таком виде. Однако, в принципе наименьшего действия используются именно условия в виде 1) и 2), а не в виде задания начального положения и начальной скорости.

Траектория с наименьшим действием.
Теперь немного отвлечемся от реального свободного движения шара и рассмотрим следующую чисто математическую задачу. Допустим, у нас есть шар, который мы можем вручную перемещать каким угодно способом. При этом нам нужно выполнить условия 1) и 2). Т.е. в промежуток времени между $t_A$ и $t_B$ мы должны переместить его из точки $A$ в точку $B$ . Это можно сделать совершенно разными способами. Каждый такой способ мы будем называть траекторией движения шара и он может быть описан функцией положения шара от времени $x(t)$ . Отложим несколько таких траектории на графике зависимости положения шарика от времени:

Например, мы можем перемещать шарик с одной и той же скоростью, равной $(x_B-x_A)/(t_B-t_A)$ (зеленая траектория). Или мы можем половину времени держать его в точке $A$ , а затем с двойной скоростью переместить в точку $B$ (синяя траектория). Можно сперва двигать его в противоположную от $B$ сторону, а затем уже переместить в $B$ (коричневая траектория). Можно двигать его взад и вперед (красная траектория). В общем, можно передвигать его как угодно, лишь бы соблюдались условия 1) и 2).

Для каждой такой траектории мы можем сопоставить число. В нашем примере, т.е. в отсутствии каких-либо сил, действующих на шар, это число равняется общей накопленной кинетической энергии за все время его движения в промежуток времени между $t_A$ и $t_B$ и называется действием.

В данном случае слово «накопленная» кинетическая энергия не очень точно передает смысл. Реально кинетическая энергия нигде не накапливается, накопление используется лишь для вычисления действия для траектории. В математике для такого накопления имеется очень хорошее понятие — интеграл:

$S = \int\limits_{t_A}^{t_B} Tdt$
Действие обычно обозначается буквой . Символ означает кинетическую энергию. Данный интеграл означает, что действие равно накопленной кинетической энергии шара за промежуток времени от до .

В качестве примера, давайте возьмем шар массой 1 кг., зададим какие-нибудь граничные условия и вычислим действие для двух разных траекторий. Пусть точка $B$ находится на расстоянии 1 метр от точки $A$ , а время $t_B$ отстоит от времени $t_A$ на 1 секунду. Т.е. мы должны переместить шар, который в начальный момент времени был в точке $A$ , за одну секунду на расстояние 1 м. вдоль оси $x$ .

В первом примере (зеленая траектория) мы перемещали шар равномерно, т.е. с одинаковой скоростью, которая, очевидно, должна быть равна: $v=1$ м/с. Кинетическая энергия шара в каждый момент времени равна: $Т = mv^2/2$ = ½ Дж. За одну секунду накопится ½ Дж $\cdot$ с кинетической энергии. Т.е. действе для такой траектории равно: $S = 1/2$ Дж $\cdot$ с.

Теперь давайте шар будем не сразу переносить из точки $A$ в точку $В$ , а полсекунды придержим его в точке $A$ , а затем, за оставшееся время равномерно перенесем его в точку $B$ . В первые полсекунды шар покоится и его кинетическая энергия равна нулю. Поэтому вклад в действие этой части траектории также равен нулю. Вторые полсекунды мы переносим шар с двойной скоростью: $v=2$ м/с. Кинетическая энергия при этом будет равна $Т = mv^2/2$ = 2 Дж. Вклад этого промежутка времени в действие будет равен 2 Дж умножить на полсекунды, т.е. 1 Дж $\cdot$ с. Поэтому общее действие для такой траектории получается равно $S = 1$ Дж $\cdot$ с.

Аналогично, любой другой траектории с заданными нами краевыми условиями 1) и 2) соответствует некоторое число, равное действию для данной траектории. Среди всех таких траекторий имеется траектория, у которой действие меньше всего. Можно доказать, что этой траекторией является зеленая траектория, т.е. равномерное движение шара. Для любой другой траектории, какой бы хитрой она не была, действие будет больше ½.

В математике такое сопоставление для каждой функции определенного числа называется функционалом. Достаточно часто в физике и математике возникают задачи подобные нашей, т.е. на отыскание такой функции, для которой значение определенного функционала минимально. Например, одна из задач, имевших большое историческое значение для развития математики — это задача о бахистохроне. Т.е. нахождение такой кривой, по которой шарик скатывается быстрее всего. Опять, каждую кривую можно представить функцией h (x), и каждой функции сопоставить число, в данном случае время скатывания шарика. Снова задача сводится к нахождению такой функции, для которой значение функционала минимально. Область математики, которая занимается такими задачами называется вариационным исчислением.

Принцип наименьшего действия.
В разобранных выше примерах у нас появились две особые траектории, полученные двумя разными способами.

Первая траектория получена из законов физики и соответствует реальной траектории свободного шара, на который не действуют никакие силы и для которого заданы граничные условия в виде 1) и 2).

Вторая траектория получена из математической задачи нахождения траектории с заданными граничными условиями 1) и 2), для которой действие минимально.

Принцип наименьшего действия утверждает, что эти две траектории должны совпадать. Другими словами, если известно, что шарик двигался так, что выполнялись граничные условия 1) и 2), то он обязательно двигался по траектории, для которой действие минимально по сравнению с любой другой траекторией с теми же самыми граничными условиями.

Можно было бы посчитать это простым совпадением. Мало ли задач, в которых появляются равномерные траектории и прямые линии. Однако принцип наименьшего действия оказывается очень общим принципом, справедливым и в других ситуациях, например, для движения шара в равномерном поле тяжести. Для этого только нужно заменить кинетическую энергию на разность кинетической и потенциальной энергии. Эту разность называют Лагранжианом или функцией Лагранжа и действие теперь становится равно общему накопленному Лагранжиану. Фактически, функция Лагранжа содержит всю необходимую информацию о динамических свойствах системы.

Если мы запустим шар в равномерном поле тяжести таким образом, чтобы он пролетел точку $A$ в момент времени $t_A$ и прилетел в точку $B$ в момент времени $t_B$ , то он, согласно законам Ньютона полетит по параболе. Именно эта парабола совпадет с траекторий, для которой действие будет минимально.

Таким образом, для тела, двигающегося в потенциальном поле, например, в гравитационном поле Земли, функция Лагранжа равна: . Кинетическая энергия зависит от скорости тела, а потенциальная — от его положения, т.е. координат . В аналитической механике всю совокупность координат, определяющих положение системы, обычно обозначают одной буквой . Для шара, свободно двигающегося в поле тяжести, означает координаты , и .
Для обозначения скорости изменения какой-либо величины, в физике очень часто просто ставят точку над этой величиной. Например, $\dot x$ обозначает скорость изменения координаты , или, иными словами, скорость тела в направлении . Используя эти соглашения, скорость нашего шара в аналитической механике обозначается как $\dot q$ . Т.е. $\dot q$ означает компоненты скорости .
Поскольку функция Лагранжа зависит скорости и координат, а также может явно зависеть от времени (явно зависит от времени означает, что значение в разные моменты времени разное, при одинаковых скоростях и положениях шара) то действие в общем виде записывается как

$S = \int\limits_{t_A}^{t_B} L(\dot q,q,t)dt$

Не всегда минимальное
Однако в конце предыдущей части мы рассмотрели пример, когда принцип наименьшего действия явно не работает. Для этого мы опять взяли свободный шарик, на который не действуют никакие силы и поместили рядом с ним пружинящую стенку.

Граничные условия мы задали такими, что точки $A$ и $B$ совпадают. Т.е. и в момент времени $t_A$ и в момент времени $t_B$ шар должен оказаться в одной и той же точке $A$ . Одной из возможных траекторий будет являться стояние шара на месте. Т.е. весь промежуток времени между $t_A$ и $t_B$ он простоит в точке $A$ . Кинетическая и потенциальная энергия в этом случае будут равны нулю, поэтому действие для такой траектории также будет равно нулю.

Строго говоря, потенциальную энергию можно взять равной не нулю, а любому числу, поскольку важна разность потенциальной энергии в разных точках пространства. Однако изменение значения потенциальной энергии не влияет на отыскание траектории с минимальным действием. Просто для всех траекторий значение действия изменится на одно и то же число, и траектория с минимальным действием так и останется траекторией с минимальным действием. Для удобства, для нашего шара мы выберем потенциальную энергию равной нулю.

Другой возможной физической траекторией с теми же граничными условиями будет траектория при которой шарик сначала летит вправо, пролетая точку $A$ в момент времени $t_A$ . Затем он сталкивается с пружиной, сжимает ее, пружина, распрямляясь, отталкивает шарик обратно, и он опять пролетает мимо точки $A$ . Можно подобрать скорость движения шара такой, чтобы он, отскочив от стенки, пролетел точку $A$ точно в момент $t_B$ . Действие при такой траектории будет в основном равно накопленной кинетической энергии во время полета между точкой $A$ и стенкой и обратно. Будет какой-то промежуток времени, когда шарик сожмет пружину и его потенциальная энергия увеличится, и в этот промежуток времени потенциальная энергия внесет отрицательный вклад в действие. Но такой промежуток времени будет не очень большим и сильно действие не уменьшит.

На рисунке нарисованы обе физически возможные траектории движения шара. Зеленая траектория соответствует покоящемуся шару, в то время как синяя соответствует шару, отскочившему от пружинящей стенки.

Однако минимальным действием обладает только одна из них, а именно первая! У второй траектории действие больше. Получается, что в данной задаче имеются две физически возможных траектории и всего одна с минимальным действием. Т.е. в данном случае принцип наименьшего действия не работает.

Стационарные точки.
Чтобы понять в чем тут дело, давайте отвлечемся пока от принципа наименьшего действия и займемся обычными функциями. Давайте возьмем какую-нибудь функцию $y(х)$ и нарисуем ее график:

На графике я отметил зеленым цветом четыре особенных точки. Что является общим для этих точек? Представим, что график функции — это реальная горка, по которой может катиться шарик. Четыре обозначенных точки особенны тем, что если установить шарик точно в данную точку, то он никуда не укатится. Во всех остальных точках, например, точке E он не сможет устоять на месте и начнет скатываться вниз. Такие точки называют стационарными. Нахождение таких точек является полезной задачей, поскольку любой максимум или минимум функции, если она не имеет резких изломов, обязательно должен являться стационарной точкой.

Если точнее классифицировать данные точки, то точка A является абсолютным минимумом функции, т.е. ее значение меньше, чем любое другое значение функции. Точка B — не является ни максимумом, ни минимумом и называется седловой точкой. Точка С называется локальным максимумом, т.е. значение в ней больше, чем в соседних точках функции. А точка D — локальным минимумом, т.е. значение в ней меньше, чем в соседних точках функции.

Поиском таких точек занимается раздел математики, называемый математическим анализом. По другому его еще иногда называют анализом бесконечно малых, поскольку он умеет работать с бесконечно малыми величинами. С точки зрения математического анализа стационарные точки обладают одним особенным свойством, благодаря которому их и находят. Чтобы понять, что это за свойство, нам нужно понять, как выглядит функция на очень малых расстояниях от этих точек. Для этого мы возьмем микроскоп и посмотрим в него на наши точки. На рисунке показано как выглядит функция в окрестности различных точек при различном увеличении.

Видно, что при очень большом увеличении (т.е. при очень малых отклонениях x) стационарные точки выглядят абсолютно одинаково и сильно отличаются от нестационарной точки. Легко понять в чем заключается это отличие — график функции в стационарной точке при увеличении становится строго горизонтальной линией, а в нестационарной — наклонной. Именно поэтому шарик, установленный в стационарной точке, не будет скатываться.

Горизонтальность функции в стационарной точке можно выразить по другому: функция в стационарной точке практически не меняется при очень малом изменении своего аргумента $x$ , даже по сравнению с самим изменением аргумента. Функция же в нестационарной точке при малом изменении $x$ меняется пропорционально изменению $x$ . И чем больше угол наклона функции, тем сильнее меняется функция при изменении $x$ . На самом деле, функция при увеличении становится все больше похожа на касательную к графику в рассматриваемой точке.

На строгом математическом языке выражение «функция практически не меняется в точке при очень малом изменении » означает, что отношение изменения функции и изменения ее аргумента стремится к 0 при стремящемся к 0:

$$display$$\lim_{∆x \to 0} \frac {∆y (x_0)}{∆x} = \lim_{x \to 0} \frac {y (x_0+∆x)-y (x_0)}{∆x} = 0$$display$$

Для нестационарной точки это отношение стремится к ненулевому числу, которое равно тангенсу угла наклона функции в этой точке. Это же число называют производной функции в данной точке. Производная функции показывает, насколько быстро меняется функция около данной точки при небольшом изменении ее аргумента . Таким образом, стационарные точки — это точки, в которых производная функции равна 0.

Стационарные траектории.
По аналогии со стационарными точками можно ввести понятие стационарных траекторий. Вспомним, что у нас каждой траектории соответствует определенное значение действия, т.е. какое-то число. Тогда может найтись такая траектория, что для близких к ней траекторий с теми же граничными условиями, соответствующие им значения действия практически не будут отличаться от действия для самой стационарной траектории. Такая траектория называется стационарной. Другими словами, любая траектория близкая к стационарной будет иметь значение действия, очень мало отличающееся от действия для этой стационарной траектории.

Опять, на математическом языке «мало отличающееся» имеет следующий точный смысл. Допустим, что у нас задан функционал для функций с требуемыми граничными условиями 1) и 2), т.е. и . Допустим, что траектория — стационарна.
Мы можем взять любую другую функцию , такую, что на концах она принимает нулевые значения, т.е. = = 0. Также возьмем переменную , которую мы будем делать все меньше и меньше. Из этих двух функций и переменной мы можем составить третью функцию , которая также будет удовлетворять граничным условиям и . При уменьшении траектория, соответствующая функции , будет все сильнее приближаться к траектории .
При этом для стационарных траекторий при малых значение функционала у траекторий будет отличаться очень мало от значения функционала для даже по сравнению с . Т.е.

$$display$$\lim_{ε \to 0} \frac {S (x'(t))-S (x (t))}ε=\lim_{ε \to 0} \frac {S (x (t)+εg (t))-S (x (t))}ε = 0$$display$$

При чем это должно быть справедливо для любой траектории , удовлетворяющей граничным условиям = = 0.
Изменение функционала при малом изменении функции (точнее, линейная часть изменения функционала, пропорциональная изменению функции) называется вариацией функционала и обозначается . От термина «вариация» и происходит название «вариационное исчисление».
Для стационарных траекторий вариация функционала .
Метод нахождения стационарных функций (не только для принципа наименьшего действия, но и для многих других задач) нашли два математика — Эйлер и Лагранж. Оказывается, что стационарная функция, чей функционал выражается интегралом, подобным интегралу действия, должна удовлетворять определенному уравнению, которое теперь называется уравнением Эйлера-Лагранжа.

Принцип стационарного действия.
Ситуация с минимумом действия для траекторий аналогична ситуации с минимумом для функций. Чтобы траектория обладала наименьшим действием, она обязана быть стационарной траекторией. Однако не все стационарные траектории — это траектории с минимальным действием. Например, стационарная траектория может иметь минимальное действие локально. Т.е. у нее действие будет меньше, чем у любой другой соседней траектории. Однако где-то далеко могут находиться другие траектории, для которых действие будет еще меньше.

Оказывается, реальные тела могут двигаться не обязательно по траекториям с наименьшим действием. Они могут двигаться по более широкому набору особых траекторий, а именно -стационарным траекториям. Т.е. реальная траектория тела всегда будет стационарной. Поэтому принцип наименьшего действия правильнее назвать принципом стационарного действия. Однако по сложившейся традиции его часто называют принципом наименьшего действия, подразумевая по этим не только минимальность, но и стационарность траекторий.

Теперь мы можем записать принцип стационарного действия на математическом языке, как его обычно записывают в учебниках:

$δS=δ\int\limits_{t_A}^{t_B} L(\dot q,q,t)dt = 0$
.
Здесь — это обобщенные координаты, т.е. набор переменных, однозначно задающих положение системы.
$\dot q$ — скорости изменения обобщенных координат.
$L(\dot q,q,t)$ — функция Лагранжа, которая зависит от обобщенных координат, их скоростей и, возможно, времени.
— действие, которое зависит от конкретной траектории движения системы (т.е. от ).
Реальные траектории системы стационарны, т.е. для них вариация действия .

Если вернуться к примеру с шаром и упругой стенкой, то объяснение этой ситуации теперь становится очень простым. При заданных граничных условиях, что шар должен и во время $t_A$ и во время $t_B$ оказаться в точке $A$ существуют две стационарные траектории. И по любой из этих траекторий может реально двигаться шар. Чтобы явно выбрать одну из траекторий, можно на движение шара наложить дополнительное условие. Например, сказать, что шар должен отскочить от стенки. Тогда траектория определится однозначно.

Из принципа наименьшего (точнее стационарного) действия следуют некоторые замечательные следствия, о которых мы поговорим в следующей части.