1) Перевод этой статьи см. стр. 289-304.
2) Это $r$, которое равно $\sqrt{p^{2}+q^{2}}$, разумеется, не следует смешивать с прежним $r$, играющим роль угловой координаты.
3) Чтобы доказать строго неравенство
\[
r_{n}^{2} \leqslant \bar{r}_{n}^{2} \quad(n=0,1, \ldots, k),
\]
где $\bar{r}_{n}$ – решение дифференциального уравнения
\[
\frac{d \bar{r}_{n}^{2}}{d n}=L \bar{r}_{n}^{2 \mu+2},
\]
определенное при $0 \leqslant n \leqslant k$ и удовлетворяющее начальному условию
\[
\bar{r}_{0}^{2}=r_{0}^{2},
\]
можно рассуждать следующим образом.
Прежде всего, из уравнения (2) легко усматривается, что $\bar{r}_{n}^{2}>0$ при всяком $n$, принадлежащем промежутку $0 \leqslant n \leqslant k$.
Отсюда в силу уравнения (2) следует, что $\bar{r}_{n}^{2}$ есть возрастающая функция $n$. Принимая это во внимание, получаем, далее, из того же уравнения:
\[
\bar{r}_{j+1}^{2}-\bar{r}_{j}^{2}=L \int_{j}^{j+1} \bar{r}_{x}^{2 \mu+2} d x>L \bar{r}_{j}^{2 \mu+2} .
\]
Допустим теперь, что неравенство (1) доказано при $n=j \leqslant k-1$ и докажем его при $n=j+1$.
Согласно доказанному в тексте имеем:
\[
r_{j+1}^{2}-r_{j}^{2} \leqslant L r_{j}^{2 \mu+2},
\]
откуда в силу индуктивного предположения и неравенства (3)
\[
r_{j+1}^{2}-r_{j}^{2}<\bar{r}_{j+1}^{2}-\bar{r}_{j}^{2} .
\]
Еще раз применяя индуктивное предположение, заключаем отсюда, что
\[
r_{j+1}^{2}<\bar{r}_{j+1}^{2} .
\]
А так как неравенство (1) соблюдается при $n=0$, то этим оно доказано при всяком интересующем нас $n$.
4) В самом деле, левая часть равенства
\[
\frac{q_{1} p_{0}-p_{1} q_{0}}{p_{1} p_{0}+q_{1} q_{0}}=\frac{r_{0}^{2} \sin \left(\sigma+s r_{0}^{2}\right)+p_{0} Q-q_{0} P}{r_{0}^{2} \cos \left(\sigma+s r_{0}^{2}\right)+q_{0} Q+p_{0} P}
\]
есть не что иное, каю $\operatorname{tg}\left(\vartheta_{1}-\vartheta_{0}\right)$. В силу этого равенства отсюда следует, чTо
\[
\begin{array}{l}
\operatorname{tg}\left(\vartheta_{1}-\vartheta_{0}-\sigma-s r_{0}^{2}\right)=\frac{\operatorname{tg}\left(\vartheta_{1}-\vartheta_{0}\right)-\operatorname{tg}\left(\sigma+r_{0}^{2}\right)}{1+\operatorname{tg}\left(\vartheta_{1}-\vartheta_{0}\right) \operatorname{tg}\left(\sigma+r_{0}^{2}\right)}= \\
=\frac{\left(p_{0} Q-q_{0} P\right) \cos \left(\sigma+s r_{0}^{2}\right)-\left(q_{0} Q+p_{0} P\right) \sin \left(\sigma+s r_{0}^{2}\right)}{r_{0}^{2}+\left(p_{0} Q-q_{0} P\right) \sin \left(\sigma+s r_{0}^{2}\right)+\left(q_{0} Q+p_{0} P\right) \cos \left(\sigma+s r_{0}^{2}\right)} .
\end{array}
\]
Полагая здесь $p_{0}=r_{0} \cos \vartheta_{0}, q_{0}=r_{0} \sin \vartheta_{0}$, усматриваем, что числитель и знаменатель представляются степенными рядами в $r_{0}$ с коэффициентами – тригонометрическими полиномами относительно $\vartheta_{0}$. При этом ряд для числителя начинается с члена порядка не ниже $2 \mu+2$, ряд для знаменателя – с $r_{0}^{2}$. Следовательно, тангенс величины, обозначенной в тексте через $\vartheta$, представляется аналогичным степенным рядом, начинающимся с члена порядка не ниже $2 \mu$. То же справедливо поэтому и относительно самой этой величины.
5) Точнее говоря, величина $r_{0}>0$ и натуральное число $n$ могут быть выбраны так, чтобы соблюдалось неравенство $n \leqslant N \bar{r}_{0}^{-2 \mu}$ и величина $\vartheta_{n}-\vartheta_{0}-n \sigma$ была сколь угодно большой.
6) Это отнюдь не очевидно. В самом деле, если в решении разностного уравнения
\[
\Delta^{2} v_{n}=-B \rho_{0}^{\mu-1}\left(\Delta v_{n}+v_{n}\right),
\]
удовлетворяющем начальным условиям
\[
v_{0}=0, \Delta v_{0}=s+\varepsilon_{3}^{0},
\]
$v_{n}$ и $\Delta v_{n}$ не больше соответствующих $v_{n}$ и $\Delta v_{n}$ в рассматриваемом решении разностного уравнении (9) (см. текст) при некотором значении $n$, то оценки (10) отнюдь не гарантируют того, что и при непосредственно следующем значении $n$ это будет иметь место. Поэтому все последующее рассуждение непригодно для доказательства леммы. Эту ошибку, к счастью, легко исправить.
Рассмотрим уравнение (9), где $\varepsilon_{5}$ и $\varepsilon_{6}$ могут быть произвольными функциями $n$, удовлетворяющими неравенствам (10). Из вида этого уравнения непосредственно следует, что в его решении, удовлетворяющем начальным условиям (11), $v_{n}$ и $\Delta v_{n}$ могут быть представлены как зависящие от $n$ полиномы в $s+\varepsilon_{3}^{0}, \varepsilon_{5}(0), \ldots, \varepsilon_{5}(n-1), \varepsilon_{6}(0), \ldots, \varepsilon_{6}(n-1)$ с положительными коэффициентами. Эти полиномы могут только возрасти, если мы заменим $\varepsilon_{5}(k)$ и $\varepsilon_{6}(k)$ их максимальным допустимым значением $B \rho_{0}^{\mu-1}$. Но тогда мы получим решение разностного уравнения
\[
\Delta^{2} V_{n}=B \rho_{0}^{\mu-1}\left(\Delta V_{n}+V_{n}\right),
\]
удовлетворяющее тем же начальным условиям. Таким образом, для интересующего нас решения уравнения (9) имеем:
\[
v_{n} \leqslant V_{n} \quad\left(n \leqslant N \rho_{0}^{-\mu}\right) .
\]
А так как при $v_{n} \geqslant 0$ и $\Delta v_{n} \geqslant 0$ имеем
\[
\Delta^{2} v_{n} \geqslant-B \rho_{0}^{\mu-1}\left(\Delta v_{n}+v_{n}\right)=-B \rho_{0}^{\mu-1} v_{n+1},
\]
то при тех же условиях
\[
\Delta^{2} v_{n} \geqslant-B \rho_{0}^{\mu-1} V_{n+1} \quad\left(n+1 \leqslant N \rho_{0}^{-\mu}\right),
\]
откуда в силу начальных условий:
\[
\Delta v_{n} \geqslant s+\varepsilon_{3}^{0}-B \rho_{0}^{\mu-1} \sum_{k=1}^{n} V_{k} \quad\left(n \leqslant N \rho_{0}^{-\mu}\right),
\]
если только $\Delta v_{k} \geqslant 0$ при $k<n$.
С другой стороны, разностное уравнение для $V_{n}$ и начальные условия дают
\[
V_{n}=\left(s+\varepsilon_{3}^{0}\right) \frac{e^{\beta_{1} n}-e^{\beta_{2} n}}{e^{\beta_{1}}-e^{\beta_{2}}},
\]
где
\[
\beta_{i}=\log \left(1+\frac{1}{2} B \rho_{0}^{\mu-1} \pm \sqrt{B \rho_{0}^{\mu-1}+\frac{1}{4} B^{2} \rho_{0}^{2 \mu-2}}\right),
\]
причем для определенности мы будем считать, что знак «十» относится к $\beta_{1}$, а знак «-» к $\beta_{2}$. Подставляя это выражение в неравенство для $\Delta v_{n}$, получаем:
\[
\Delta v_{n} \geqslant\left(s+\varepsilon_{3}^{0}\right)\left[1-\frac{B \rho_{0}^{\mu-1}}{e^{\beta_{1}}-e^{\beta_{2}}}\left(\frac{e^{\beta_{1}(n+1)}-e^{\beta_{1}}}{e^{\beta_{1}}-1}-\frac{e^{\beta_{2}(n+1)}-e^{\beta_{2}}}{e^{\beta_{2}}-1}\right)\right]\left(n \leqslant N \rho_{0}^{-\mu}\right),
\]
при условии, что $\Delta v_{k} \geqslant 0(0<k<n)$.
Но из выражений для $\beta$ нетрудно усмотреть, что
\[
\frac{B \rho_{0}^{\mu-1}}{\left(e^{\beta_{1}}-e^{\beta_{2}}\right)\left(e^{\beta_{1}}-1\right)}<\frac{1}{2} .
\]
Так как, кроме того,
\[
\frac{B \rho_{0}^{\mu}\left(e^{\beta_{2}(n+1)}-e^{\beta_{2}}\right)}{\left(e^{\beta_{1}}-e^{\beta_{2}}\right)\left(e^{\beta_{1}}-1\right)}>0,
\]
то последнее неравенство для $\Delta v_{n}$ дает
\[
\Delta v_{n} \geqslant\left(s+\varepsilon_{s}^{0}\right)\left(1-\frac{1}{2}\left(e^{\beta_{1} n}-1\right)\right) \quad\left(n \leqslant N \rho_{0}^{-\mu}\right),
\]
если только $\Delta v_{k} \geqslant 0$ при $0<k<n$.
Далее при достаточно малых $\rho_{0}$ имеем, очевидно,
\[
\beta_{1}<2 B^{\frac{1}{2}} \rho_{0}^{\frac{\mu-1}{2}} .
\]
Следовательно, при достаточно малом $\rho_{0}$
\[
\Delta v_{n} \geqslant 0,
\]
коль скоро
\[
n \leqslant \min \left[N^{*} \rho_{0}^{-\frac{\mu-1}{2}}, N \rho_{0}^{-\mu}\right],
\]
где
\[
N^{*}=\frac{1}{2} \log 3 B^{-\frac{1}{2}} .
\]
Наконец, при достаточно малом $\rho_{0}$ последнее неравенство для $n$ может быть заменено простым условием
\[
n \leqslant N^{*} \rho^{-\frac{\mu-1}{2}} .
\]
При этом условии $\Delta v_{n}$ и $v_{n}$ остаются положительными, если только $\rho_{0}$ достаточно мало. Это и есть результат, к которому стремится Биркгоф (см. конец доказательства).
7) См. предыдущее примечание.
8) Это утверждение справедливо для прямоугольника $0 \leqslant x \leqslant 2 \pi$, $a^{2} \leqslant y^{2} \leqslant b^{2}$, так как расстояние точки от ее образа есть непрерывная функция точки. Но, так как точки с абсциссами, различающимися на $2 \pi$, передвигаются одинаковым образом, то это утверждение справедливо для всей полоски $a^{2} \leqslant y \leqslant b^{2}$. – Прим. перев.
9) Это утверждение справедливо при всяком, достаточно малом $\varepsilon$, так как не только точки прямой $y=b^{2}$, но и все точки полоски $a^{2} \leqslant$ $\leqslant y \leqslant b^{2}$, достаточно близкие к этой прямой, передвигаются влево при преобразовании T. – Прим. перев.
10) Докажем это важное утверждение.
Прежде всего введем на дуге $P P^{(k-1)}$ вещественный параметр $t$ следующим образом. При $0 \leqslant t \leqslant \frac{1}{k-1}$ обозначим через $L_{t}$ точку прямолинейного отрезка $P P^{(1)}$ с ординатой $(k-1) \varepsilon t$. При $\frac{s}{k-1} \leqslant t \leqslant \frac{s+1}{k-1}$, где $s=1, \ldots, k-1$, положим
\[
L_{t}=\left(T T_{s}\right)^{s} L_{t-\frac{s}{k-1}} .
\]
Этим $L_{t}$ определено однозначно при $0 \leqslant t \leqslant 1+\frac{1}{k-1}$. Когда $t$ пробегает этот последний отрезок числовой прямой, точка $L_{t}$ описывает дугу $P Q$, причем согласно определению
\[
\left(T T_{s}\right) L_{t}=L_{t+\frac{1}{k-1}} .
\]
Нас интересует угол между вектором $L_{t} L_{t+\frac{1}{k-1}}$ и осью абсцисс. Этот угол имеет смысл при всяком $t$, принадлежащем отрезку $0 \leqslant t \leqslant 1$, так как $L_{t}
eq L_{t+\frac{1}{k-1}}$. Величина этого угла определена, однако, лишь с точностью до слагаемого вида $2 n \pi$, где $n$ – целое число. Чтобы устранить эту неопределенность, потребуем, чтобы эта величина непрерывно зависела от $t$ и чтобы при $t=0$ она лежала между 0 и $\frac{\pi}{2}$. Так, определенную величину угла обозначим через $\varphi(t)$. Требуется доказать, что
\[
0<\varphi(1)-\varphi(0)<\pi \text {. }
\]
С этой целью будем рассматривать угол между вектором $L_{t} L$ $t^{\prime}+\frac{1}{k-1}$ осью абсцисс как функцию двух переменных $t$ и $t^{\prime}$, которые мы подчиним условиям $0 \leqslant t \leqslant t^{\prime} \leqslant 1$. Так как дуга $P P^{(k-1)}$ не имеет кратных точек, то $L_{t}
eq L_{t^{\prime}+\frac{1}{k-1}}$, и потому угол этот всегда имеет смысл. Налагая на величину этого угла условие непрерывности и подчиняя ее требованию лежать между 0 и $\frac{\pi}{2}$ при $t=t^{\prime}=0$, получаем непрерывную функцию $\varphi\left(t, t^{\prime}\right)$ двух аргументов, причем, очевидно,
\[
\varphi\left(t, t^{\prime}\right)=\varphi(t) \text {. }
\]
Так как точка $L_{0}=P$ лежит на прямой $y=a^{2}$, а точка $L$
\[
t^{\prime}+\frac{1}{k-1}
\]
всегда расположена выше этой прямой, то $2 n \pi<\varphi\left(0, t^{\prime}\right)<(2 n+1) \pi$. В силу непрерывности функции $\varphi\left(0, t^{\prime}\right)$ следует, что
\[
0<\varphi(0, t)<\pi \quad(0 \leqslant t \leqslant 1) .
\]
Так как точка $L_{1+\frac{1}{k-1}}=Q$ лежит выше прямой $y=b^{2}$, а точка $L_{t}$ всегда расположена не выше этой прямой, то $2 n \pi<\varphi(t, 1)<(2 n+1) \pi$. В силу непрерывности функции $\varphi(t, 1)$ и неравенств (3) следует, что
\[
0<\varphi(t, 1)<\pi \quad(0 \leqslant t \leqslant 1) .
\]
Принимая во внимание, что согласно доказанному в тексте
\[
\left(2 n+\frac{1}{2}\right) \pi<\varphi(1,1)<(2 n+1) \pi,
\]
заключаем из неравенства (4), что
\[
\frac{\pi}{2}<\varphi(1,1)<\pi,
\]
откуда согласно равенству (2) вытекают доказываемые неравенства (1). – Прим. перев.
11) В действительности малость $\varepsilon$ не играет здесь никакой роли, так как при этом дополнительном движении вектора он, очевидно, не может выйти из второго квадранта, как бы велико ни было $\varepsilon$. Малость $\varepsilon$ существенна лишь для того, чтобы вектор $P^{(k-1)} Q$ лежал во втором квадранте (см. примечание 10).
12) То есть это изменение лежит между 0 и $2 \pi$.
13) При этом мы пользуемся тем, что при $\varepsilon \rightarrow 0$ направление вектора $L L^{\prime}$ стемится к некоторому предельному направлению, так как преобразование $T$ также не имеет инвариантных точек.
14) Преобразование $T$ называется инволюторным, если оно совпадает со своим обратным преобразованием, т. е. если $T^{2}$ есть тождественное преобразование.
15) Этот угол, а также аналогичные углы $\varphi^{*}$ и $\varphi_{1}^{*}$ считаются всегда положительными. Однако при определении преобразования $T$ (см. ниже) считается, что геодезическая линия $f$ пересекает геодезическую линию $g$ в одном направлении, например, справа налево, тогда как при определении преобразования $T^{*}$ рассматривается случай пересечения в обратном направлении – слева направо.
16) Под «прямыми преобразованиями» Биркгоф понимает преобразования, сохраняющие ориентацию.
17) При этом подразумевается, что спираль идет вдоль $g$ в положительном направлении.
18) Имеется в виду алгебраическая длина этой дуги. Подразумевается, что спираль идет вдоль $g$ в отрицательном направлении.
19) В действительности из приведенного в тексте рассуждения следует лишь, что произведение $T T^{*}$ передвигает в противоположных направлениях точки границ кольца $R$.
20) $T=T^{*}$, благодаря симметрии поверхности. – Прим. перев.