Главная > ОБЩИЙ КУРС ФИЗИКИ. T.IV ОПТИКА (Д.В.Сивухин)
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

1. Обобщим результаты предыдущего параграфа на случай произвольных оптических систем. Среды, в которых распространяются световые лучи, здесь предполагаются изотропными, но могут быть неоднородными. Таким образом, в общем случае световые лучи будут криволинейными. Пусть $P$ и $P^{\prime}$ – две точки с радиусами-векторами $r$ и $\boldsymbol{r}^{\prime}$, лежащие на одном луче. Оптическая длина луча, соединяющего эти точки, рассматриваемая как функция их координат, называется точечным яйконалом, или характеристической функцией оптической системы. Она была введена Гамильтоном (1805-1865) и оказалась весьма полезной при исследовании оптических изображений. Характеристическую функцию будем обозначать через $H=H\left(\boldsymbol{r}, \boldsymbol{r}^{\prime}\right)$.

Фиксировав положение начальной точки $P$, будем перемещать конечную точку $P^{\prime}$. Вместе с точкой $P^{\prime}$ будет перемещаться и луч $P P^{\prime}$, соединяющий ее с точкой $P$. В результате получится пучок лучей, исходящих в различных направлениях нз точки $P$, как если бы она была Рис. 72. источником света (рис. 72). Пусть $F^{\prime} F^{\prime}-$ Еолновой фронт, соответствующий этому пучку, проходящий через начальное положение точки $P^{\prime}$. При смещении $P^{\prime}$ в точку $Q^{\prime}$, лежащую на луче $P A^{\prime} Q^{\prime}$, функция $H$ получает приращение $\Delta H=\left(P A^{\prime} Q^{\prime}\right)-\left(P P^{\prime}\right)$, или, ввиду равенства оптических длин $P P^{\prime}$ и $P A^{\prime}$,
\[
\Delta H=\left(P A^{\prime} Q^{\prime}\right)-\left(P A^{\prime}\right)=\left(A^{\prime} Q^{\prime}\right) .
\]

Если смещение $d \boldsymbol{r}^{\prime}=\overline{P^{\prime}} \overrightarrow{Q^{\prime}}$ бесконечно мало, то $\Delta H$ переходит в
\[
d H=n^{\prime}\left|d \boldsymbol{r}^{\prime}\right| \cos \alpha^{\prime}=n^{\prime}\left(s^{\prime} d \boldsymbol{r}^{\prime}\right),
\]

где $\alpha^{\prime}$ – угол между вектором $d r^{\prime}$ и единичным вектором луча $s^{\prime}$ в точке $P^{\prime}$, а $n^{\prime}$ – показатель преломления среды в этой точке. Аналогично найдется бесконечно малое прираценне функции $H$, когда конечная точка $P^{\prime}$ остается неподвижной, а начальная точка $P$ перемещается на $d r$. В этом случае при вычислении надо воспользоваться пучком лучей, сходящихся в точке $p^{\prime}$ (рис. 73). В результате получится $d H=-n(\boldsymbol{s} d \boldsymbol{r})$, где $n, \boldsymbol{s}$ и $d \boldsymbol{r}$ имеют тақой же смысл, что и в предыдущем случае, но относятся к начальной точке $P$. При изменении обоих аргументов $r$ и $\boldsymbol{r}^{\prime}$ получим
\[
d H=n^{\prime}\left(s^{\prime} d \boldsymbol{r}^{\prime}\right)-n(s d r) .
\]

Докажем теперь следующую теорему, называемую теоремой косинусов: Пусть точка $P^{\prime}$ (рис. 74) яөляется стигматическим изображением точки $P$. Соединим эти точки произвольным лучом, направления которого в $P$ и $P^{\prime}$ определяются единичным векторами $s$ и $s^{\prime}$. Пусть $Q$ и $Q^{\prime}$ – две точки, бесконечно близкие к $P$ и $P^{\prime}$. Для того чтобы точка $Q^{\prime}$ была стигматическим изображениел точки $Q$ в щироких пучках лучей, необходимо и достаточно, чтобы разность
\[
n s d \boldsymbol{l}-n^{\prime} s^{\prime} d \boldsymbol{l}^{\prime},
\]

где $d \boldsymbol{l}=\overrightarrow{P Q}, d \boldsymbol{l}^{\prime}=\overrightarrow{P^{\prime} Q^{\prime}}$, не ваеисела от направления луиа, соединяющего $P$ с $P^{\prime}$.
Для доказательства необходимости теоремы допустим, что $Q^{\prime}$ является стигматическим изображением точки $Q$. Обозначим через $H$ оптическую длину какого-либо луча, соединяющего сопряженные точки $P$ и $P^{\prime}$, а через $H^{\prime}$ – опти* ческую длину луча, соединяющего сопряженные точки $Q$ и $Q^{\prime}$. В силу известного
Рис. 73.
Рис. 74 .

свойства сопряженных точек величины $H$ и $H^{\prime}$, а с ними и разность $d H=H^{\prime}-$ $-H=n^{\prime} s^{\prime} d l^{\prime}-n s d \boldsymbol{l}$ не зависят от направлений лучей, соединяющих $P$ с $P^{\prime}$, а $Q$ с $Q^{\prime}$. Таким образом, выражение (19.2) не может зависеть от $s$, и необходимость теоремы доказана.

Докажем теперь ее достаточность. Соединим точки $Q$ и $Q^{\prime}$ лучом $Q Q^{\prime}$. Кроме того, через $Q$ проведем произвольный луч $Q Q^{\prime \prime}$ и отметим на нем такую точку $Q^{\prime \prime}$, чтобы оптическая длина ( $Q Q^{\prime \prime}$ ) была равна оптической длине ( $\left.Q Q^{\prime}\right)$. Так как по условию теоремы $P^{\prime}$ является стигматическим изображением точки $P$, то из соображений непрерывности следует, что вектор $\widehat{P^{\prime} Q^{\prime \prime}}=d l^{\prime \prime}$ бесконечно мал, В таком случае по формуле (19.1)

По той же формуле
\[
\left(Q Q^{\prime \prime}\right)-\left(P P^{\prime}\right)=n^{\prime} s^{\prime} d l^{\prime \prime}-n s d \boldsymbol{l} .
\]
\[
\left(Q Q^{\prime}\right)-\left(P P^{\prime}\right)=n^{\prime} s^{\prime} d \boldsymbol{l}^{\prime}-n s d \boldsymbol{l} .
\]

Так как по построению $\left(Q Q^{\prime}\right)=\left(Q Q^{\prime \prime}\right)$, то $s^{\prime} d l^{\prime \prime}=s^{\prime} d l^{\prime}$, причем по условию теоремы это соотношение должно выполняться для всех направлений вектора $s^{\prime}$. Это возможно тогда и только тогда, когда $d l^{\prime \prime}=d l^{\prime}$, т. е. когда точка $Q^{\prime \prime}$ совпадает с $Q^{\prime}$. Таким образом, любой луч, исходящий из $Q$, пройдет через $Q^{\prime}$, что и доказывает достаточность теоремы.

Чтобы конечная кривая изображалась стигматически широкими пучками лучей, необходимо и достаточно, чтобы условия теоремы косинусов выполнялись для каждой пары сопряженных бесконечно малых отрезков этих кривых.
2. Условие синусов является следствием теоремы косинусов. Действительно, согласно этой теореме разность $n l s-n^{\prime} l^{\prime} s^{\prime}=n l \sin u-n^{\prime} l^{\prime} \sin u^{\prime}$ не должна зависеть от направления луча, соединяющего сопряженные точки $P$ и $P^{\prime}$ (рис. 75). Но если луч идет вдоль оптической оси, то указанная разность обращается в нуль. В результате снова получается соотношение (18.1), и притом не только как неосходимое, но и как достаточное условие.

Допустим теперь, что отрезок $l=P B$ лежит на оптической оси. Найдем условие, при котором он изображается стигматически широкими пучками лучей в виде отрезка $l^{\prime}=P^{\prime} B^{\prime}$, также лежащего на оптической оси. В рассматриваемом случае при $u=0$
\[
n l s-n^{\prime} l^{\prime} s^{\prime}=n l \cos u-n^{\prime} l^{\prime} \cos u^{\prime}=n l-n^{\prime} l^{\prime} .
\]

Поэтому на основании теоремы косинусов должно быть

или
\[
n l \cos u-n^{\prime} l^{\prime} \cos u^{\prime}=n l-n^{\prime} l^{\prime},
\]
\[
n l \sin ^{2}(u / 2)=n^{\prime} l^{\prime} \sin ^{2}\left(u^{\prime} / 2\right),
\]

каковы бы ни были значения углов $u$ и $u^{\prime}$, Это соотношение называется условием Гериеля.

Пусть $P$ и $P^{\prime}$ – сопряженные апланатические точки. Если в бесконечно малых окрестностях этих точек существует другая пара апланатических точек $Q$ и $Q^{\prime}$ (а следовательно, и бесконечное множество таких пар), то оптическая длина бесконечно малого линейного объекта, лежащего в окрестности точки $P$, будет равна оптической длине его изображения, получающегося в окрестности точки $P^{\prime}$. Действительно, так как $P$ и $P^{\prime}$ – апланатические точки, то по условию синусов отношение
\[
\frac{\sin u}{\sin u^{\prime}}=\frac{\cos (u / 2)}{\cos \left(u^{\prime} / 2\right)} \cdot \frac{\sin (u / 2)}{\sin \left(u^{\prime} / 2\right)}
\]

не должно зависеть от $u$. С другой стороны, так как $Q$ и $Q^{\prime}$ также апланатические точки, то бесконечно малый отрезок $P Q$ оптической оси изображается в виде отрезка $P^{\prime} Q^{\prime}$ той же оси, Поэтому должно соблюдаться и условие Гершеля: отношение
\[
\frac{\sin ^{2}(u / 2)}{\sin ^{2}\left(u^{\prime} / 2\right)}
\]

не должно зависеть от угла $u$. Оба условия могут быть выполнены одновременно тогда и только тогда, когда $u= \pm u^{\prime}$, т. е. когда апланатические точки $P$ и $P^{\prime}$ являются узловыми или обратными узловыми точками системы. Но в таком случае, если отрезок $l$ перпендикулярен к оптической оси, из (18.1) следует: $\left|n l^{\prime}\right|=\left|n^{\prime} l^{\prime}\right|$. Если же отрезок $l$ лежит на оптической оси, то из (19.3) также следует $|n l|=\left|n^{\prime} l^{\prime}\right|$. Таким образом, теорема доказана для двух частных случаев: когда отрезок $l$ лежит на оптической оси и когда он перпендикулярен к ней. Тем самым она доказана для отрезка $l$ произвольного направления.

Во всех центрированных системах, применяющихся на практике, линейное увеличение, как правило, отлично от $\mathrm{n} / \mathrm{n}^{\prime}$. Поэтому из доказанной теоремы следует, что для таких систем апланатические пары точек, если они существуют, могут быть лишь изолированными точками оптической оси. Это значит, что для каждой пары апланатических точек можно указать конечные интервалы оптической оси, содержащие эти точки, внутри которых нет другой пары апланатических точек.

В приближении параксиальной оптики условие синусов и условие Гершеля выполняются всегда, Первое из них в указанном приблнжении переходит
в теорему Лагранжа – Гельмгольца. Для доказательства второго из соотношений (11.20), (11.17), (11.13), (10.6) находим
\[
\frac{\delta X^{\prime}}{\delta X}=\frac{l^{\prime}}{l}=-\frac{f^{2}}{X^{2}} \frac{f^{\prime}}{f}=\frac{n^{\prime}}{n} \frac{y^{\prime 2}}{y^{2}}=\frac{n}{n^{\prime}} \frac{u^{2}}{u^{\prime 2}},
\]

а это при малых углах $u$ и $u^{\prime}$ совпадает с условием Гершеля (19.3). Таким образом, равенство углов $u$ и $u^{\prime}$, а следовательно, и равенство оптических длин $n l$ и $n^{\prime} l^{\prime}$ не обязательны. Благодаря этому в параксиальной оптике поперечное и продольное увеличения могут принимать любые значения, не обязательно равные $n / n^{\prime}$.
3. Пусть $P^{\prime}$ является стигматическим изображением точки $P$. Для того чтобы бесконечно мальй элемент плоскости $S$, проходящий через $P$, изображался стигматически в виде бесконечно малого элемента плоскости $S^{\prime}$, проходящей через $P^{\prime}$, необходимо и достаточно, чтобы выполнялось условие косинусов для двух бесконечно лальх непараллельных отрезков, лежащих в плоскости $S$ и проходящих через точку $P$.

Необходимость теоремы очевидна. Для доказательства ее достаточности соединим $P$ и $P^{\prime}$ произвольыым лучом. Пусть $d l_{1}$ и $d l_{2}$ – два бесконечно малых неколлинеарных вектора, проходящих через точку $P$, для которых удовлетворяется условие теоремы косинусов. Таким образом, по условию разности
\[
\begin{array}{l}
n^{\prime} s^{\prime} d l_{1}^{\prime}-n s d l_{1}=d H_{1}, \\
n^{\prime} s^{\prime} d l_{2}^{\prime}-n s d l_{2}=d H_{2}
\end{array}
\]

не зависят от направления луча, соединяющего $P$ с $P^{\prime}$. Но они могут зависеть от направлений векторов $d \boldsymbol{l}_{1}$ и $d \boldsymbol{l}_{2}$. Произвольный вектор $d \boldsymbol{l}$, проходящий через точку $P$ и лежащий в плоскости предмета, можно разложить по векторам $d l_{1}$ и $d l_{2}$ :
\[
d \boldsymbol{l}=a d \boldsymbol{l}_{1}+b d \boldsymbol{l}_{2},
\]

причем коэффициенты $a$ и $b$ не зависят от $s$. Введем вектор
\[
d l^{\prime}=a d l_{1}^{\prime}+b d l_{2}^{\prime}
\]

умножим соотношения (19.4) на $a$ и $b$ и сложим. Получим
\[
n^{\prime} s^{\prime} d l^{\prime}-n s d l=d H,
\]

где $d H=a d H_{1}+b d H_{2}$. Отсюда видно, что разность (19.5) не зависит от $s$, т. е. условие теоремы косинусов выполняется для произвольного вектора $d t$, проходящего через точку $P$ и лежащего в плоскости предмета. Следовательно, предмет изобразится оптической системой стигматически, Вообще говоря, изображение не будет подобно самому предмету.

Направления произвольных неколлинеарных векторов $d l_{1}$ и $d l_{2}$ можно принять за координатные оси $Y$ и $Z$ в плоскости предмета, направления оптически сопряженных с ними отрезков $d l_{1}^{\prime}$ и $d l_{2}^{\prime}$ – за координатные оси $Y^{\prime}$ и $Z^{\prime}$ в плоскости изображения, а сами точки $P$ и $P^{\prime}$ – за начала координат соответствующих координатных систем. Тогда в окрестностях точек $P$ и $P^{\prime}$ координатные оси $Y$ и $Z$ изобразятся оптической снстемой координатными осями $Y^{\prime}$ и $Z^{\prime}$. Қоординаты сопряженных точек, бесконечно близких к $P$ и $P^{\prime}$, будут связаны линейными соотношениями
\[
y^{\prime}=A y, \quad z^{\prime}=B z .
\]

Координатная система $Y^{\prime} Z^{\prime}$, вооще говоря, будет косоугольной, даже в том случае, когда система $Y Z$ прямоугольная. Однако если в плоскостях предмета и его изображения ввести прямоугольные системы координат, то из соотношений (19.6) и из формул преобразования координат непосредственно следует, что прямоугольные координаты сопряженных точек будут связаны формулами линейного преобразования
\[
y^{\prime}=A_{11} y+A_{12} z, \quad z^{\prime}=A_{21} y+A_{22} z .
\]

Из свойств линейного преобразования следует, что в плоскости предмета существует пара взаимно перпендикулярных прямых, которой в плоскости изображения соответствует пара также взаимно перпендикулярных прямых. Если эти четыре прямые принять за координатные оси, то формулы преобразования снова примут вид (19.6), с тем отличием, что теперь обе координатные системы прямоугольны. Вообще говоря, $A
eq B$. Поэтому изображение бесконечно малой площадки происходит с нарушением подобия: бесконечно малый круг изображается в виде эллипса. Только в частном случае, когда $A=B$, система дает подобные изображения бесконечно малых площадок, находящихся в окрестности точки $P$.
4. Следуя Каратеодори ( $1873-1950)$, говорят, что световой луч лежит в поле инструмента, если он действительно проходит через диафрагмы из пространства предметов в пространство изображений. Говорят также, что отрезок кривой лежит тангенциально в поле инструмента, если все лучи, касающиеся этого отрезка, лежат в поле инструмента.

Пусть бесконечно малая площадка изображается оптической системой стигматически. Пусть, далее, $d l_{1} u d l_{2}$ – бесконечно малые не параллельные отрезки, пересекающиеся в пределах площадки и лежащие в ее плоскости. Если эти отрезки лежат тангенциально в поле инструмента, то рассматриваемая площадка изображается оптической системой с сохранением подобия. При этом оптическая длина любого отрезка, лежащего на площадке, равна оптической длине сопряженного с ним отрезка.

По условию теоремы лучи, выходящие из $P$ (рис. 76) в направлениях $d l_{1}$ и $d l_{2}$, лежат в поле инструмента. В пространстве изображений они пройдут в направлениях оптически сопряженных отрезков $d l_{1}^{\prime}$ и $d l_{2}^{\prime}$. Рассмотрим сначала изображение отрезка $d \iota_{1}$. Возьмем два луча, исходящих из $P$ в направлениях $d \boldsymbol{l}_{2}$ и $d \boldsymbol{l}_{1}$. На основании теоремы косинусов
\[
n d l_{1} \cos \alpha-n^{\prime} d l_{1}^{\prime} \cos \alpha^{\prime}=n d l_{1}-n^{\prime} d l_{1}^{\prime} .
\]

Аналогично, рассматривая изображение отрезка $d l_{2}$,
\[
n d l_{2} \cos \alpha-n^{\prime} d l_{2}^{\prime} \cos \alpha^{\prime}=n d l_{2}-n^{\prime} d l_{2}^{\prime} .
\]

Допустим, что $d l_{1}=d l_{2}$. Докажем, что тогда $d l_{1}^{\prime}=d l_{2}^{\prime}$. В самом деле, почленное вычитание (19.9) из (19.8) дает
\[
n^{\prime} d l_{1}^{\prime}\left(1-\cos \alpha^{\prime}\right)=n^{\prime} d l_{2}^{\prime}\left(1-\cos \alpha^{\prime}\right) .
\]

Разность $1-\cos \alpha^{\prime}$ не может обращаться в нуль. Действительно, по предположению угол $\alpha$ не равен нулю. Но заданием направления в какой-либо точке луч определяется однозначно. Если бы $\alpha^{\prime}=0$, т. е. направления обоих рассматриваемых нами лучей в точке $P^{\prime}$ совпадали, то они совпадали бы и во всех других точках, в частности в начальной точке $P$. Значит, было бы $\alpha=0$, вопреки предположению. Поэтому, сокращая на $n^{\prime}\left(1-\cos \alpha^{\prime}\right)$, из $(19.10)$ находим $d l_{1}^{\prime}=d l_{2}^{\prime}$, что и требовалось доказать, Из доказан ного следует, что отрезки $d \boldsymbol{l}_{1}$ и $d \boldsymbol{l}_{2}$ изображаются оптической системой с одинаковым увеличением. Следовательно, в рассматриваемом случае в формулах (19.6) $A=B$, т. е. увеличение любого отрезка в плоскости предмета не зависит от его направления. Отсюда следует, что изображение происходит с сохранением подобия, т. е. является конформным.

Но изображение с сохранением подобия характеризуется также сохранением углов. Следовательно, $\alpha=\alpha^{\prime}$, и формула (19.8) дает $n d l_{1}=n^{\prime} d l_{l}^{\prime}$. Вообще, для всякого отрезка $d l$, лежащего в плоскости предмета, $n d l=n^{\prime} d l^{\prime}, d l^{\prime} / d l=$ $=n / n^{\prime}$, и вторая часть теоремы доказана.

Итак, стигматические изображения площадок, тангенциально лежащих в поле инструмента, могут происходить только с вполне определенным увеличением $n / n^{\prime}$. В частности, когда показатели преломления пространств предметов и изображений одинаковы, увеличение равно единице. Это утверждение перестает быть справедливым для площадок, не лежащих тангенциально в поле инструмента.

Примером может служить преломление на сферической поверхности (рис. 67). Сфера $S$ отображается на сферу $S^{\prime}$ стигматически широкими пучками лучей. Однако линейное увеличение, как видно из построения, равно отношению квадратов показателей преломления, а не их первых степеней. Причина этого в том, что ни одна из сфер $S$ и $S^{\prime}$ не лежит тангенциально в поле инстру* мента. Напротив, если линейный объект поместить в точку $O$, то, поскольку последняя является парой совпадающих узловых точек, линейное увеличение будет равно просто отношению показателей преломления в согласии с обсуждаемой нами общей теоремой. Действительно, ввиду шаровой симметрии любой линейный объект, помещенный в центре $O$, лежит тангенциально в поле инструмента.

Бесконечно малую часть конечной поверхности можно рассматривать как бесконечно малую плоскую площадку. Поэтому для стигматического изображения конечной поверхности необходимо и достаточно, чтобы стигматически изображались все бесконечно малые площадки, на которые можно разбить эту поверхность.
5. Рассмотрим, наконец, стигматические изображения объемных объектов щирокими пучками лучей. Этот вопрос может быть исследован в точности так же, как и аналогичный вопрос для поверхностных объектов. В частности, может быть доказана следующая теорема:

Пусть точка $P^{\prime}$ является стигматическим изображением точки $P$. Для того чтобы бесконечно малый элемент объема в окрестности точки $P$ изображался стигматически, необходимо и достаточно, чтобы выполнялось условие теоремь косинусов для трех бесконечно малых отрезков, проходящих через точку $P$ и не лежащих в одной плоскости.

Новым по сравнению с изображениями элементов поверхностей является то, что в случае стигматического изображения элементов объема всегда существуют три отрезка $d l_{1}, d l_{2}, d l_{3}$, не находящиеся в одной плоскости и лежацие тангенциально в поле инструмента. Поэтому, повторяя рассуждения, приведенные применительно к изображениям элементов поверхности, приходим к заключению, что ти три отрезка изображаются с одним и тем же увеличением. Қак следствие э’гого, получаем следующую теорему:

Стигматическое изображение элементов обтема, элли оно осуществляется широкими пучками лучей, всегда конформно, т. е. происходит с сохранением подобия. При этом линейное увеличение равно $\mathrm{n} / \mathrm{n}^{\prime}$, так что оптическая длина предмета всегда равна оптической длине изображения.

Categories

1
Оглавление
email@scask.ru