4.3. Интерференция двух стационарных световых пучков как проявление корреляции второго порядка
В предыдущем разделе мы ввели грубые критерии, устанавливающие условия, при которых обычно возникают простые интерференционные явления. Мы также кратко отметили, что эти явления обусловлены корреляциями между флуктуациями в интерферирующих пучках. Безусловно, корреляции можно описывать с помощью математического аппарата теории стохастических процессов, изложенного в гл. 2. Общий анализ, основанный на этом подходе, будет проведен нами в гл. 8. Однако, когда мы имеем дело со средней интенсивностью света, что бывает довольно часто, достаточно рассматривать только корреляции второго порядка (т.е. корреляции световых колебаний в двух пространственно-временных точках). Мы введем точную меру таких корреляций, исходя из детального анализа простейших интерференционных экспериментов. Ниже
будет показано, что эта мера, которая в этом разделе является классической, в точности соответствует аналогичной мере, определяемой квантово-механически.
4.3.1. Законы интерференции. Функция взаимной когерентности и комплексная степень когерентности
Для того, чтобы выявить существенные аспекты теории, в этой главе мы не будем уделять внимания поляризационным явлениям. Поляризация будет рассмотрена нами позже, в гл. 6.
Пусть
действительная переменная поля, характеризующая поле в точке
в момент времени
Эта функция может представлять собой, например, декартову компоненту вектора напряженности электрического поля или векторный потенциал. Мы намеренно не уточняем здесь природу поскольку общий анализ не зависит от конкретного выбора переменной поля. Для описания различных экспериментальных ситуаций может оказаться более подходящим различный выбор
Например, при описании фотоэлектрического детектирования в качестве основной переменной поля удобно рассмотреть, как будет показано в разд. 14.1, векторный потенциал (точнее говоря, связанный с ним аналитический сигнал). Однако, существуют другие процессы измерения, для которых более подходящим может оказаться другой выбор.
Для любого реального светового пучка V будет флуктуирующей функцией времени, которую можно рассматривать в качестве характерного члена ансамбля, состоящего из всех возможных реализаций поля. Есть несколько причин, вызывающих флуктуации
В случае света от теплового источника флуктуации, главным образом, возникают благодаря тому, что состоит из большего числа независимых вкладов; их суперпозиция приводит к появлению флуктуирующего поля, которое может быть описано только статистически. Но даже если свет излучается жестко стабилизированным источником, таким, как лазер, он будет обнаруживать некоторые случайные флуктуации, поскольку нельзя полностью исключить спонтанное излучение. Кроме того, существуют и другие источники флуктуаций, например, колебания зеркал на концах резонатора.
В дальнейшем анализе удобнее перейти от действительной переменной поля
к связанному с ней аналитическому сигналу
который мы подробно обсуждали в гл. 3. Позже мы увидим (см. разд. 14.2), что комплексное поле
естественным образом возникает в теории фотоэлектрического детектирования световых флуктуаций и представляет собой собственное значение оператора уничтожения фотона в пространственно-временной точке
Рис. 4.6. Схема интерференционного эксперимента Юнга для определения корреляционных функций второго порядка
Рассмотрим квазимонохроматический свет, описываемый статистически стационарным ансамблем аналитических сигналов
Термин «квазимонохроматический» подразумевает, как отмечалось ранее, что эффективная ширина полосы частот света, т.е. эффективная ширина
его спектра мощности в каждой точке
мала по сравнению с его средней частотой й:
Такое поле в каждой точке может быть описано с помощью ансамбля квазимонохроматических сигналов (см. разд. 3.1.2.), центрированных на частоте
В силу высокой частоты оптических колебаний величину V как функцию времени невозможно измерить с помощью доступных оптических приемников. Средний период оптических колебаний составляет
тогда как типичные фотоэлектрические детекторы имеют временное разрешение порядка
Правда, существует специальная техника, позволяющая достичь и более короткого временного разрешения. Хотя быстрые изменения полей во времени нельзя изучить экспериментально, однако можно измерить корреляцию поля в двух и более пространственно-временных точках. Рассмотрим такие измерения на примере оптического поля коллимированного квазимонохроматического пучка света.
Выделим световые колебания в точках
поместив поперек пучка непрозрачный экран
с небольшими отверстиями в этих двух точках. Мы наблюдаем распределение интенсивности, являющееся результатом суперпозиции света, выходящего из этих отверстий, на экране расположенном на расстоянии
от (см. рис. 4.6). Предполагается, что
велико по сравнению с оптическими длинами волн. С
хорошей степенью точности мгновенное значение поля в точке
на экране 38 определяется выражением
где
— времена, необходимые для того, чтобы свет прошел от точки
к точке
и от точки
к точке
соответственно; с — скорость света в вакууме, а
постоянные множители, зависящие от размера отверстий и геометрии эксперимента. Из элементарной теории дифракции следует, что множители
мнимые.
Мгновенная интенсивность
в точке
в момент времени
может быть определена с помощью формулы
Из выражений (4.3.2) и (4.3.3) следует, что
где
обозначает действительную часть. Если взять среднее от
по ансамблю различных реализаций поля и обозначить его как
мы получим
где
Функция
определяемая выражением (4.3.6), фактически является функцией взаимной корреляции случайных процессов
(см. разд. 2.4.4). В данном случае она характеризует корреляцию между световыми колебаниями в отверстиях
в моменты времени
и соответственно. Величина
представляет собой среднюю (по ансамблю) интенсивность света в отверстии
в момент времени
Позже мы увидим
что при обычных условиях третий член в правой части (4.3.5) вызывает синусоидальную модуляцию средней интенсивности
в зависимости от
Обычно нас интересуют стационарные поля, для которых все средние по ансамблю не зависят от выбора начала отсчета времени; более того, поле, как правило, является эргодическим. При этих условиях, как было показано в разд. 2.2.2, средние по ансамблю уже не зависят от времени и могут быть заменены соответствующими средними по времени.
Обозначим среднее по времени стационарного случайного процесса
как
т.е.
Тогда «выборочную функцию взаимной корреляции»
можно заменить соответствующей функцией взаимной корреляции по времени. Последняя зависит от двух временных аргументов только через их разность
Тогда, если мы запишем
выражение (4.3.5) для средней интенсивности в точке
при условии стационарности и эргодичности поля принимает вид
где индексы
или
соответствующие двум различным способам усреднения, опущены, так как далее нет необходимости различать их.
Заметим, что если последний член в правой части (4.3.10) не обращается в нуль, средняя интенсивность
не равна сумме (средних) интенсивностей двух световых пучков, приходящих в точку наблюдения
от двух отверстий. Она отличается от этой суммы наличием члена
Поскольку
а следовательно, и
суперпозиция двух пучков приводит к интерференции.
Функция взаимной корреляции
известная как функция взаимной когерентности (Wolf, 1955), является основной величиной в элементарной теории оптической когерентности. Из выражения (4.3.3) для мгновенной интенсивности
и из определения функции взаимной когерентности
следует, что
представляет собой среднюю интенсивность в точке
Удобно нормировать функцию взаимной когерентности следующим образом:
По причинам, которые вскоре станут очевидными,
называют комплексной степенью когерентности световых колебаний в точках
Согласно неравенству (2.4.47), которому удовлетворяет функция взаимной корреляции любых двух совместно стационарных случайных процессов, имеем
для произвольных значений аргументов
функции 7.
Два первых члена в правой части выражения (4.3.10) имеют простой смысл. Предположим, что отверстие
закрыто, так что на плоскость наблюдения падает свет только из отверстия
В этом случае
и из (4.3.10) очевидно, что
представляет собой среднюю интенсивность света, достигающего точки
и проходящего только через отверстие
Аналогично,
есть средняя интенсивность света, достигающего точки
и проходящего только через отверстие
Последний член в правой части (4.3.10) можно легко выразить через
Из выражений (4.3.126), (4.3.14а) и (4.3.146), используя также формулу (4.3.2) и учитывая, что множители
мнимые, имеем
Подставляя это выражение, а также (4.3.14а) и (4.3.146), в (4.3.10), мы в итоге получим следующее выражение для средней интенсивности света в точке
при условии, что свет достигает плоскости наблюдения пройдя через оба отверстия:
Из (4.3.15) очевидно, что измерение средних интенсивностей
позволяет определить действительную часть комплексной степени когерентности
Более того, если дополнительно измерить средние интенсивности
света в двух отверстиях, то согласно (4.3.126) можно найти действительную часть функции взаимной когерентности
Как мы только что видели, непосредственное измерение средних интенсивностей предоставляет информацию только о действительных частях корреляционных функций
и 7. Однако, мнимые части этих функций, в принципе, могут быть определены по известным действительным частям при всех значениях
Поскольку
аналитические сигналы, их функция взаимной корреляции, т.е. функция взаимной когерентности
согласно теореме I из разд. 3.1.3 также является аналитическим сигналом. Следовательно, ее действительная
и мнимая
части связаны преобразованиями Гильберта
где
главное значение интеграла по Коши при
Более того, поскольку комплексная степень когерентности 7 отличается от функции взаимной когерентности
множителем, не зависящим от
функция 7 также является аналитическим сигналом. Следовательно, ее действительная и мнимая части также связаны преобразованиями Гильберта.
Вместе с тем, именно абсолютное значение комплексной степени когерентности, а не ее действительная часть, является истинной мерой «резкости» интерференционных эффектов, возникающих в результате суперпозиции двух пучков. Чтобы доказать это утверждение, рассмотрим подробнее выражение (4.3.15) для средней интенсивности
света в плоскости наблюдения 38. Положим
где
Подставляя (4.3.17) в (4.3.15), мы получим следующее выражение для
где
причем
и
средняя длина волны света. Далее, поскольку мы предположили, что плоскость наблюдения 38 удалена на расстояние многих длин волн от плоскости
средние интенсивности и
двух световых пучков будут слабо изменяться в зависимости от положения
на экране 38. А так как мы также предположили, что свет является квазимонохроматическим, то исходя из свойств представления огибающей (см. разд. 3.1.2),
также будут меняться медленно в любой области плоскости наблюдения 38, для которой изменение разности хода
мало по сравнению с длиной когерентности света. Следовательно,
в правой части выражения (4.3.19) мы можем пренебречь изменениями
связанными с изменениями аргумента
при условии, что
где
представляет собой разность расстояний от каждого из отверстий до точки
разность расстояний от каждого из отверстий до соседней точки
в плоскости
эффективная ширина полосы частот света. В то же время косинус в правой части (4.3.19) будет меняться очень быстро в зависимости от положения
точки
на экране 38 из-за наличия величины
Согласно (4.3.20) эта величина обратно пропорциональна средней длине волны света, которая очень мала. Следовательно, в достаточно малой области плоскости наблюдения 38 средняя интенсивность
будет меняться почти синусоидально в зависимости от
при условии, что
Обычной мерой резкости интерференционных полос является так называемая видность, введенная Майкельсоном (Michelson, 1890). Видность
в точке
интерференционной картины определяется формулой
где
максимальное и минимальное значения средней интенсивности в непосредственной окрестности
Из (4.3.19) с хорошей степенью точности имеем
и выражение (4.3.23), таким образом, принимает вид
где
Если, как часто бывает, средние интенсивности двух пучков в точке
равны, то
и (4.3.25) принимает вид
т.е. в этом случае видность полос равна
Распределение средней интенсивности в плоскости наблюдения для случая, когда средние интенсивности двух интерферирующих пучков равны, показано на рис. 4.7.
Согласно
На рисунке мы видим, что в предельном случае
средняя интенсивность в окрестности произвольной точки
интерференционной картины испытывает максимально возможные периодические изменения между значениями
. В другом предельном случае,
интерференционные полосы не формируются совсем; в окрестности
имеет место фактически однородное распределение средней интенсивности. Два этих случая отражают именно то, что традиционно принято называть полной когерентностью (точнее, полной когерентностью второго порядка) и полной некогерентностью (второго порядка), соответственно. Промежуточные значения
отвечают частичной когерентности; в этом случае распределение средней интенсивности в интерференционной картине в окрестности
представляет собой периодическое изменение между значениями
Аргумент (фаза)
также имеет простой смысл. Из (
и (4.3.19) следует, что положение максимумов средней интенсивности в интерференционной картине с высокой степенью точности определяются через
Положения максимумов, определяемые формулой (4.3.27), совпадают с положениями, которые мы получили бы, если бы оба отверстия освещались строго монохроматическим светом с длиной волны
а фаза световых колебаний в точке
запаздывала бы по отношению к фазе колебаний в точке
на величину
Следовательно, при описании интерференционных эффектов вблизи точки
величину
можно интерпретировать как «эффективное запаздывание» света в точке
относительно точки
Из (4.3.27) видно, что аргумент 7 может быть определен из измерений положений максимумов полос интерференционной картины. Известно, что при освещении отверстий монохроматическим светом, отставание фазы на величину
приводит к смещению интерференционной картины в направлении, параллельном
на величину
, (Born and Wolf, 1980, разд. 10.4, выражение 6), где а — расстояние между
расстояние между плоскостями
и 38. Мы видим, что полосы, полученные с квазимонохроматическим светом, смещены относительно полос, которые получились бы при синфазном освещении отверстий монохроматическим светом с длиной волны А на величину
в направлении, параллельном линии, соединяющей отверстия.
Рис. 4.7. Распределение средней интенсивности
в точке
плоскости наблюдения 38, возникающее в результате наложения двух квазимонохроматических пучков с одинаковой средней интенсивностью (Iв интерференционном эксперименте Юнга (см. рис. 4.6):
Кривые соответствуют трем случаям: а — полная когерентность второго порядка
частичная когерентность второго порядка
в — полная некогерентность второго порядка
Мы обнаружили, что, с одной стороны, 7 является мерой корреляции комплексного поля в двух точках
а с другой — мерой резкости интерференционной картины
полученной в результате суперпозиции пучков, идущих от этих двух точек, а также определяет положение максимумов интерферограммы
Поскольку резкость интерференционных полос можно считать проявлением когерентности между интерферирующими пучками, очевидно, что термин «комплексная степень когерентности» поля в точках
отражает смысл 7, следующий из интерференционных экспериментов. Эта терминология не совсем точна, поскольку 7 зависит не только от положения точек
но также и от задержки
Вернее было бы оставить термин «комплексная степень когерентности» за величиной
, где
— значение
при котором
принимает максимальное значение при фиксированных
Однако в случае, когда свет предполагается квазимонохроматическим, а интерференционные полосы наблюдаются в той области плоскости 38, где их видность максимальна, как это обычно имеет место, различие между этими двумя определениями несущественно. Действительно, как мы уже упоминали,
меняются очень медленно в зависимости от
и фактически остаются постоянными в пределах любого интервала изменения
который мал по сравнению с временем когерентности
света. Следовательно,
для любых
таких, что
Таким образом, в интервале изменения
удовлетворяющем (4.3.30), 7 (а также
) фактически представляют собой периодические функции
с периодом, равным среднему периоду
света. Это справедливо,
в частности, и для некоторого интервала изменения
вблизи значения ттах, соответствующего максимуму величины
На практике нас часто интересуют интерференционные эффекты, возникающие в условиях симметрии. В этом случае заметную роль играют только те значения корреляционных функций
для которых значение аргумента
близко к нулю. Тогда согласно (4.3.29) и аналогичному соотношению для
корреляционные функции могут быть аппроксимированы следующим образом:
при условии, что
Величины
представляют собой «равновременные функции корреляции»
Равновременную функцию корреляции
обычно называют взаимной интенсивностью световых колебаний в точках
также, как и
комплексной степенью когерентности. Этих двух корреляционных функций менее общего вида, как правило, бывает достаточно для решения многих задач инструментальной оптики.
Поскольку корреляционные эффекты, о которых шла речь в этой главе, характеризуются корреляционной функцией, которая зависит только от двух пространственно-временных точек, мы будем называть их эффектами когерентности второго порядка. Общая классификация эффектов когерентности будет дана в гл. 8.
Очевидно, что явления временной и пространственной когерентности, которые мы вкратце качественно обсудили в разд. 4.2.1 и 4.2.2, характеризуются, соответственно, функцией
(иногда называемой также автокогерентной функцией) и функцией
(или, в более общем случае,
, где
константа). В первом случае существенна зависимость корреляции от параметра
причем точки
совпадают, и их положение задано; во втором случае ключевой является зависимость от положения двух точек, тогда как время задержки
фактически постоянно (точнее говоря, оно меняется в интервале, который мал по сравнению с
Однако, различие между временной и пространственной когерентностью может быть четко проведено только в самых простейших случаях. В общем случае два этих вида когерентности не являются независимыми, поскольку, как мы узнаем из разд. 4.4 и 4.6, зависимость функции взаимной когерентности
от пространственных переменных
и ее зависимость от временной переменной
связаны между собой. Вскоре мы также узнаем (см. разд. 4.3.2), что функция взаимной когерентности позволяет получить информацию о корреляциях в двух точках поля для произвольной частотной компоненты света
Связывая корреляционные функции
и 7 с результатами измерений мы должны, разумеется, молчаливо предположить, что измерительная аппаратура определяет среднее значение мгновенной интенсивности
На практике так будет почти наверняка, если в качестве V выбрана подходящая полевая переменная, а приемник производит усреднение по времени за промежуток времени, достаточно большой по сравнению с характерными временами флуктуаций поля, т.е. по сравнению со средним периодом и временем когерентности света. (С другой стороны, средняя (по ансамблю) интенсивность может быть получена из последовательности измерений независимо от того, велико или мало время измерения). При этих условиях можно считать, что среднее за время измерения почти не отличается от среднего, взятого за бесконечно длинный интервал времени, определенный в (4.3.8). Если эти условия не выполняются, могут возникнуть другие интерференционные эффекты (переходная интерференция), которые, в частности, обсуждались Манделем и Вольфом (Mandel and Wolf, 1965, разд. 7).
В заключении этого раздела отметим ряд свойств функции взаимной когерентности, которые непосредственно вытекают из общих результатов, полученных для функции взаимной корреляции двух совместно стационарных комплексных случайных процессов. Из (2.4.32) мы имеем