Глава 6. Метод средних значений

<< Предыдущий параграф

Следующий параграф >>

<< Предыдущий параграф

Следующий параграф >>

Пред.

След.

Вернуться к книге

Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ

ZADANIA.TO

Глава 6. Метод средних значений

Вернемся теперь к задаче, поставленной во второй главе, и рассмотрим ее, пользуясь новым методом. Мы делаем это по ряду причин. Во-первых, потому, что рассуждения в пятой главе показали, что «метод наиболее вероятных значений» не является вполне строгим; настоящий метод, которым мы обязаны Дарвину и Фаулеру, многим представляется более убедительным, может быть, даже совершенно точным. Во-вторых, всегда заманчиво и поучительно видеть, что в точности тот же результат может быть получен путем совершенно иных рассуждений, в особенности, если речь идет о весьма общей теореме, имеющей фундаментальное значение. В-третьих, развиваемый здесь математический метод окажется очень полезным также и в других приложениях.

Нашей целью является вычисление средних значений в ансамбле Гиббса, определяемых соотношением (5.1). Воспользуемся приемом, который мы применили в (5.2), (5.3) и (5.4) и в силу которого все, что мы хотим знать, может быть получено из величины

где суммирование производится по всем совокупностям величин удовлетворяющим (2.3). Таким образом, нам достаточно вычислить эту сумму.

Если бы единственным ограничением для являлось условие то эта задача решалась бы немедленно с помощью формулы для полинома, и сумма, по крайней мере формально, была бы равна

(Чтобы результат был конечным, следует обрывать ряды уровней на каком-либо очень высоком уровне.) Второе условие автоматически ограничивает число членов в (6.1), в силу невозможности

существования уровня однако в то же самое время оно же и определяет трудность задачи, состоящую в необходимости выбора лишь тех членов, которые удовлетворяют этому условию.

Чтобы преодолеть эту трудность, мы воспользуемся следующим ухищрением. Не принимая во внимание второго из указанных ограничений, вычислим такую сумму:

где

Если бы все и были целыми числами, то искомая сумма была бы, очевидно, коэффициентом при в функции от в (6.2); она может быть вычислена методом теории вычетов в комплексной плоскости

Чтобы осуществить этот план, мы должны — в этом и заключается наше ухищрение — объявить с самого начала выбранную нами единицу энергии столь малой, что можно считать с любой желаемой степенью точности все уровни и заданную полную энергию Е целыми кратными этой единицы или, если угодно, даже заменить их целыми кратными этой единицы, не меняя сколько-нибудь существенно самой физической задачи. Имеются, конечно, случаи, в которых это оказывается невозможным, в частности, когда густота уровней становится бесконечной вблизи некоторой конечной энергии это, например, имеет место для электронных уровней свободного атома водорода. Мы исключаем такие случаи, которые, как можно показать, вообще недоступны статистическому исследованию без специальных предосторожностей (например, атом водорода должен был бы быть заключен в большой, но конечный ящик, препятствующий удалению электрона в бесконечность).

Представляется удобным ввести два дальнейших ограничения, касающиеся Во-первых, если то мы пользуемся вместо уровней уровнями заменяя одновременно Е на Рассмотрение (6.3) и следующей формулы (6.4) убеждает нас в том, что это не вносит никаких изменений, являясь лишь более удобным математическим способом выражения.

Предположим, для простоты, что Во-вторых, мы предполагаем, что величины не имеют общего делителя. (Этого всегда можно достигнуть, так как в противном случае Е также должно было бы его содержать, чтобы условие могло бы в точности быть выполнено.) Таким образом, если общий наибольший делитель равен то мы выбираем единицу энергии в раз большей, что уничтожает делитель, оставляя, однако, все значения целыми числами.

Приняв это условие, получаем простое и очевидное решение

Рис. 2

Здесь интегрирование ведется вдоль любого замкнутого контура (рис. 2), охватывающего начало координат в комплексной плоскости , кроме того, лежащего внутри круга сходимости что позволяет избежать аналитического продолжения.

Интеграл оценивается методом наиболее крутого спуска (метод седловидной точки).

Рассмотрим поведение подынтегрального выражения, двигаясь от нуля до бесконечности вдоль действительной положительной оси и учитывая, что все в (6.3) виртуально равны единице и что Первый сомножитель в подынтегральном выражении убывает быстро и монотонно, начиная с бесконечного положительного значения. Второй множитель начиная со значения 1 при монотонно возрастает, стремясь к бесконечности по мере приближения к границе круга сходимости где бы она ни была расположена. Кроме того, относительное уменьшение первого сомножителя

само убывает монотонно от при до нуля при относительное возрастание второго сомножителя

обнаруживает противоположное поведение. Эта величина равна нулю при и монотонно возрастает. В самом деле,

Числитель этого выражения может быть переписан в виде

откуда видно, что он положителен.

При этих обстоятельствах подынтегральная функция обнаруживает один и только один минимум (не принимая других экстремальных значений) внутри круга сходимости Этот минимум, как можно ожидать и как будет показано в дальнейшем, является очень острым; это вытекает из того, что обе экспоненты, т. е. и N — весьма большие числа; действительно, не следует забывать, что нас интересует переход к пределам при сохранении постоянства отношения поскольку последнее выражает среднюю энергию, которой обладает одна система, входящая в ансамбль.

Другими словами, в этой точке на действительной положительной оси (обозначим ее пока через опустив впоследствии индекс 0) первая производная подынтегральной функции обращается в нуль, вторая же производная должна быть положительной, и можно думать, что она очень велика. Следовательно, если мы будем двигаться от этой точки в направлении, перпендикулярном действительной оси, давая чисто мнимые приращения, подынтегральная функция будет проходить (оставаясь вначале действительной) через очень острый максимум. Возьмем в качестве контура интегрирования в (6.4) окружность с центром в точке О, проходящую через точку рассчитывая, что основную долю в значение интеграла будет вносить только непосредственная окрестность этого чрезвычайно острого максимума. В свое время мы это докажем.

Определим прежде всего значение полагая первую производную равной нулю, и определим значение второй производной при При этом будет удобно воспользоваться логарифмическими производными. Пусть на действительной положительной оси

[мы берем, разумеется, главную ветвь, т. е. действительную часть ]. Тогда будет определяться выражением

и, далее,

Это показывает, во-первых, что при достаточно больших Е и не будет изменяться при пропорциональном возрастании Е и во-вторых, поскольку величина в этом случае изменяется пропорционально Е и она может быть сделана, таким образом, сколь угодно большой (то, что она положительна, не нуждается в доказательстве, так как это вытекает из общих соображений).

Следовательно, для очень малого, чисто мнимого приращения сообщаемого вблизи подынтегральное выражение может быть написано следующим образом:

и ближайшая окрестность окружности, по которой производится интегрирование, приведет [с любой желательной точностью, если с увеличением N величина делается достаточно большой] к результату:

Мы заключили в скобки, ибо нам предстоит еще доказать, что вычисление можно считать оконченным, т. е. что долей, вносимой остальной частью окружности, можно пренебречь при больших N.

Образно говоря, это происходит потому, что отдельные члены ряда (6.3), «усиливающие» друг друга на действительной оси, будут по мере перемещения по окружности «поворачиваться» вокруг начала координат с различными скоростями, определяемыми различными целыми числами в результате будет, вообще говоря, значительно меньше, чем (если не рассматривать область, лежащую непосредственно вблизи что мы уже оговорили). Отношение абсолютного значения подынтегральной функции, взятой в произвольной точке на окружности, к значению ее в равно

и становится для больших N сколь угодно малым по сравнению с последним (тоже малым) множителем в (6.9), т. е. с порядок малости которого равен Чтобы сделать это заключение строгим, мы должны показать, что максимальное значение скажем, М существенно меньше, чем

Действительно, при этом доля, вносимая в интеграл остальной частью окружности, наверное, не превышает величины

которой при можно пренебречь по сравнению с (6.9).

Чтобы доказать (6.11), обратим внимание на то, что равенство могло бы иметь место только в том случае, если в какой-нибудь точке окружности существенно отличной от все члены (6.3) снова складывались бы наиболее благоприятным образом. Поскольку первый член действителен и положителен то и все остальные должны были бы быть действительными и положительными в этой точке. Пусть — фазовый угол в этой точке. Тогда все произведения

должны были бы быть целыми кратными а все целые числа — целыми кратными т. е.

Однако это возможно только, если ибо если больше единицы, то оно должно быть рациональном дробью — с числителем больше единицы, даже если эта дробь образована наименьшими целыми числами и Тогда было бы общим делителем всех что противоречит нашему предположению об отсутствии такового.

Это доказательство довольно искусственно и не очень импонирует физику, которому трудно поверить, что отдельный уровень может испортить все дело. Действительно, мы можем себе представить, что все уровни, кроме одного, имеют довольно большой общий делитель который не может быть устранен вследствие того, что один уровень им не обладает. Приходится удовлетвориться тем, что даже один единственный «нарушитель» может воспрепятствовать неограниченному приближению максимума М к Действительно, поскольку не все имеют общий делитель, они должны приобретать это свойство (не иметь делителя) в некоторой конечной точке ряда, например . Предполагаемый «нарушитель» может тогда оказаться лишь членом ряда с что, очевидно, устанавливает также верхний предел величины предполагаемого общего делителя остальной части. Не полностью действительный (частично мнимый) член ряда будет обладать фазовым углом, равным, по крайней мере, и будет выражаться в виде

Это, очевидно, вызывает конечные отклонения от хотя при достаточно больших отклонение может быть достаточно малым; остальное может быть учтено путем перехода к пределу в (6.10) или (6.12).

Вернемся теперь к нашим основным результатам (6.6), (6.7) и (6.9). Перепишем их, отбросив для краткости индекс в так как нас будет интересовать именно это действительное положительное значение . В уравнении (6.3) мы также будем подразумевать под эту величину. Таким образом, подводя итог нашим результатам, получаем:

Даже последний член в последней формуле оказывается пренебрежимо малым, и мы могли бы опустить его на том основании, что он имеет лишь порядок Однако для осторожности мы все же удержим его на некоторое время.

Теперь мы получим из (5.3) средние числа заполнения

Первый член равен нулю в силу (6.14). (Нам следовало, конечно, принять во внимание неявную зависимость от Рассматривая последний член, введем среднюю энергию

которая не меняется при предельном переходе Тогда (6.15) принимает вид:

Следовательно, последний член в (6.18) при предельном переходе является также постоянным, и мы получаем (полагая, согласно намеченному плану, все равными единице):

Если учесть (6.19) и положить все равными 1, то уравнение (6.14), определяющее может быть написано следующим образом:

Если мы положим

то последние два уравнения будут тождественными копиями основного соотношения (2.6), исходя из которого мы начали построение термодинамической теории. Отличие состоит лишь в том, что средние значения заменены теперь наиболее вероятными значениями. Наша играет роль статистической суммы, таким образом, мы можем теперь утверждать, что мы обосновали теорию новым, независимым способом.

Посмотрим теперь, что дает (5.4) для флуктуаций. Используя (6.18), образуем

Первый член не дает здесь ничего, так как Уравнение (6.14) следует считать выполняющимся тождественно относительно Последний член может быть опущен, так как согласно (6.20) он имеет «нулевой порядок» относительно и члены, имеющие порядок окажутся преобладающими. Дифференцируя средний член, мы снова должны принять во внимание, что зависит от (хотя, как правило, не очень сильно и согласно (6.14) и (6.19) независящим от N образом). Мы получаем:

Полагая все и равными единице и пользуясь (6.14), (6.19) и (6.21), без труда получаем:

Поскольку в квадратных скобках несомненно нет членов, имеющих порядок среднее квадратичное отклонение если и не является в точности «нормальным», то во всяком случае имеет «нормальный порядок», т. е. порядок Таким образом, относительная флуктуация стремится к нулю, когда N и все стремятся к бесконечности. Распределение становится бесконечно острым. Средние значения, наиболее вероятные значения и вообще любые значения с неисчезающей вероятностью — все становятся одними и теми же.

Можно, впрочем, дать среднему члену в (6.24) точную оценку. Это довольно поучительно, хотя и не имеет особенно важного значения. Этот член оказывается всегда отрицательным. Для этой цели представляется несколько более удобным перейти от величин к величинам или Т, пользуясь соотношением (6.23):

Тогда

Эта зависимость от одного из вычисляется из (6.14), которое может быть переписано в виде:

При этом подразумевается, что U = const. Следовательно,

где мы полагаем для краткости

Далее, варьируя только и одну из величин

Тогда

Отсюда мы легко получаем:

Принимая во внимание смысл входящих сюда величин, можно написать:

Таким образом из (6.24) получаем:

Будем называть дисперсию нормальной, если средний член равен нулю. Это имеет место для уровней, достигающих средней энергии Во всех прочих случаях дисперсия является, субнормальной.

Одной из привлекательных сторон статистической термодинамики является то, что величины и функции, введенные первоначально как чисто математические понятия, почти неизменно приобретают фундаментальный физический смысл. Примером этого являлись множитель Лагранжа максимум статистическая сумма (или функция распределения). Каков же смысл Р? Мы установим его, рассмотрев выражение (6.17). Откинем последний член этого выражения как малый, используем обозначения (6.19) и (6.23) и, вспомнив, что получим

Тогда

будет энтропией отдельной системы. Этот результат уже сам по себе достаточно интересен, однако он оказывается еще более заслуживающим внимания, если вернуться на некоторое время ко второй главе и вычислить логарифм максимума Р (мы могли сделать это там же, но не воспользовались этой возможностью). Из (2.2) и формулы Стирлинга имеем:

Пользуясь величинами соответствующими «максимуму», —

и логарифмируя их:

получим

и, далее,

Умножая на и вспоминая, что получим:

Сравнивая это с (6.25), видим, что энтропия может быть вычислена с равным успехом либо как либо как Дело в том, что хотя число тех Р, которые сравнимы с Ртах, и очень велико, оно, тем не менее, исчезающе мало по сравнению с величиной самого . Следовательно, разница логарифмов исчезающе мала. На это обстоятельство указал Г. А. Лорентц в своем знаменитом мемуаре «Нечувствительность термодинамических функций».

Существуют и другие статистические аналогии энтропии, не имеющие, однако, столь общей применимости. Понятие энтропии, выведенное из статистической суммы, приложимо к любой системе как большой, так и малой, как к отдельному осциллятору, так и к газу, твердому телу или гетерофазной системе.

Один из аналогов, на котором следует остановиться (указанный В. Гиббсом), предполагает, что система, будучи помещена в тепловой резервуар, обнаруживает лишь малые флуктуации энергии, что, как мы знаем, свойственно любой большой системе. Заняты лишь уровни, весьма близкие к средней энергии Но что же показывает статистическая сумма

Поскольку расположены в арифметическом порядке, экспоненты непрерывно убывают. А ведь они являются мерой частоты заполнения! На первый взгляд кажется удивительным — как может возникнуть острый максимум, да и почему он вообще возникает?

Объяснение этого кроется в характере увеличения при увеличении а именно — в том, что по мере передвижения по ряду это увеличение становится все более и более медленным, притом с чудовищно возрастающим замедлением. Другими словами, число уровней, приходящихся на единичное приращение т. е. плотность уровней колоссально возрастает. Максимум возникает в результате компромисса между возрастающей плотностью уровней и убыванием экспонент.

Обсудим результат с этой точки зрения. Мы можем рассматривать как функцию индекса I, т. е. как , следовательно, также и I как функцию выражающую число уровней, достигших предела е. Рассмотрим теперь

где — средняя энергия (отклонения от которой очень малы). Тогда

является энтропией.

Нетрудно разобраться в том, что это значит; однако приведем сначала еще одно определение энтропии. Выберем какое-нибудь подходящее малое приращение и соберем вместе все уровни, лежащие внутри этого приращения, обозначив их число через . Тогда статистическая сумма может быть написана в виде:

где — значение энергии внутри интервала Мы можем также написать

Область максимального заполнения, т. е. область, в которой определяется максимумом подынтегральной функции или, если угодно, ее логарифма

Итак,

Отсюда, разумеется, следует, что

играет роль энтропии.

Причина, по которой мы можем брать саму функцию вместо

заключается в том, что практически возрастает всегда как чрезвычайно высокая степень

Как видно, практически разницы нет никакой.

Мне хотелось бы указать путь к интуитивному пониманию причины экспоненциальной зависимости частоты заполнения от в условиях теплового резервуара.

Пусть и т.д. суть энергетические уровни системы, и т.д. — уровни теплового резервуара. Тогда полная энергия (сумма энергии системы и энергии резервуара) будет постоянной, а уровни объединенного целого (т. е. системы и резервуара) будут равны

Поскольку полная энергия постоянна, обмен происходит только между вырожденными уровнями, т. е. в случае

(«почти» — ввиду наличия энергии связи!). Все эти уровни для всех комбинаций имеют, конечно, равную частоту заполнения, что попросту означает равную априорную вероятность для любого отдельного уровня. Причина уменьшения частоты заполнения для более высоких заключается в том, что число уровней теплового резервуара, обозначаемых через

экспоненциально убывает с уменьшением т. е. с уменьшением энергии, приходящейся на долю теплового резервуара. Это становится совершенно ясным в случае, когда число уровней резервуара равно, например,

Этот вывод не претендует на строгость (строгий вывод был дан ранее), однако он поясняет суть дела: чем больше часть общей энергии которая приходится на долю самой системы тем

меньше приходится на долю теплового резервуара. А это экспоненциальным образом уменьшает число используемых уровней теплового резервуара (даже в случае бесконечного теплового резервуара или, вернее, именно в этом случае). Характеризующий это уменьшение экспоненциальный множитель является не чем иным, как уже знакомым нам соответствующим членом статистической суммы, другими словами, относительной вероятностью нахождения нашей системы в состоянии условиях теплового резервуара.

<< Предыдущий параграф

Следующий параграф >>

Оглавление