11.3. Преимущества перекрестных оптических схем
11.3.1. Проблемы параллельной обработки
Предложено много способов достижения параллелизма обработки [1] (рис. 11.1). При проработке предложенных быстродействующих устройств соответственно рассматривались возникающие при этом трудности. Распределение загрузки между рядом процессоров не снимает требования иметь хотя бы минимальный уровень централизованного управления. При этом также необходимы и соответствующие каналы связи с центральным запоминающим устройством.
Распределение ресурсов памяти между процессорами может привести к возникновению конфликтных ситуаций, когда два или более процессора запрашивают информацию из одного и того же места. Разрешение конфликтной ситуации дополнительно увеличивает сложность, цену и неэффективность выполняемых вычислений. Простой пример такой ситуации можнр привести из области умножения матрицы на матрицу, где для одновременного умножения на каждый из столбцов второй матрицы должна одновременно присутствовать во всех процессорах одна и та же строка первой матрицы. В подобных ситуациях, для того чтобы избежать конфликтной ситуации с запоминающим устройством, может использоваться стратегия запрограммированного потока данных, которая предусматривает переключение потока данных.
На практике на основе имеющегося опыта требуется разбить задачу на отдельные ступени таким образом, чтобы различные процессоры завершали свои задания в подходящие моменты времени, обеспечивая информацией следующие ступени обработки. При этом система синхронизации заставляет дожидаться окончания работы наиболее медленных звеньев, вызывая неэффективную работу всего вычислительного устройства
в целом. Для того чтобы так или иначе, избавить пользователя от этого негативного обстоятельства, требуются соответствующие программные средства. А именно, необходимы специальные алгоритмы параллельной работы, устойчивость и точность которых следует сравнить с последовательными алгоритмами.
Рис. 11.1. (см. скан) Типы параллельных архитектур. П — процессор; ЗУ — запоминающее устройство; ПК — переключатель
Процедура вычислений, связь с устройствами ввода-вывода, внутрипроцессорная связь — все это должно быть приведено в соответствие с имеющимися ресурсами с целью их оптимального использования; при этом существенную роль играет их относительная цена. Это выполняется с помощью тщательного подбора процессора, канала связи с соответствующей полосой частот и объема локальной памяти в каждом процессоре. В этом случае также может оказаться полезной компиляция процедур языка высокого уровня в язык низкого уровня обработки потока данных, что облегчает распределение нагрузки.