модель выбирают так чтобы результаты эксперимента можно было распространить на явление
Модель выбирают так чтобы результаты эксперимента можно было распространить на явление
Введение в психологическое исследование
Экспериментальная психология как самостоятельная наука.
Применение экспериментального метода к исследованию психических явлений в конце XIX в. сыграло решающую роль в становлении психологии как самостоятельной науки и выделении ее из философии. В этот период вся научная психология была экспериментальной. В дальнейшем в связи с накоплением психологических знаний произошла дифференциация научных областей психологии в соответствии с предметом их изучения, а экспериментальная психология стала пониматься лишь как общее обозначение различных видов исследований психических явлений посредством экспериментальных методов.
В.В. Никандров отмечает, что в настоящее время сложилась весьма непростая ситуация с определением границ экспериментальной психологии и ее места в системе психологических знаний. Ею утрачен статус самостоятельной науки.[1] На эту ситуацию обращал внимание еще Б.Г. Ананьев. Он указывал, что, с одной стороны, казалось бы, имеется фундаментальная наука о методах психологического исследования, достижениями которой могут пользоваться все частные разделы психологии. Но, с другой стороны, систематическое и неизбежное делегирование своих «полномочий» другим дисциплинам раздробило экспериментальную психологию, и ее отдельные разделы начали самостоятельную жизнь в частных психологических науках.[2]
В современных психологических словарях и справочниках, определяющих понятие «экспериментальная психология», как правило, подчеркивается относительная несамостоятельность этой научной дисциплины и отсутствуют указания на ее предмет. Например, в наиболее авторитетном «Психологическом словаре» дается следующее определение:
«Экспериментальная психология – общее наименование областей и разделов психологии, в которых эффективно применяется метод лабораторного эксперимента».[3]
Еще отчетливее эти тенденции звучат в другом определении: «Экспериментальная психология – общее обозначение различных видов исследования психических явлений посредством экспериментальных методов».[4] Аналогичное понимание экспериментальной психологии существует и в зарубежной психологии. П. Фресс определяет экспериментальную психологию следующим образом: «Экспериментальная психология представляет собой знания, приобретенные в психологии посредством применения экспериментального метода».[5] В некоторых определениях говорится о необходимости разработки методов в рамках экспериментальной психологии: «Экспериментальная психология – 1) область психологического знания, связанная с экспериментальными исследованиями психики. В экспериментальной психологии разрабатываются методы организации и проведения психологического эксперимента, а также методы обработки и анализа его результатов; 2) экспериментальный раздел общей психологии».[6]
В.Н. Дружинин выделяет несколько подходов к пониманию предмета экспериментальной психологии.
1. Экспериментальная психология как подлинно научная психология, базирующаяся на естественно-научном подходе к изучению психических явлений в противоположность философской, интроспективной психологии и другим видам психологического знания. Представителями данного подхода являются В. Вундт, С. Стивенс, П. Фресс, Ж. Пиаже и др. «Этот (экспериментальный) метод познания существенно отличается от метода философии, который основывается на очевидности положений и требований рефлективного мышления. Рассуждения в философии подчиняются законам мышления, тогда как в науке (экспериментальной психологии) этот контроль обеспечивается эмпирической проверкой».[7]
2. Экспериментальная психология как система методов и методик, реализованных в конкретных исследованиях. Представители: Г.И. Челпанов, Р. Готтсданкер и др. Р. Готтсданкер полагает, что экспериментальная психология – это наука об экспериментальных методах, которые могут применяться в любой из частных предметных областей психологии (психологии сенсорных процессов, психологии научения или психологии социального воздействия). Поэтому вся экспериментальная психология носит методический характер.[8]
3. Экспериментальная психология как теория психологического эксперимента, которая базируется на общенаучной теории эксперимента и в первую очередь включает планирование и обработку данных. Представители: Д. Кэмпбелл, Ф. Дж. МакГиган и др. Д. Кэмпбелл отмечает, что одним из важных в психологии являются «. вопросы планирования экспериментов, создание моделей экспериментов в соответствии с требованиями валидности научного знания.».[9]
4. Экспериментальная психология как область, которая занимается изучением проблем методов психологического исследования в целом. Представители: В.Н. Дружинин, Д. Мартин, Р. Солсо, Х. Джонсон, М. Бил, Т.В. Корнилова и др. В.Н. Дружинин подчеркивает, что предметом экспериментальной психологии является не только экспериментальный метод, но и другие виды теоретического и эмпирического знания в психологии.[10]
Именно этого понимания экспериментальной психологии мы будем придерживаться в дальнейшем изложении. Следует отметить, что при указанном подходе «эксперимент» понимается в самом широком объеме как любой метод психологического исследования, любой эмпирический метод. Несмотря на то что термины «эксперимент» и «эмпирия (эмпирика)» переводятся с греческого одинаково – опыт, значения их в современной науке разные. В понятии «эксперимент» опыт рассматривается как конкретный прием исследования в точно учитываемых условиях. В понятии «эмпирика» опыт понимается как общая совокупность накопленных знаний и умений. Отсюда эмпирический метод – это любой способ получения фактических данных о действительности, основанный на человеческом опыте. Таким образом, если принять широкое толкование понятия «эксперимент», то экспериментальную психологию скорее следовало бы поименовать «эмпирической психологией». Однако в психологии термин «эмпирическая психология» имеет уже свое значение и свою историю, что не позволяет повторно использовать его в другом значении.
Тем не менее в круг интересов экспериментальной психологии входит все большее число неэкспериментальных исследовательских приемов. И сейчас сложилась определенная традиция понимать эксперимент как частный метод эмпирического познания, а экспериментальную психологию – как совокупность множества эмпирических методов. Поскольку многие (если не большинство) эмпирических методов психологии естественным образом включают в себя измерительные процедуры и анализ результатов измерения, то в область компетенции экспериментальной психологии входят теперь и теория измерений, и знания по обработке (в первую очередь статистической) эмпирических данных.
В.В. Никандров подчеркивает, что «если говорить об экспериментальной психологии не только как о совокупности исследований психической жизни с помощью экспериментальных методов, но и как о науке, разрабатывающей эти методы, то мы сталкиваемся с проблемами теоретической проработки исследовательских приемов».[11] Ведь любой исследовательский метод есть практическая реализация принципов данной науки. А принципы – это основополагающее начало любой теории, концепции. Таким образом, каждый метод нуждается в подведении общетеоретической базы. С другой стороны, любой метод есть система процедур, операций, алгоритмов действий, формализованных правил сбора, анализа и обработки информации. Обычно эти операции и правила объединяются понятием «методика». Разработка всей методической системы есть непростая теоретическая работа, которая и совершается в рамках экспериментальной психологии.
Промышленная аналитика
Планирование эксперимента
Планирование экспериментов чрезвычайно важно в анализе промышленных данных.
Эти методы незаменимы в химической, металлургической, нефтедобывающей и нефтеперерабатывающей промышленности и других отраслях, см. например.
Современная высокоразвитая теория планирования эксперимента объединяет разнообразные аналитические процедуры, позволяющие за минимальное число опытов получить максимальную информацию об изучаемом физическом или технологическом процессе, свойствах материалов, явлении.
Важными являются следующие положения:
Решаемые методами планирования эксперимента задачи разнообразны:
Задачи поиска оптимальных условий являются одними из наиболее распространенных на практике и требуют постоянных творческих усилий.
Выбор оптимального состава многокомпонентных смесей или сплавов, повышение производительности действующих установок, повышение качества продукции, снижение затрат на ее получение – примеры задач оптимизации.
Для начального описания объекта исследования удобно использовать понятие «черного ящика».
Мы не можем заглянут внутрь ящика, однако можем управлять внешними воздействиями и наблюдать отклик на эти воздействия.
Для проведения эксперимента необходимо воздействовать на поведение «черного ящика».
Все способы такого воздействия мы называем факторами, их называют также входом черного ящика, см. стрелки слева.
На выходе получаются стрелки справа.
При решении задач используется модель объекта или уравнение:
.
Предполагается, что каждый фактор имеет определенное число дискретных уровней.
Фиксированный набор уровней факторов определяет одно из возможных состояний черного ящика.
Если перебрать все возможные наборы, то получим полное множество различных состояний данного «ящика».
Одновременно это будет число возможных различных опытов в постановке задачи планирования эксперимента.
Естественно считать, что число различных состояний определяет сложность данной системы.
Зная сложность, мы сможем оценить число различных опытов в нашей задаче.
Чтобы узнать число различных состояний, достаточно число уровней факторов (если оно для всех факторов одинаково) возвести в степень числа факторов k: p k , где p – число уровней.
Простая система с пятью факторами на пяти уровнях имеет 3125 состояний, а для десяти факторов на четырех уровнях их уже свыше миллиона!
В этих условиях мы просто вынуждены отказаться от таких экспериментов, которые включают все возможные опыты.
Возникает вопрос, сколько и каких опытов надо включить в эксперимент, чтобы решить поставленную задачу?
Здесь приходит на помощь планирование эксперимента.
Укажем два основных требования этой теории.
Прежде всего, важно ответить на вопрос, воспроизводятся на объекте результаты эксперимента или нет.
Выберем некоторые уровни для всех факторов и в этих условиях проведем эксперимент.
Затем повторим его несколько раз через неравные промежутки времени и сравним значения параметра оптимизации.
Разброс этих значений характеризует воспроизводимость результатов.
Если разброс не превышает некоторой, заранее заданной величины (наших требований к точности эксперимента), то объект удовлетворяет требованию воспроизводимости.
Планирование эксперимента предполагает активное вмешательство в процесс и возможность выбора в каждом опыте тех уровней факторов, которые представляют интерес.
Такой эксперимент называется активным.
Объект, на котором возможен активный эксперимент, называется управляемым.
На реальный объект обычно действуют как управляемые, так и неуправляемые факторы.
Неуправляемые факторы влияют на воспроизводимость эксперимента и являются причиной ее нарушения.
Если требования воспроизводимости не выполняются, приходится обращаться к активно-пассивному эксперименту.
Возможно, плохая воспроизводимость объясняется действием фактора, систематически изменяющегося (дрейфующего) во времени.
В этих случаях необходимо обращаться к специальным методам планирования.
Планирование экстремального эксперимента – это метод выбора количества и условий проведения опытов, минимально необходимых для отыскания оптимальных условий, т.е. для решения поставленной задачи.
При оптимизации распространен так называемый детерминированный подход, который широко используется, например, в химии.
Детерминированный подход предполагает построение физической модели процесса на основании тщательного изучения механизма явления (например, кинетики, гидродинамики).
Такой подход позволяет получить математическую модель объекта в виде системы дифференциальных уравнений.
Детерминированный и статистический подходы дополняют друг друга.
После того как выбран объект исследования и параметр оптимизации, нужно включить в рассмотрение все существенные факторы, которые потенциально могут влиять на технологический процесс.
Например, если мы оптимизируем расход газа или электроэнергии в металлургии, то нужно учесть также условия внешней среды, температуру, скорость и направление ветра.
Если какой-либо существенный фактор окажется неучтенным, то это может привести к неадекватности модели.
Если неучтенный фактор произвольно флуктуировал – принимал случайные значения и не контролировался, – это значительно увеличит ошибку опыта.
При поддержании фактора на некотором фиксированном уровне может быть получено ложное представление об оптимуме, так как нет гарантии, что фиксированный уровень является оптимальным.
Фактором называется измеряемая переменная величина, принимающая в некоторый момент времени определенное значение.
Факторы соответствуют способам воздействия на объект исследования.
Факторы разделяются на количественные и качественные.
Качественные факторы – это разные вещества, разные технологические способы, аппараты, исполнители и т.д.
Хотя качественным факторам не соответствует числовая шкала в том смысле, как это понимается для количественных факторов, однако можно построить условную порядковую шкалу, которая ставит в соответствие уровням качественного фактора числа натурального ряда, т.е. производит кодирование.
Порядок уровней может быть произволен, но после кодирования он фиксируется.
В ряде случаев граница между понятием качественного и количественного фактора условна.
Например, при изучении воспроизводимости результатов химического анализа надо установить влияние положения тигля с навеской в муфельной печи.
Можно разделить под печи на квадраты и считать номера квадратов уровнями качественного фактора, определяющего положение тигля.
Вместо этого можно ввести два количественных фактора – ширину и длину пода печи. Качественным факторам не соответствует числовая шкала, и порядок уровней факторов не играет роли.
При планировании эксперимента факторы должны быть управляемыми. Это значит, что экспериментатор, выбрав нужное значение фактора, может его поддерживать постоянным в течение всего опыта, т.е. может управлять фактором.
В этом состоит особенность «активного» эксперимента.
Чтобы точно определить фактор, нужно указать последовательность действий (операций), с помощью которых устанавливаются его конкретные значения (уровни).
Такое определение фактора будем называть операциональным.
Если фактором является давление в некотором аппарате, то совершенно необходимо указать, в какой точке и с помощью какого прибора оно измеряется и как оно устанавливается.
Точность замера факторов должна быть возможно более высокой. Степень точности определяется диапазоном изменения факторов.
При изучении процесса, который длится десятки часов, нет необходимости учитывать доли минуты, а в быстрых процессах необходимо учитывать, быть может, доли секунды.
Факторы должны быть непосредственными воздействиями на объект. Факторы должны быть однозначны. Трудно управлять фактором, который является функцией других факторов.
Но в планировании могут участвовать сложные факторы, такие, как соотношения между компонентами, их логарифмы и т.п.
Необходимость введения сложных факторов возникает при желании представить динамические особенности объекта в статической форме.
Пусть, например, требуется найти оптимальный режим подъема температуры в реакторе. Если относительно температуры известно, что она должна нарастать линейно, то в качестве фактора вместо функции (в данном случае линейной) можно использовать тангенс угла наклона, т.е. градиент.
Положение усложняется, когда исходная температура не зафиксирована. Тогда ее приходится вводить в качестве еще одного фактора.
Для более сложных кривых пришлось бы ввести большее число факторов (производные высоких порядков, координаты особых точек и т.д.).
Поэтому целесообразно пользоваться сложным качественным фактором – номером кривой. Различные варианты кривых рассматриваются в качестве уровней. Это могут быть разные режимы термообработки сплавов, переходные процессы в системах управления и т.д.
При планировании эксперимента обычно одновременно изменяется несколько факторов. Поэтому очень важно сформулировать требования, которые предъявляются к совокупности факторов. Прежде всего, выдвигается требование совместимости.
Совместимость факторов означает, что все их комбинации осуществимы и безопасны. Это важное требование.
Представьте себе, что вы поступили легкомысленно, не обратили внимания на требование совместимости факторов и запланировали такие условия опыта, которые могут привести к взрыву установки или осмолению продукта. Согласитесь, что такой результат очень далек от целей оптимизации.
Несовместимость факторов может наблюдаться на границах областей их определения. Избавиться от нее можно сокращением областей.
Положение усложняется, если несовместимость проявляется внутри областей определения.
Одно из возможных решений – разбиение на подобласти и решение двух отдельных задач.
При планировании эксперимента важна независимость факторов, т.е. возможность установления фактора на любом уровне вне зависимости от уровней других факторов.
Если это условно невыполнимо, то невозможно планировать эксперимент. Итак, мы подошли ко второму требованию – отсутствию корреляции между факторами.
Требование некоррелированности не означает, что между значениями факторов нет никакой связи. Достаточно, чтобы связь не была линейной.
Под моделью в теории планирования эксперимента понимается функция отклика
Выбрать модель – значит выбрать вид этой функции, записать ее уравнение.
Тогда останется спланировать и провести эксперимент для оценки численных значений констант (коэффициентов) этого уравнения.
Построим геометрический аналог функции отклика – поверхность отклика.
Для наглядности рассмотрим эксперимент с двумя факторами.
Заметим, что в случае многих факторов геометрическая наглядность теряется. Мы попадаем в абстрактное многомерное пространство, в котором у человека нет навыков ориентирования, приходится переходить на язык алгебры.
Итак, мы хотим изобразить геометрически возможные состояния «черного ящика» с двумя входами. Для этого достаточно располагать плоскостью с обычной Декартовой системой координат.
По одной оси координат будем откладывать в некотором масштабе значения (уровни) одного фактора, а по другой оси – второго.
Тогда каждому состоянию «ящика» будет соответствовать точка на плоскости.
Для факторов существуют области определения.
Это значит, что у каждого фактора есть минимальное и максимальное возможные значения, между которыми он может изменяться либо непрерывно, либо дискретно.
Если факторы совместимы, то границы образуют на плоскости некоторый прямоугольник, внутри которого лежат точки, соответствующие состояниям «черного ящика».
Пунктирными линиями на рисунке обозначены границы областей определения каждою из факторов, а сплошными – границы их совместной области определения.
Чтобы указать значение параметра оптимизации, требуется еще одна ось координат. Пространство, в котором строится поверхность отклика, мы будем называть факторным пространством. Оно задается координатными осями, по которым откладываются значения факторов и параметра оптимизации.
Размерность факторного пространства зависит от числа факторов.
При многих факторах поверхность отклика уже нельзя изобразить наглядно и приходится ограничиваться только алгебраическим языком.
Но для двух факторов можно даже не переходить к трехмерному пространству, а ограничиться плоскостью.
Для этого достаточно произвести сечение поверхности отклика плоскостями, параллельными плоскости X1OX2 и полученные в сечениях линии спроектировать на эту плоскость.
Каждая линия соответствует постоянному значению параметра оптимизации. Такая линия называется линией равного отклика.
За отказ от полного перебора состояний надо чем-то платить.
Цена – это предположения, которые мы должны сделать относительно свойств неизвестной нам модели до начала эксперимента.
Главное предположение – это непрерывность поверхности, ее гладкость и наличие единственного оптимума (быть может, и на границе области определения факторов).
Эти постулаты позволяют представить изучаемую функцию в виде степенного ряда в окрестности любой возможной точки факторного пространства (такие функции в математике называются аналитическими).
Кроме того, если мы придумаем какой-то способ постепенного приближения к оптимальной точке, нужно, чтобы результат не зависел от исходной точки.
Так как мы заранее считаем, что предпосылки выполняются, то надо максимально использовать возможности, которые при этом открываются.
Если, например, мы будем знать значения параметра оптимизации в нескольких соседних точках факторного пространства, мы сможем (в силу гладкости и непрерывности функции отклика) представить себе результаты, которые можно ожидать в других соседних точках.
Следовательно, можно найти такие точки, для которых ожидается наибольшее увеличение (или уменьшение, если мы ищем минимум) параметра оптимизации. Тогда ясно, что следующий эксперимент надо переносить именно в эти точки.
Надо продвигаться в этом направлении, пренебрегая остальными. Сделав новый эксперимент, снова можно оценить направление, в котором следует двигаться. В силу единственности оптимума мы, таким образом, рано или поздно непременно его достигнем. Это и есть шаговый принцип.
Мы выбираем в факторном пространстве какую-то точку и рассматриваем множество точек в ее окрестности, т.е. выбираем в области определения факторов малую подобласть.
Здесь мы хотим провести эксперимент, на основании которого должна быть построена первая модель, которую мы хотим использовать для предсказания результатов опытов в тех точках, которые не входили в эксперимент.
Если эти точки лежат внутри нашей подобласти, то такое предсказание называется интерполяцией, а если вне – экстраполяцией.
Чем дальше от области эксперимента лежит точка, для которой мы хотим предсказать результат, теме меньшей уверенностью это можно делать.
Поэтому мы вынуждены экстраполировать вне небольшой окрестности и использовать результаты экстраполяции для выбора условий проведения следующего эксперимента, далее цикл повторяется.
Попутно полученную модель можно использовать для проверки различных гипотез о механизме изучаемого явления или о его отдельных сторонах. Например, если вы предполагаете, что увеличение значения некоторого фактора должно приводить к увеличению значения параметра оптимизации, то с помощью модели можно узнать, так ли это.
Такая проверка называется интерпретацией модели.
Исходя из выбранной стратегии, ясно, что главное требование к модели – это способность предсказывать направление дальнейших опытов, причем предсказывать с требуемой точностью. Так как до получения модели мы не знаем, какое направление нам понадобится, то естественно требовать, чтобы точность предсказания во всех возможных направлениях была одинакова.
Это значит, что в некоторой подобласти, в которую входят и координаты выполненных опытов, предсказанное с помощью модели значение отклика не должно отличаться от фактического больше чем на некоторую заранее заданную величину.
Модель, которая удовлетворяет такому или какому-либо аналогичному требованию, называется адекватной. Проверка выполнимости этого требования называется проверкой адекватности модели.
Если несколько различных моделей отвечают нужным требованиям, то следует предпочесть ту из них, которая является самой простой.
Фактически мы произвели выбор класса моделей. Мы сказали, что всегда, когда это возможно, будем искать модель среди полиномов.
Построение полинома возможно в окрестностях любой точки факторного пространства, поскольку мы предположили, что функция является аналитической.
Мы представили неизвестную нам функцию отклика полиномом. Операция замены одной функции другой в каком-то смысле эквивалентной функцией называется аппроксимацией.
Вопрос: полином какой степени следует взять на первом шаге?
Эксперимент нужен только для того, чтобы найти численные значения коэффициентов полинома.
Поэтому чем больше коэффициентов, тем больше опытов окажется необходимым. А мы стремимся сократить их число.
Следовательно, надо найти такой полином, который содержит как можно меньше коэффициентов, но удовлетворяет требованиям, предъявленным к модели. Чем ниже степень полинома при заданном числе факторов, тем меньше в нем коэффициентов.
Мы хотим, чтобы модель хорошо предсказывала направление наискорейшего улучшения параметра оптимизации.
Такое направление называется направлением градиента. Ясно, что движение в этом направлении приведет к успеху быстрее, чем движение в любом другом направлении (это значит, что будет достигнута экономия числа опытов).
Полином первой степени – линейная модель – это то, что нам нужно.
С одной стороны, он содержит информацию о направлении градиента, с другой – в нем минимально возможное число коэффициентов при данном числе факторов.
Единственное опасение в том, что неясно, будет ли линейная модель всегда адекватной. Ответ зависит еще и от объекта.
Вопрос в том, как выбрать подобласть в факторном пространстве, чтобы линейная модель оказалась адекватной.
Размер такой области заранее не известен, но адекватность можно проверять по результатам эксперимента. Значит, выбрав сначала произвольную подобласть, мы, рано или поздно, найдем требуемые размеры, далее воспользуемся движением по градиенту.
На следующем этапе мы будем искать линейную модель уже в другой подобласти. Цикл повторяется до тех пор, пока движение по градиенту не перестанет давать эффект.
Это значит, что мы попали и область, близкую к оптимуму. Такая область называется «почти стационарной». Здесь линейная модель уже не нужна. Либо попаданием в почти стационарную область задача решена, либо надо переходить к полиномам более высоких степеней, например второй степени, чтобы подробнее описать область оптимума.
Удачный выбор подобласти имеет большое значение для успеха всей работы. Он связан с интуитивными решениями, которые принимает экспериментатор на каждом этапе.
Кроме задачи оптимизации, иногда возникает задача построения интерполяционной модели. В этом случае нас не интересует оптимум.
Просто мы хотим предсказывать результат с требуемой точностью во всех точках некоторой заранее заданной области. Тут не приходится выбирать подобласть.
Необходимо последовательно увеличивать степень полинома до тех пор, пока модель не окажется адекватной. Если адекватной оказывается линейная, или неполная квадратная модель (без членов, содержащих квадраты факторов), то ее построение аналогично тому, что требуется для оптимизации.
Как выбрать локальную область факторного пространства, где ее выбирать и какого размера она должна быть?
Это важный этап принятия неформализованных решений, предшествующих построению плана первой серии эксперимента.
Весь процесс исследования можно считать состоящим из последовательности этапов, часть из которых полностью формализованы, а часть требуют «интуитивных» решений. Причем, по мере развития теории, формальные этапы будут играть все большую роль, но до конца не вытеснят неформализованные этапы.
При выборе области эксперимента должны учитываться следующие соображения.
Прежде всего, надо оценить границы областей определения факторов. При этом должны учитываться ограничения нескольких типов.
Первый тип: принципиальные ограничения для значений факторов, которые не могут быть нарушены ни при каких обстоятельствах. Например, если фактор – температура, то нижним пределом будет абсолютный нуль.
Второй тип – ограничения, связанные с технико-экономическими соображениями, например, со стоимостью сырья, дефицитностью отдельных компонентов, временем ведения процесса.
Третий тип ограничений, с которым чаще всего приходится иметь дело, определяется конкретными условиями проведения процесса, например, существующей аппаратурой, технологией, организацией. В реакторе, изготовленном из некоторого материала, температуру нельзя поднять выше температуры плавления этого материала или выше рабочей температуры данного катализатора.
Оптимизация обычно начинается в условиях, когда объект уже подвергался некоторым исследованиям. Информацию, содержащуюся в результатах предыдущих исследований, будем называть априорной (т.е. полученной до начала эксперимента).
Мы можем использовать априорную информацию для получения представления о параметре оптимизации, о факторах, о наилучших условиях ведения процесса и характере поверхности отклика, т.е. о том, как сильно меняется параметр оптимизации при небольших изменениях значений факторов, а также о кривизне поверхности.
Для этого можно использовать графики (или таблицы) однофакторных экспериментов, осуществлявшихся в предыдущих исследованиях или описанных в литературе.
Если однофакторную зависимость нельзя представить линейным уравнением (в рассматриваемой области), то в многомерном случае, несомненно, будет существенная кривизна. Обратное утверждение, к сожалению, не очевидно.
Итак, выбор экспериментальной области факторного пространства связан с тщательным анализом априорной информации.
Наилучшим условиям, определенным из анализа априорной информации, соответствует комбинация (или несколько комбинаций) уровней факторов. Каждая комбинация является многомерной точкой в факторном пространстве.
Ее можно рассматривать как исходную точку для построения плана эксперимента. Назовем ее основным (нулевым) уровнем. Построение плана эксперимента сводится к выбору экспериментальных точек, симметричных относительно нулевого уровня.
В разных случаях мы располагаем различными сведениями об области наилучших условий.
Если имеются сведения о координатах одной наилучшей точки и нет информации о границах определения факторов, то остается рассматривать эту точку в качестве основного уровня.
Аналогичное решение принимается, если границы известны и наилучшие условия лежат внутри области.
Положение усложняется, если эта точка лежит на границе (или весьма близко к границе) области.
Тогда приходится основной уровень выбирать с некоторым сдвигом от наилучших условий.
Может случиться, что координаты наилучшей точки неизвестны, но есть сведения о некоторой подобласти, в которой процесс идет достаточно хорошо. Тогда основной уровень выбирается либо в центре, либо в случайной точке этой подобласти.
Сведения о подобласти можно получить, анализируя изученные ранее подобные процессы, из теоретических соображений или из предыдущего эксперимента.
Наконец, возможен случай с несколькими эквивалентными точками, координаты которых различны. Когда отсутствуют дополнительные данные (технологического, экономического характера и т.д.), выбор произволен.
Конечно, если эксперимент недорог и требует немного времени, можно приступить к построению планов экспериментов вокруг нескольких точек.
Резюмируем наши рассуждения о принятии решений при выборе основного уровня в виде блок-схемы
После того как нулевой уровень выбран, переходим к следующему шагу – выбору интервалов варьирования.
Выбор интервалов варьирования
Теперь наша цель состоит в том, чтобы для каждого фактора выбрать два уровня, на которых он будет варьироваться в эксперименте.
Интервалом варьирования факторов называется некоторое число (свое для каждого фактора), прибавление которого к основному уровню дает верхний, а вычитание – нижний уровни фактора.
Другими словами, интервал варьирования – это расстояние на координатной оси между основным и верхним (или нижним) уровнем.
Таким образом, задача выбора уровней сводится к более простой задаче выбора интервала варьирования.
Заметим еще, что для упрощения записи условий эксперимента и обработки экспериментальных данных масштабы по осям выбираются так, чтобы верхний уровень соответствовал +1, нижний –1, а основной – нулю. Для факторов с непрерывной областью определения это всегда можно сделать с помощью преобразования
,
– кодированное значение фактора;
– натуральное значение фактора;
– натуральное значение основного уровня;
– интервал варьирования;
– номер фактора.
Для качественных факторов, имеющих два уровня, один уровень обозначается +1, а другой –1; порядок уровней не имеет значения.
На выбор интервалов варьирования накладываются естественные ограничения сверху и снизу. Интервал варьирования не может быть меньше той ошибки, с которой экспериментатор фиксирует уровень фактора. Иначе верхний и нижний уровни окажутся неразличимыми. С другой стороны, интервал не может быть настолько большим, чтобы верхний или нижний уровни оказались за пределами области определения. Внутри этих ограничений обычно еще остается значительная неопределенность выбора, которая устраняется с помощью интуитивных решений.
Обратите внимание, что при решении задачи оптимизации мы стремимся выбрать для первой серии экспериментов такую подобласть, которая давала бы возможность для шагового движения к оптимуму. В задачах же интерполяции интервал варьирования охватывает всю описываемую область.
Выбор интервалов варьирования – задача трудная, так как она связана с неформализованным этапом планирования эксперимента.
Возникает вопрос, какая априорная информация может быть полезна на данном этапе? Это – сведения о точности, с которой экспериментатор фиксирует значения факторов, о кривизне поверхности отклика и о диапазоне изменения параметра оптимизации.
Обычно эта информация является ориентировочной (в некоторых случаях она может оказаться просто ошибочной), но это единственная разумная основа, на которой можно начинать планировать эксперимент. В ходе эксперимента ее часто приходится корректировать.
Точность фиксирования факторов определяется точностью приборов и стабильностью уровня в ходе опыта. Для упрощения схемы принятия решений мы введем приближенную классификацию, полагая, что есть низкая, средняя и высокая точности.
Можно, например, считать, что поддержание температуры в реакторе с погрешностью не более 1% соответствует высокой, не более 5% – средней, а более 10% – низкой точности.
Источником сведений о кривизне поверхности отклика могут служить уже упоминавшиеся графики однофакторных зависимостей, а также теоретические соображения. Из графиков сведения о кривизне можно получить визуально.
Некоторое представление о кривизне дает анализ табличных данных, так как наличию кривизны соответствует непропорциональное изменение параметра оптимизации при равномерном изменении фактора.
Мы будем различать три случая: функция отклика линейна, функция отклика существенно нелинейна и информация о кривизне отсутствует.
Наконец, полезно знать, в каких диапазонах меняются значения параметра оптимизации в разных точках факторного пространства.
Если имеются результаты некоторого множества опытов, то всегда можно найти наибольшее или наименьшее значения параметра оптимизации.
Разность между этими значениями будем называть диапазоном изменения параметра оптимизации для данного множества опытов.
Условимся различать широкий и узкий диапазоны.
Диапазон будет узким, если он не существенно отличается от разброса значений параметра оптимизации в повторных опытах (этот разброс определяет ошибку опыта).
В противном случае будем считать диапазон широким. Учтем также случай, когда информация отсутствует.
Итак, для принятия решений используется априорная информация о точности фиксирования факторов, кривизне поверхности отклика и диапазоне изменения параметра оптимизации. Каждое сочетание градаций перечисленных признаков определяет ситуацию, в которой нужно принимать решение.
При принятых градациях возможно З3 = 27 различных ситуаций.
Теперь мы приблизились к принятию решения о выборе интервалов варьирования. Для интервалов также введем градацию. Будем рассматривать широкий, средний и узкий интервалы варьирования, а также случай, когда трудно принять однозначное решение. Размер интервала варьирования составляет некоторую долю от области определения фактора.
Можно, например, условиться о следующем: если интервал составляет не более 10% от области определения, считать его узким, не более 30% – средним, и в остальных случаях – широким. Это, конечно, весьма условно, и в каждой конкретной задаче приходится специально определять эти понятия, которые зависят не только от размера области определения, но и от характера поверхности отклика и от точности фиксирования факторов.
Перейдем к рассмотрению блок-схем принятия решений. На схеме представлены девять ситуаций, имеющих место при низкой точности фиксирования факторов.
При выборе решений учитываются информация о кривизне поверхности отклика и о диапазоне изменения параметра оптимизации. Типичное решение – широкий интервал варьирования, узкий интервал варьирования совершенно не используется, что вполне понятно при низкой точности.
Средний интервал варьирования в этой схеме выбирается дважды, причем в девятой ситуации как редко применяемая альтернатива. Здесь отсутствует информация об обоих признаках и выбор широкого интервала представляется более естественным.
Наибольшие трудности возникают, когда поверхность отклика является нелинейной. Появляется противоречие между низкой точностью фиксирования факторов и кривизной.
Первая требует расширения интервала, а вторая – сужения. Решение оказывается неоднозначным.
Возникает вопрос, как поступить в этом случае.
Приходится рассматривать дополнительные рекомендации (см. блок-схему).
Прежде всего, нужно выяснить, нельзя ли увеличить точность эксперимента либо за счет инженерных решений, либо за счет увеличения числа повторных опытов.
Если это возможно, то решения принимаются на основе блок-схемы для средней точности фиксирования факторов.
Если это невозможно, то для принятия решения нет достаточных оснований и оно становится интуитивным.
Эта блок-схема, как и последующие, служит весьма грубым приближением к действительности.
На практике учитывается ещё масса обстоятельств.
Например, решения, принимаемые по каждому фактору в отдельности, корректируются при рассмотрении совокупности факторов.
На рисунке изображена блок-схема для случая средней точности фиксирования фактора. Характерен выбор среднего интервала варьирования. Лишь в случае нелинейной поверхности и широкого диапазона рекомендуется узкий интервал варьирования.
При сочетаниях линейной поверхности с узким диапазоном и отсутствием информации о диапазоне выбирается широкий интервал варьирования.
Пунктиром, как и выше, показаны редко применяемые альтернативы.
Также построена блок-схема для случая высокой точности фиксирования фактора. Сочетание высокой точности с нелинейностью поверхности приводит к выбору узкого интервала.
Довольно часто выбирается средний интервал и лишь в двух случаях широкий. В обеих последних блок-схемах отсутствуют неоднозначные решения.
Полный факторный эксперимент
Первый этап планирования эксперимента для получения линейной модели основан на варьировании факторов на двух уровнях.
Если число факторов известно, можно сразу найти число опытов, необходимое для реализации всех возможных сочетаний уровней факторов.
В общем случае эксперимент, в котором реализуются всевозможные сочетания уровней факторов, называется полным факторным экспериментом.
Имеет место формула: , где N – число опытов, k – число факторов, 2 – число уровней.
Нетрудно написать все сочетания уровней в эксперименте с двумя факторами.
Напомним, что в планировании эксперимента используются кодированные значения факторов: +1 и –1 (часто для простоты записи единицы опускают).
Условия эксперимента можно записать в виде таблицы, где строки соответствуют различным опытам, а столбцы – значениям факторов.
Такие таблицы называются матрицами планирования эксперимента.
Матрица планирования для двух факторов имеет вид: