УДК 658.511.3
Инновационное развитие бизнеса. Статистика выводов в методике «Шесть ^гм»
ЖЕВНОВ ДЕНИС АНАТОЛЬЕВИЧ,
канд. техн. наук, доцент кафедры «Математика и информатика»
Барнаульского филиала Финансового университета при Правительстве Российской Федерации, Барнаул E-mail: [email protected]
Аннотация. Внедрение инновационных подходов и непрерывное совершенствование технологических процессов является залогом успешной деятельности любого предприятия. При этом наибольший успех имеют те изменения, необходимость осуществления которых детально проанализирована, а экономический эффект от внедрения заранее просчитан. Методика «Шесть сигм» обладает инструментами статистического анализа и контроля, способными выявить истинные причины болевых точек процесса и оценить степень их влияния на конечный результат. В данной статье на конкретных примерах показано, как с помощью статистики вводов можно повысить эффективность управленческих решений при оптимизации процессов.
Статистика выводов методики «Шесть сигм» базируется на использовании методов параметрической и непараметрической статистики, которые позволяют осуществить проверку гипотез о степени влияния различных факторов на выходные параметры процесса. К таким методам относится регрессионный анализ, дисперсионный анализ, сравнение центров и разбросов статистических выборок, оценка критерия х2. Результатом использования статистики выводов методики «Шесть сигм» является определение корневых причин несовершенства процессов, что позволяет, не распыляя ограниченные ресурсы, сфокусироваться на устранении ключевых проблем и достигнуть максимально возможного результата. Методика «Шесть сигм», обладающая комплексным набором инструментов повышения качества и снижения вариативности, уже много лет успешно применяется ведущими мировыми компаниями. Свое применение данная методика начинает находить и в России. Использование подхода «Шесть сигм» при совершенствовании процессов на российских предприятиях способствует повышению качества и конкурентоспособности отечественной продукции, росту ВВП и экономического потенциала страны. Ключевые слова: оптимизация процессов, статистика выводов, Шесть сигм,инновации.
Innovative Business Development. Statistical inference of Six Sigma
ZHEVNOV DENIS ANATOL'EVICH,
PhD in Engineering, associate professor with the Mathematics and IT chair,
the Barnaul Branch of the Financial University under the Government of the Russian Federation, Barnaul E-mail: [email protected]
Abstract. Implementation of innovative approaches and continuous improvement of technological processes is the reason for successful work of any enterprise. In addition, those changes are highly successful which are necessary to apply and the necessity is analyzed in detail. The economic effect of their realization has to be calculated beforehand. Six Sigma methodology has tools of statistical analysis and control which
can define true reasons of process problems and estimate the extent of their influence on final result. This paper demonstrates by using clear examples how it's possible to increase the effectiveness of management decisions in process optimization by means of statistical inference.
Statistical inference of Six Sigma is based on applying methods of parametric and nonparametric statistics which make it possible to check hypotheses about influence of different factors on output process parameters. Such methods are regression analysis, analysis of variance, comparison of centers and scatters of statistic sample, appraisal of x2.
The result of statistical inference of Six Sigma application is definition of true reasons of process defects. It enables to focus on removal of key problems and achieve the utmost result without wasting limited resources.
Six Sigma methodology has a complex set of tools for quality improvement and variety reduction. It has already been successfully applied for many years by the leading world companies. This methodology is begging to be realized in Russia. Applying Six Sigma approach during improvement process in Russian enterprises contributes to quality increase and competitiveness of domestic production, growth of GDP and economic potential of the country.
Key words: process optimization, statistical inference, Six sigma, innovations.
В современных реалиях эффективная деятельность предприятия невозможна без постоянных инновационных изменений, оптимизации процессов и улучшения сервисов. При этом необходимо осуществлять совершенствования, активно используя инструменты на стыке науки и бизнеса. В феврале 2014 г. на совещании с учеными-экономистами в Ново-Огарево, направленном на ускорение экономического роста, Президент России Владимир Путин отметил, что «должна быть разработана и заявлена внятная политика по мобилизации всех ресурсов для ускоренного роста», которая касается как повышения производительности труда, так и повышения эффективности экономики в целом [1]. Внедрение современных управленческих практик — важнейшее условие создания инновационного продукта, тех прорывных инноваций, которые могут вывести российскую экономику на современный уровень развития [2]. Одним из способов мобилизации внутренних ресурсов предприятий, повышения качества и снижения себестоимости продукции являются концепции «Лин» и «Шесть сигм», которые находят свое применение как в промышленных областях, так и в сфере обслуживания [3]. Методика «Шесть сигм» базируется на концепции постоянного совершенствования процессов и сокращении количества дефектов. Успешное использование инструментов «Шесть сигма»
крупнейшими предприятиями во всем мире уже доказало свою эффективность. Их применение может дать существенный импульс развитию российских предприятий.
В последнее время все больше российских компаний уделяют внимание совершенствованию процессов, инновационным проектам и улучшениям своей деятельности. При этом далеко не всегда это приносит ожидаемую выгоду. Любое предприятие хочет быть уверенным в том, что движется в верном направлении и осуществляемые инвестиции дадут реальный эффект. Для этого тиражированию изменений часто предшествуют пилотные проекты, по результатам которых принимается решение о полномасштабном внедрении. Однако затрачивая средства на улучшение внутренних процессов, технологий, сервисов и качества продукции, предприятия часто так и не получают желаемого результата. Причина этого часто кроется в том, что выводы по результатам замеров и пилотов (выборок) делаются касательно полномасштабного внедрения (популяции) без проверки гипотез с помощью статистических инструментов.
Несомненным достоинством методики «Шесть сигм» является использование статистики выводов, которая, базируясь на математическом аппарате, помогает добиться существенного улучшения процессов, сервисов и качества продукции. Статистика выводов
позволяет среди всего многообразия влияющих факторов увидеть истинные причины имеющихся проблем и сконцентрироваться на их устранении.
Успешно применять инструментарий статистики выводов помогает одна из самых простых и эффективных концепций «Шесть сигм», утверждающая, что «выход любого процесса зависит от того, что имеется на входе» [4]. С точки зрения данной методики любой процесс можно представить в виде зависимости того, что мы имеем на выходе (У), от исходных параметров на входе (X). Выразив результаты процесса в виде функции У = f(X1, X2, X3,...), становится возможным применить статистический аппарат к исследованию степени влияния различных факторов на конечный результат, а значит — существенно улучшить процесс и повысить его качество.
Рассмотрим, как тесты статистики выводов методики «Шесть сигм» с помощью проверки гипотез позволяют определить корневые причины проблем в текущих процессах и сервисах и сфокусироваться на их устранении.
Прежде всего необходимо выбрать показатель для улучшений У. В качестве данного критичного для качества показателя CTO (Critical To Quality — важный для бизнеса или клиента показатель, поддающийся измерению) может быть выбрана прибыль, доля рынка, ROIC или любой другой параметр, который необходимо улучшить с точки зрения бизнеса. Обычно, определяя CTQ, принято ориентироваться на голос клиента. Именно удовлетворение его потребностей является залогом конкурентоспособности любого предприятия.
Далее нужно определить входные параметры X, которые оказывают воздействие на У. Такими показателями могут быть время выполнения заказа, человеческий фактор, непроизводительные затраты или любые другие показатели. Определение входных параметров — одна из самых важных задач для последующего улучшения процесса. Статистический анализ покажет, насколько сильно влияет каждый X на У. Если влияние найденных X окажется незначительным, это будет свидетельством того, что корневые причины имеющихся недостатков процесса установить не удалось, а
усилия, направленные на улучшение выявленных факторов, будут бессмысленными.
После того как входы и выходы процесса определены, необходимо собрать по ним данные. При этом, по возможности, нужно собирать данные с большим объемом информации для обеспечения репрезентативности выборки. Если в дальнейшем мощность выборки окажется недостаточной — ее необходимо будет увеличить.
Определив все влияющие факторы и собрав по ним данные, можно переходить к проверке гипотез о влиянии входных параметров X на выходной параметр У. Проверка гипотез позволяет определить, является ли отклонение между двумя или большим количеством выборок данных случайностью или результатом фактического различия параметров популяций.
В качестве нулевой гипотезы выступает утверждение об отсутствии влияния, изменения или разницы. Данная гипотеза считается истинной, пока не предоставлено достаточно свидетельств для ее отклонения. Соответственно в качестве альтернативной гипотезы выступает утверждение о наличии влияния, измене -ния или разницы.
Естественно, что при анализе гипотез существует риск сделать неправильные выводы. Ошибка первого типа заключается в отбрасывании нулевой гипотезы, когда она на самом деле правильная. Такая вероятность обозначается а (0 < а < 1). Этот риск оценивается в большинстве статистических тестов и отображается как значение Р. Ошибка второго типа — сохранение нулевой гипотезы, когда она на самом деле ложная. Вероятность ошибки второго типа обозначается р (0 < р < 1). Обычно, если нет дополнительных требований к точности, уровень допустимости риска для ошибки первого типа составляет 0,05. Это означает, что любое значение Р < 0,05 приведет к отклонению нулевой гипотезы. Уровень допустимости риска ошибок второго типа обычно принимается равным 0,1. На практике эта величина применяется при расчетах размеров выборок.
Сформулировав нулевую гипотезу и установив уровень значимости а, необходимо выбрать
тест для проверки гипотез. Выбор теста зависит от типа данных (дискретные или непрерывные) и вида распределения выходного параметра (если его тип непрерывный). Матрица выбора теста для проверки гипотез представлена в таблице.
После того как был выбран подходящий тест, необходимо подсчитать размер выборки, который обеспечит заданную мощность (обычно мощность = 1 - р = 0,9). Если собранных данных недостаточно — необходимо провести дополнительные замеры. Если дополнительные замеры провести не удастся — мы можем посчитать мощность, которую обеспечит имеющийся фиксированный размер выборки. Естественно, чем ближе к 1 будет данное значение, тем меньше вероятность допустить ошибку второго типа.
Далее можно переходить к анализу. Первоначально имеет смысл провести графический анализ, который поможет сделать предварительные выводы. Естественно, они должны быть подтверждены или опровергнуты статистическими тестами. Рассчитав риск допустить ошибку первого типа (значение P) и сравнив его с а, можно сделать вывод, верны ли допущения, достаточна ли выборка, нужны ли дополнительные выборки или дополнительный анализ. На основе этих данных можно сделать практические выводы о степени влияния входного параметра Х на показатель, требующий улучшений У [5].
Рассмотрим подробнее статистические тесты для различных типов данных. Проводить эти тесты можно как вручную, так и с помощью разнообразного прикладного программного обеспечения, достаточно широко
представленного на современном IT-рынке. Специализированные программные продукты позволяют автоматически производить статистический анализ и визуализировать результаты моделирования. Существенно упростить ручной расчет формул и значительно сэкономить на этом время позволяют, например, такие программные продукты, как MS Excel, Minitab и другие.
1. Регрессия (регрессионный анализ) — это метод определения зависимостей между непрерывными Y и Х. Целью регрессии является предсказание Y для данного уровня Х. Регрессии могут быть простыми (линейная зависимость между Y и одним Х), множественными (рассматривается несколько Х одновременно) и нелинейными.
В первую очередь необходимо определить вид зависимости и построить модель, отражающую взаимосвязь Y = f(X). Используя регрессионные модели, важно не забывать о допущениях остатков для их ряда (отклонений реальных наблюдений от смоделированных значений): они должны быть нормально распределены, иметь равное нулю математическое ожидание, распределяться случайно и не зависеть друг от друга. Если какое-либо допущение не выполняется, появляется основание не доверять анализу. В этом случае необходимо вернуться на этап определения регрессионной модели и попытаться построить более адекватную зависимость.
Подобрав адекватную и точную модель, можно переходить к анализу. В первую очередь нас интересует расчетное значение, которое указывает на вероятность совершить
Матрица выбора теста для проверки гипотез
Тип данных Дискретный Y Непрерывный Y
Дискретный X Тест хи-квадрат (%2) нормальное распределение У не нормальное распределение Y
Дисперсионный анализ для сравнения центров ВагНеи'Б-тесг для сравнения разбросов Mood's Median-тест для сравнения центров Levene's-Test для сравнения разбросов
Непрерывный X Меняем местами Y и Х, проводим анализ Регрессия
ошибку первого типа: насколько случайно получить имеющуюся разницу при отсутствии влияния фактора (т.е. определить, влияет X на У или нет). Для определения P сначала рассчитывается F-статистика выводов дисперсионного анализа. Затем для количества степеней свободы теста из табличных значений берется распределение данной статистической величины, и статистика теста сравнивается с этим распределением. Результатом сравнения и будет значение.
R2 — второй после P важнейший показатель значимости влияния X на У в регрессионном анализе. Он рассчитывается, как R2 = 1 -- ESS/TSS, где ESS — сумма квадратов остатков регрессии; TSS — общая сумма квадратов. R2 показывает, каков процент отклонений в У, который может быть объяснен данным X. Чем данный показатель выше, тем сильнее влияние X на У. Если рассматривается влияние одного X, то (100% - R2) — это то, что может быть объяс-
нено всеми оставшимися факторами в совокупности.
С помощью регрессионной модели мы можем определить значимость влияния Х на У (расчет Р), силу его влияния (показатель Я2), а также предсказать поведение У в случае дальнейших изменений Х (используя интерполяцию).
Пример: сельскохозяйственное предприятие хочет определить, влияет ли количество наружной рекламы на объемы продаж в различных регионах (уровень значимости а = 0,05).
Проведем анализ с помощью программы М'ткаЪ. Сформулируем нулевую гипотезу: количество наружной рекламы не влияет на объемы продаж.
Предварительный графический анализ указывает на линейную зависимость (рис. 1).
Построим регрессию и проверим допущения (рис. 2).
Мы видим, что остатки нормально распределены вокруг нуля, не зависят друг от друга
Рис. 1. Исходные данные и предварительный графический анализ
Рис. 2. Линейная модель регрессии и допущения
и имеют схожую дисперсию. Модель адекватна и может быть использована для получения выводов.
Проведем регрессионный анализ (рис. 3).
Значение Р < 0,05 — отвергаем нулевую гипотезу, следовательно, количество наружной рекламы значимо влияет на объемы продаж. Так как имеется достаточно оснований для отбрасывания нулевой гипотезы — размер выборки достаточен. Я2 = 98,5% свидетельствует о том, что влияние фактора очень значимо.
2. Тест хи-квадрат (х2) применяется для анализа влияния одного или двух дискретных Х на дискретный У (дискретная «регрессия»). Он также используется для дискретной «корреляции» двух Х или двух У. Тест х2 использует таблицы пропорциональностей. При этом проверяется гипотеза о том, что переменные являются независимыми и не влияют друг на друга. Для принятия гипотезы необходимо, чтобы процентные распределения по разным столбцам друг от друга не отличались, а наблюдаемые различия являлись случайными. Тест х2 вычисляет общее отличие между наблюдаемыми значениями в ячейках и теми ожидаемыми значениями, которые могли бы быть в этих ячейках, если бы процентные распределения в столбцах были бы одинаковыми. Большое значение х2 указывает на существенное отличие между наблюдаемыми и ожидаемыми количествами в ячейках и говорит о том, что процентные распределения по столбцам не являются равными, гипотеза о независимости отвергается, следовательно, искомые переменные влияют друг на друга. Допущением для использования таблиц пропорциональности является
наличие значений Р > 5 для ожидаемых величин в любой ячейке.
Как и во всех тестах, важнейшим параметром будет являться значение Р. Для его определения необходимо рассчитать х2 — основную статистику выводов для данного теста. После этого для количества степеней свободы теста из табличных значений берется распределение статистической величины, после чего х2 сравнивается с этим распределением. Результат сравнения — значение Р, которое указывает вероятность совершить ошибку первого типа при определении влияния Х на У.
Пример: сельскохозяйственное предприятие хочет определить, зависит ли удовлетворенность потребителей качеством муки в зависимости от сорта пшеницы.
Проведем анализ с помощью программы Minitab.
На предварительном графическом анализе сравним пропорции столбцов для разных групп (рис. 4).
Мы видим, что имеются различия. Проверим данное предположение. Сформулируем нулевую гипотезу: удовлетворенность качеством муки не зависит от сорта пшеницы. Проведем статистический анализ (рис. 5).
Необходимые допущения для использования теста выполнены: ожидаемые величины для каждой ячейки > 5.
Получаем, что значение Р < 0,05, значит, отвергаем нулевую гипотезу. Фактор значимо влияет на удовлетворенность качеством. Так как имеется достаточно оснований для отбрасывания нулевой гипотезы — размер выборки достаточен.
Рис. 3. Регрессионный анализ
Рис. 4. Часть исходных данных и графический анализ
Tabulated statistics: Сорт пшеницы; Удовлетворенность качеством
Rows: Сорт пшеницы Columns: Удовлетворенность качеством Высокая Низкая Средняя ЛИ
Сорт А
Сорт Б
Сорт С
4,236 0,865 8,024
25 21 24 70
25,000 21,000 24,000 70,000
Cell Contents:
Count
Expected count
Contribution to Chi-square
Наблюдаемые
Ожидаемые
P < 0,05
Pearson Chi-Square = 48,340; DP = 4; P-Value = 0,000 Likelihood Ratio Chi-Square = 48,415; DF = 4; P-Value = 0,000
Рис. 5. Результаты теста x2
При производстве муки сельхозпроизводителю следует отдавать предпочтение определенным сортам пшеницы.
3. Для анализа степени влияния дискретного X на непрерывный У рассматриваются центры и разбросы выборок.
Центр — это среднее или наиболее типичное значение совокупности. Для определения центров используется среднее арифметическое, среднее геометрическое, медиана, математическое ожидание, степенные средние, мода и другие показатели. Их применение в том или ином случае зависит от исследуемой совокупности.
Разброс описывает степень отклонений данных относительно центра. Его определя-
ют такими показателями, как размах выборки, дисперсия, стандартное отклонение, меж-квартильный диапазон и другими. Как и в случае центров, выбор показателя для описания разброса зависит от исследуемой выборки.
Если выборка имеет нормальное распределение, будет использоваться среднее значение для описания ее центра и стандартное отклонение для описания разброса. Если выборка отличается от нормального распределения — в качестве описательной статистики для центра будет использоваться медиана, а в качестве описательной статистики для разброса — межквартильный диапазон. Правильный
выбор описательных статистик влияет на полученные результаты и успех проекта.
Рассмотрим исследование центров.
Если выборки, построенные для дискретных значений Х, имеют нормальное распределение — используем дисперсионный анализ (ЛЫОУЛ). Дисперсионный анализ — это метод определения различий между центрами нескольких выборок, когда все выборки имеют нормальное распределение. В его основе лежит анализ отклонений наблюдений исследуемой совокупности от среднего арифметического. При этом мерой отклонений является дисперсия (средний квадрат отклонений). Вызываемые воздействием исследуемого фактора отклонения сравниваются с отклонениями, вызванными случайными факторами. Фактор оказывает существенное влияние, если вызванные им отклонения более существенны, чем случайные.
Допущениями для использования ЛЫОУЛ являются независимость и случайность каждой выборки, а также нормальное распределение и равные дисперсии измерений внутри каждой группы (группы формируются для каждого дискретного Х).
Для определения значения Р, которое укажет на вероятность совершить ошибку первого типа, необходимо рассчитать Р- статистику дисперсионного анализа. Далее для количества степеней свободы теста из статистических таблиц определяем распределение данной величины. Статистика теста сравнивается с этим распределением, результат сравнения — значение Р.
Следующий важный показатель для исследования — Я2. Он рассчитывается как Я2 = БББ/ТББ, где БББ — сумма квадратичных отклонений между каждой группой; ТББ — сумма квадратичных отклонений между каждой группой плюс сумма квадратичных отклонений внутри каждой группы. Показатель Я2 дает понять, каков процент отклонений в У, который может быть объяснен данным Х. Чем выше Я2, тем сильнее влияние Х. Степень влияния всех оставшихся факторов в совокупности можно выразить величиной (100% - Я2).
Для исследования различий между выборками, построенными для дискретных значений Х, хотя бы одна из которых не имеет
нормального распределения, используется тест Mood's Median. Данный тест сравнивает медианы исследуемых выборок. Допущения:
• каждая выборка должна быть независимой и случайной;
• внутри каждой группы измерения должны иметь равные дисперсии.
При нарушении допущений точность оценки теста снижается. Для случаев, когда Р ~ 0,000, это менее значимо, однако когда P близка к а-риску (P ~ 0,05) — ошибка может быть достаточно значимой. Вывод о степени влияния X на У делается на основании значения P. Расчет R2 для данного теста не производится.
Перейдем к исследованию разбросов.
Для исследования разбросов нормально распределенных выборок используется Bartlett's-тест. Допущениями при использовании данного теста являются условия независимости и случайности каждой выборки. На основе описательных статистик (стандартных отклонений) Bartlett's-тест определяет статистику. Далее для количества степеней свободы теста (n - 1) из таблиц берется распределение данной статистической величины. Статистика теста сравнивается с этим распределением. Результат сравнения — значение Р, которое говорит о наличии или отсутствии влияния со стороны X на разбросы выборки У.
Если хотя бы одна из выборок У для исследуемых значений X не имеет нормального распределения, то для исследования разбросов необходимо использовать Levene's--тест. Допущениями при использовании данного теста являются независимость и случайность каждой выборки и то, что измерения внутри каждой выборки должны происходить из непрерывного распределения.
Статистика теста Levene's определяется из описательных статистик. Для количества степеней свободы теста (n - 1) из таблиц берется распределение данной статистической величины, с которой сравнивается статистика теста. По результатам данного сравнения определяется значение P. Значение P < 0,05 означает, что есть хотя бы одна выборка с разбросом, значимо отличающимся от разброса другой выборки.
Пример: сельскохозяйственное предприятие хочет определить, зависит ли урожайность пшеницы (ц/га) от производителя удобрения.
Исследование проведем с помощью программы М'ткаЪ.
Предварительный графический анализ показывает, что имеется различие в разбросах. Центры одинаковы (рис. 6).
Проверим выборки на нормальность распределения (рис. 7).
Так как одна из выборок имеет ненормальное распределение — будем использовать Levene's-тест для сравнения разбросов и Mood's Median-тест для сравнения центров.
Проверим разбросы. Сформулируем нулевую гипотезу — значимой разницы в разбросах выборок урожайности для различных
С1-Т
Производитель
Производитель 1
Производитель 2 Производитель 2
С2
Урожайность
32 14 28
СЗ
Производитель 3
Производитель 1
Производитель 2
Производитель 3
Производитель 3 Производитель 1
Производитель 1
Производитель 3 Производитель 2
Производитель 2
44
30 16
29 15 18 36 28 25
34
Рис. 6. Часть исходных данных и графический анализ
Summary for Урожайность
Производитель = Производитель 3
Anderson-Daring МргттвКу Test
Summary for Урожайность
Производитель = Производитель!
К
Summary for Урожайность
Производитель = Производитель 2
Mean ■ Median ■
Р < 0,05 — распределение отличается от нормального
Mean Median
ч I
95% Confidence Intervals
Anderson-Da rlii>gNV relit/Test A-soered N 0,8c P-value 0,019
Mean StDei \firence Stewness Kwtwis li
22,643 11,263 126,863 0,56103
-1,439«
14
Mranim 11,000 IstQuarole 11,750 Median is,500 3rd Qua пае 35,750 Maxirqrm_40,000
Confidence Intefval for Mean 16,140 29,146
95% Confidence [ntefval for Med an
11,949 35,154
99% Confidence Interval for StOe* 8,165 18,146
Рис. 7. Проверка выборок на нормальность распределения
типов удобрений нет. Проведем Ьеуепе'з-тест (рис. 8).
Для Ьеуепе'Б-теста значение Р < 0,05 — отвергаем нулевую гипотезу. Разница в разбросах есть. Поскольку у нас достаточно оснований для отбрасывания нулевой гипотезы, выборка достаточна. Доверительные интервалы выборок пересекаются. Наименьший разброс имеет выборка «Производитель 1».
Таким образом, выбор того или иного удобрения существенно влияет на разброс показателя урожайности. Если сельхозпроизводитель хочет минимизировать риски колебания значения урожайности — необходимо отдавать предпочтения удобрениям, обеспечивающим наименьший разброс («Производитель 1»).
Проверим центры. Сформулируем нулевую гипотезу — значимой разницы в центрах выборок урожайности для различных типов удобрений нет. Ьеуепе'Б-тест показал, что дисперсии не равны (нарушено допущение для
использования Mood's Median-теста при сравнении центров). Тем не менее мы проведем тест, так как в целом альтернативы для Mood's Median с неравными дисперсиями нет. При этом будем учитывать, что точность значения P как оценки вероятности сделать ошибку первого типа снижается (рис. 9). Проверку мощности и расчет необходимого размера выборок будем осуществлять с применением поправочного коэффициента 1,15.
Значение P > 0,05. Нулевую гипотезу отвергнуть не можем. Мы должны отвергнуть альтернативную гипотезу (альтернативная гипотеза — центры отличаются), но прежде рассчитаем, достаточна ли мощность нашей выборки, чтобы сделать такие выводы. Для расчета мощности необходимо определить разницу в средних значениях и наибольшее стандартное отклонение (рис. 10).
Мощность, равная 0,07, явно недостаточна, чтобы сделать выводы относительно гипотез. Необходима мощность 0,9 или выше.
Рис. 8. Levene's-твст
Mood Median Test: Урожайность versus Производитель
Mood median test for Уроюйнос^^^^^^^^ Chi-Square =1,31 DF = 2 f P = 0,404 }
Individual 95,0% CIs
Производитель N<= N> Median Q3-Q1 ---н----------+---------+----------I----
Производитель 1 1 1 23,0 3,3 (--------* —)
Производитель 2 Э 5 13,5 24,0 (--------*-----------------------)
Производитель 3 5 8 24,0 14,0 (---------*--------)
14,0 21,0 23,0 35,0
Overall median = 22,0
Рис. 9. Mood's Median-тест
Рис. 10. Средние значения, стандартные отклонения и мощность теста
Рассчитаем требуемый размер выборки для обеспечения адекватной мощности (рис. 11).
Для обеспечения мощности 0,9 при проведении дисперсионного анализа потребуются выборки размером 541 единиц для каждого значения Х. Проверка различия медиан выборок требует значительно больше имеющихся измерений. Чтобы использовать Mood's Median-тест необходимо увеличить размер выборки в 1,15раза (поправочный коэффициент) до 622 единиц.
Чтобы сделать вывод относительно равенства центров выборок производителей на урожайность, необходимо получить дополнительные данные, после чего повторить шаги, указанные выше. Без дополнительных данных вывод о равенстве центров может оказаться не соответствующим действительности.
4. В случае если необходимо проверить влияние непрерывных значений Х на дискретные значения Y, необходимо X и Y поменять местами (зависимость Х=f (Y)). Дальнейшее исследование центров и разбросов проводится по алгоритму, изложенному в п. 3.
Таким образом, проверка гипотез позволяет определить значимые факторы, которые действительно влияют на улучшаемый параметр. Это позволяет использовать для дальнейшего совершенствования только те факторы (X), которые оказывают высокое и среднее влияние на CTQ (У).
Если окажется, что все выявленные причины не влияют на СТО, необходимо вернуться на предыдущие этапы и снова повторить все шаги, начиная с поиска других факторов X, которые влияют на У.
Выбор истинных коренных причин позволяет определить направление совершенствования процесса. Методика «Шесть сигм» позволяет с помощью статистических тестов избежать «гаданий на кофейной гуще» относительно успеха внедряемых изменений и обосновывает необходимость тех или иных шагов по оптимизации. Использование статистики выводов для проверки гипотез и предвидение рисков помогают предприятию избежать игры в лотерею, на кон которой ставится успех инновационного проекта.
Рис. 11. Определение размера выборки
Литература
1. Официальный сайт Президента России. Стенограмма встречи Владимира Путина с учеными-экономистами РАН. URL: http://www.kremlin.ru/news/20291 (дата обращения: 25.12.2015).
2. Абдикеев Н.М. Экономика, основанная на знаниях, и инновационное развитие // Вестник Финансового университета. 2014. № 5 (83). C. 16-26.
3. Жевнов Д.А. Инновационное развитие бизнеса. Использование подходов «Лин» и «Шесть сигм» для оптимизации процессов // Вестник Финансового университета. 2013. № 6 (78). C. 127-132.
4. George М. Lean Six Sigma for Service. New York, McGraw-Hill, 2003.
5. Brussee W. Statistics for Six Sigma Made Easy! Revised and Expanded Second Edition. New York, McGraw-Hill, 2012.
6. Barone S., Lo Franco Е. Statistical and Managerial Techniques for Six Sigma Methodology: Theory and Application. John Wiley & Sons, 2012.
7. Майкл Л. Джордж. Бережливое производство + шесть сигм. Комбинируя качество шести сигм со скоростью бережливого производства. М.: Альпина Паблишер, 2007.
8. Питер С. Пэнди, Роберт П. Ньюмен, Роланд Р. Кэвенег. Курс на Шесть Сигм. Как General Electric, Motorola и другие ведущие компании мира совершенствуют свое мастерство. М.: Лори, 2014.
9. Ларри Холп, Петер С. Пэнди. Что такое «Шесть сигм»? Революционный метод управления качеством. М.: Альпина Паблишер, 2006.
10. GregBrue. Six Sigma for Managers, Second Edition. New York, McGraw-Hill, 2015.
11. Warren Brussee. Statistics for Six Sigma Made Easy! New York, McGraw-Hill, 2012.
References
1. Official Site of the President of Russia. A shot-hand record Vladimir Putin's meeting with a group of scholars from the Russian Academy of Sciences [Ofitsial'nyy sayt Prezidenta Rossii. Stenogramma vstrechi Vladimira Putina s uchenymi-ekonomistami RAN]. URL: http://www.kremlin.ru/news/20291 (data obrashcheniya: 25.12.2015).
2. Abdikeev N.M. Knowledge-Based Economy and Innovative Development. [Ekonomika, osnovannaya na znaniyakh, i innovatsionnoe razvitie] // Vestnik Finansovogo Universiteta, 2014, no. 5 (83), pp. 16-26.
3. Zhevnov D. A. Innovation-driven development of business. Using LEAN and Six sigma approaches to process optimization [Innovatsionnoe razvitie biznesa. Ispol'zovanie podkhodov «Lin» i «Shest' sigm» dlya optimizatsii protsessov] // Vestnik Finansovogo Universiteta, 2013, no. 6 (78), pp. 127-132.
4. George М. Lean Six Sigma for Service. New York, McGraw-Hill, 2003.
5. Brussee W. Statistics for Six Sigma Made Easy! Revised and Expanded Second Edition. New York, McGraw-Hill, 2012.
6. Barone S., Lo Franco Е. Statistical and Managerial Techniques for Six Sigma Methodology: Theory and Application. John Wiley & Sons, 2012.
7. Maykl L. Dzhordzh. Economical production six sigma. Combining quality of six sigma with a speed of economical production [Berezhlivoe proizvodstvo + shest' sigm. Kombiniruya kachestvo shesti sigm so skorost'yu berezhlivogo proizvodstva]. Moscow, Al'pina Pablisher, 2007.
8. Piter S. Pendi, Robert P. N'yumen, Roland R. Keveneg. The Six Sigma Way: How Ge, Motorola, and Other Top Companies are Honing their Performance [Kurs na Shest' Sigm. Kak General Electric, Motorola i drugie vedushchie kompanii mira sovershenstvuyut svoe masterstvo]. Moscow, Lori, 2014.
9. Larri Kholp, Peter S. Pendi. What is «Six sigma»? Revolutionary method of management of quality. [Chto takoe «Shest' sigm»? Revolyutsionnyy metod upravleniya kachestvom]. Moscow, Al'pina Pablisher, 2006.
10. Greg Brue. Six Sigma for Managers, Second Edition. New York, McGraw-Hill, 2015.
11. Warren Brussee. Statistics for Six Sigma Made Easy! New York, McGraw-Hill, 2012.