-□ □-
Обгрунтовано Heo6xidHicmb o6MiKy c^adHocmi тем при тестувант. Описано алгоритм iдентифiкацii складностi теми з використанням теори нечтких множин. Наведено результати його застосування для розрахунку нормативноi кiлькостi балiв за одне тестове завдання
Ключовi слова: тестування, складтсть
теми, нечтт множини, база знань
□-□
Обоснована необходимость учета сложности тем при тестировании. Описан алгоритм идентификации сложности темы с использованием теории нечетких множеств. Приведены результаты его применения для расчета нормативного количества баллов за одно тестовое задание
Ключевые слова: тестирование, сложность темы, нечеткие множества, база знаний
□-□
The necessity of taking into account the theme difficulty in testing is substantiated. The algorithm of identification of theme difficulty with the use of the fuzzy set theory is described. The results of its use for calculating the normative grade quantity received for one task are given
Key words: testing, the theme difficulty,
fuzzy set, knowledge base -□ □-
УДК 681.3:378.146
использование теории нечетких множеств для идентификации степени сложности темы в системах компьютерного
тестирования
знаний
Н.О. Ризун
Кандидат технических наук, доцент Кафедра экономической кибернетики и математических
методов в экономике Университет экономики и права наб. Ленина, 18, г. Днепропетровск, Украина, 49000 Контактный тел.: (056) 713-43-99 Е-mail: n [email protected]
Введение
В настоящее время компьютерное тестирование широко используется в учебном процессе для проведения входного, текущего и итогового контроля знаний, при самостоятельной работе студентов, для проверки остаточных знаний и оценки деятельности ВУЗа. Накопленный опыт тестирования для контроля знаний позволил выявить множество специфических положительных особенностей, главная из которых и отмечаемая в большинстве источников - объективность оценки, которая практически никогда не оспаривается студентами. При этом необходимо подчеркнуть, что данное преимущество прежде всего обосновывается отсутствием "человеческого фактора" при формализации результатов тестового контроля.
С другой стороны, отсутствие так называемой "объективной" (разумной) субъективности может отрицательно сказываться на качестве оценки знаний. Примером является тот факт, что при проведении устного (или письменного) экзамена преподаватель имеет право учесть сложность выпавших в билете заданий и, выставляя оценку, "перекрыть" мелкие погрешности в
ответах на элементарные (базовые) вопросы полнотой раскрытия сложной (комплексной) темы. При компетентном и грамотном подходе к проведению экзамена, данная поправка не должна иметь ничего общего с понятием субъективного "завышения" или "занижения" оценки.
Необходимо учитывать и то, что принятие решения о возможности скорректировать оценку студента с поправкой на сложность вопроса преподаватель принимает интуитивно, на основе собственного опыта, который напрямую зависит от профессионального уровня преподавателя. Поэтому, наряду с проявлением гибкости и высокого профессионализма как преподавателя и педагога, данные факты часто порождают среди студентов появление слухов о так называемых "добрых" и "злых" преподавателях.
Постановка проблемы
Из вышесказанного следует, что проблема разработки методики идентификации и учета степени сложности темы, включенной в состав базы автоматизи-
рованнои программы тестирования и оценки знании студентов, является актуальной и важноИ практической задачеИ, которая позволит:
- совершенствовать методику оценки уровня знаний студентов, делая ее более гибкой и интеллектуальной;
- свести к минимуму влияние субъективного мнения одного преподавателя на процесс идентификации сложности темы за счет проведения статистической оценки знаний группы экспертов.
Анализ последних публикаций
В настоящее время ведутся исследования по автоматизации процесса тестирования и совершенствованию методик оценки знаний студентов. В большинстве из них понятие весового коэффициента, оценивающего степень сложность отдельных вопросов (заданий) [1, 2, 3] вводится в том случае, когда тест используется с целью итогового контроля знаний или определения рейтинга учебного заведения [4, 5], а понятие сложности темы - в случаях, когда данный показатель участвует в формировании структуры теста и оценке взаимосвязи изучаемых в дисциплине тем [6, 7]. Кроме того, понятие сложности вопроса часто рассматривается в контексте адаптивного тестирования, в котором вес вопроса увеличивается или уменьшается в зависимости от скорости или качества его прохождения, а сложность следующего выбираемого для студента задания корректируется в соответствии с показателями уровня его знаний по предыдущей группе вопросов [8, 9].
нерешенные части общей проблемы
Основной особенностью существующих разработок является отсутствие однозначных решений следующих проблем:
1. Формализации методики оценки сложности тем, особенно с учетом нескольких критериев.
2. Комплексной идентификации уровней сложности темы и вопросов, входящих в нее.
3. Недостаточной адекватности использования детерминированных подходов к оценке степени сложности темы или вопроса.
цель статьи
Целью статьи является разработка методики комплексной идентификации сложности темы и отдельных вопросов теста с учетом многокритериального анализа качественных, плохо формализуемых, нечетких, неточных характеристик, описывающих свойства объектов исследования.
являются элементы теории искусственного интеллекта - в частности, методы экспертных оценок и нечетких знаний, позволяющие формализовать мнение преподавателя (а чаще группы экспертов) о степени сложности темы или отдельного вопроса и, тем самым, внести в процесс компьютерного тестирования положительный элемент "человеческого фактора".
Понятие нечеткого множества - это попытка математической формализации нечеткой информации для построения математических моделей. В основе этого понятия лежит представление о том, что составляющие множество элементы, обладающие общим свойством, могут обладать этим свойством и, следовательно, принадлежать к данному множеству с различной степенью.
При таком подходе:
1) с одной стороны, высказывания "такой-то элемент принадлежит данному множеству" теряют смысл, поскольку необходимо указать "насколько сильно" или с какой степенью конкретный элемент удовлетворяет свойствам данного множества;
2) с другой стороны, с целью последующего принятия решения в процессе реализации алгоритма оценки знаний необходимо формализовать нечеткие, неопределенные или несогласованные характеристики типа: "достаточно сложная тема", "слишком быстро дан ответ", "очень простой вопрос".
Согласно классической теории [10], нечетким множеством (fuzzy set) A на универсальном множестве U называется совокупность пар
А= (|a(U),U), (1)
где |A(u), - степень принадлежности элемента u - U к нечеткому множеству A.
Степень принадлежности - это число из диапазона [0, 1]. Чем выше степень принадлежности, тем в большей мере элемент универсального множества соответствует свойствам нечеткого множества. Если универсальное множество (шкала) состоит из конечного количества элементов U={u1,u2,^,u^}, тогда нечеткое множество А записывается в виде
а=£ца
(2)
где знак X означает совокупность пар ца ()и uj. Лингвистической переменной (linguistic variable) называется переменная, значениями которой могут быть слова или словосочетания некоторого естественного или искусственного языка. В нашем случае, лингвистическая переменная "Степень сложности одной темы относительно другой" может принимать значения: "Существенно сложнее", "Немного сложнее", "Практически одинаковая сложность"; а, например, лингвистическая переменная "Скорость ответа" может принимать значения: "Очень быстро", "Быстро", "Нормально", "Медленно", "Очень медленно".
Общий алгоритм использования теории нечетких множеств можно представить следующей схемой (рис. 1):
проблемы Фаззификация Формирование Дефаззификация
(л ингвистические базы знаний (принятие решения)
Одними из эффективных инстру- переменные) (нечеткие правила)
ментов решения данных проблем для компьютерных систем тестирования
Рис. 1. Общая схема системы нечеткого логического вывода
Блок фаззификации преобразует нечеткие высказывания экспертов в нечеткие множества, которые описаны лингвистическими переменными в базе знаний.
Блок формирование базы знаний использует нечеткие условные (if - then) правила, заложенные в базу знаний, для преобразования нечетких входных данных в необходимые управляющие влияния, которые также носят нечеткий характер.
Блок дефаззификации превращает нечеткие данные с выхода блока решений в четкую величину, которая используется для принятия решения.
Таким образом, в отличие от традиционной математики, требующей на каждом шаге моделирования точных и однозначных формулировок, нечеткая логика предлагает совершенно иной уровень трансформации данных, благодаря которому творческий процесс моделирования происходит с использованием минимального набора закономерностей. К тому же, нечеткий метод позволяет резко сократить объем производимых вычислений, что, в свою очередь, приводит к увеличению быстродействия нечетких систем.
Результаты исследований
Основной особенностью предлагаемой в работе методики является использование аппарата нечеткой логики и экспертных оценок для формализации задачи учета степени сложности темы (а затем и сложности вопросов), включенных в тест при оценке знаний студентов.
Реализацию данной проблемы предлагается проводить путем последовательного решения следующих задач:
Задача 1. Определения степени сложности каждой темы, включенной в состав теста.
Задача 2. Формирования алгоритма учета сложности темы при определении количества баллов, выделяемых на каждый вопрос.
Базируясь на перечисленных выше терминах и методиках, алгоритм решения задачи "Определения сложности темы" предлагается разбить на следующие этапы (рис. 2):
Следует также отметить, что задача "Определения сложности темы" в силу своей сложности представляет собой комплексную задачу:
1. Нечеткого многокритериального анализа вариантов - оценка сложности темы должна происходить по нескольким критериям.
2. Системного анализа:
a. системной декомпозиции проблемы на ряд подзадач в соответствии с выделенными критериями;
b. системного синтеза с целью оптимизации решения по всем критериям.
3. Принятие решений в нечетких условиях - выбор оптимального варианта будет выполняться с использованием инструментов теории принятия решений в нечетких условиях по схеме Беллмана-Заде.
1 этап.
Обоснование совокупности частных критериев оценки сложности темы.
Авторами предлагается использовать следующие критерии:
G1 - умение узнавать объекты, понятия, факты, законы, модели;
G2 - умение действовать по образцу, по известному алгоритму, правилу;
Gз - умение проводить анализ ситуации, вычленить главное и строить из освоенных операций процедуры, позволяющие получить решение тестового задания;
G4 - умение и способность находить оригинальные решения.
2 этап.
Формирование исходной информации для построения функций принадлежности методом экспертных парных сравнений [11].
Для того, чтобы данные оценки не имели слишком субъективный характер, целесообразно использовать мнение группы экспертов-преподавателей, обобщая их данные одним из известных методов экспертных оценок (например, метод Делфи).
Для этого эксперт или группа экспертов попарно оценивает преимущества одной темы дисциплины, включенной в тест (совокупность тем представлена множеством Х={Х1,Х2,_ХП}),
над другой по отношению к свойству (критерию) нечеткого множества.
Парные сравнения удобно представлять следующей матрицей:
Рис. 2. Алгоритм решения задачи определения сложности темы
A ="2 "21 ~22 "2n , (3)
где ajj - уровень преимущества элемента Uj над
u
a
u
a
nn
^ (( = 1,п), определяемый по девятибалльной шкале Саати (табл. 1):
Таблица 1
Баллы Значения лингвистической переменной "Сложность темы"
1 Темы равноценны
3 Тема имеет умеренное превосходство
5 Тема имеет сильное превосходство
7 Тема имеет очень сильное превосходство
9 Тема имеет высшее (крайнее) превосходство
2,4,6,8 Промежуточные сравнительные оценки
включенных в тест, с учетом нескольких критериев, определяем согласно теории принятия решений в не-
D = А1 п А2 п А3 п А4 =
ШПЦд|(Х1) т^М^О ^П^О^
' (7)
четких условиях по схеме Беллмана -Заде путем нахождения пересечения нечетких множеств по частным критериям:
Тогда, согласно полученным на этапе 3 частным нечетким множествам:
Причем следует отметить, что данные сравнения производятся по четырем нечетким множествам, соответствующим выбранным частным критериям оценки степени сложности дисциплины.
Пример матрицы попарных сравнений по частному критерию "Умение узнавать объекты, понятие, факты, законы, модели" приведен в табл. 2:
Таблица 2
А^1)=
КритериИG1 Темы
Х1 Х2 Х3 Х4
Х1 1 6 1/2 7
Х2 1/6 1 3 4
Х3 2 1/3 1 9
Х4 1/7 1/4 1/9 1
3 этап.
Формирование нечетких множеств. Для этого определяем функции принадлежности субнормального и нормального нечеткого множества по формулам:
1
=„ , , . (4)
^ + a2j + ... + ап
(5)
Тогда функции принадлежности (функции превосходства) степени сложности темы по каждому из четырех критериев можно представить в виде нечетких множеств
д Г 1 0,44 0,72 0,16" А, = •— + ——+ —— + —— 1 I х1 х2 х3 х4
. 1 0,15 0,15 0,10 А = •—+——+——+ ——
х2 х3
х1
х4
(6)
. 1 0,96 0,63 0,78 А, = • — + —— + ——+ —— 2 I х1 х2 х3 х4
А4 =
0,63 0,47 1 -+-+ —
х1 х2 х3
0,31' х4
Э =
0,62 0,16 0,15 0,10 х1 х2 х3 х4
(8)
Данные значения множества степеней принадлежности (функции превосходства) являются весовыми коэффициентами сложности тем (dl, d2, dз, d4) по рассматриваемой дисциплине.
Анализируя полученные результаты, можно сделать вывод о том, что:
• тема 1 представляет собой наиболее сложную (практически в 4 раза) тему по сравнению со всеми остальными;
• темы 2 и 3 практически равны по сложности;
• самой легкой для студентов, по мнению экспертов, является тема 4.
Данную методику можно расширить, предположив, что предлагаемые для оценки частные критерии не являются равноценными. В том случае, если их важность можно измерить в относительной шкале, то изложенная выше методика претерпевает следующие изменения (дополнения):
1 этап.
Дополнительно экспертным путем устанавливается степень важности частных критериев оценки (абсолютный и относительный) (табл. 3).
Таблица 3
Критерий оценки сложности темы Вес критерия (в баллах) Нормированный вес критерия (2)
^ 1 0,10
G2 2 0,20
Gз 3 0,30
G4 4 0,40
2 этап.
Формируем нечеткие множества с учетом весовых коэффициентов (корректировка формулы (4)):
Ц(^) =
1
^ + ^ + ... +
(9)
4 этап.
Определение относительной сложности тем. Оптимальное решение, представляющее собой численное выражение относительной важности тем,
где Zi - относительный вес ьго частного честного критерия.
Согласно данной методике, скорректированные на весовой коэффициент важности критерия функции
4
принадлежности (функции превосходства) степени сложности темы будут представлены в виде следующих нечетких множеств:
Ai H1
1 Ixl
A3 =
A2 =
A4 =
l
xi l
Xi
0,83 xl "
0,92
--+
x2
0,56 " x2 "
0,99
""XT"
0,74 x2 "
0,97 --+
x3
0,56 " x3 "
0,91 --+
x3 J_
x3
0,83 x4
0,50 ' x4
0,95
"X4"
0,63ч
h-
x4
(10)
3 этап
В соответствии с формулой (6), степень сложности тем с учетом степени важности критериев оценки будет представлена следующим нечетким множеством
D =
0,34 xl "
0,23 x2 "
0,23 x3 "
0,20 x4
(ll)
1 этап
ОПРЕДЕЛЕНИЕ
СТЕПЕНИ
СЛОЖНОСТИ Результат
ВОПРОСА
Инструменты: Теория нечетких множеств
Экспертные парные сравнения
Скорректированные весовые коэффициенты в данном примере дают несколько иную оценку важности тем, а именно:
• наиболее сложной для студентов темой по-прежнему является тема 1;
• темы 2, 3 и 4 приблизительно равны по важности (о чем, хотя не в той
же мере, свидетельствуют и результаты расчетов по алгоритму, не учитывающему относительную важность частных критериев);
• степень превосходства сложности темы 1 значительно ниже полученных по предыдущему алгоритму результатов. Это объясняется тем, что данная тема доминирует по первым трем критериям, имеющим меньшую степень важности по сравнению с четвертым.
Полученные функции принадлежности, количественно характеризующие степень сложности рассматриваемых в тесте тем, позволяют формализовать нечеткую базу знаний (fuzzy knowledge base) для принятия решений по задаче 2 "Формирование алгоритма учета сложности темы при
определении количества баллов, выделяемых на каждый вопрос".
Предлагается следующий алгоритм решения задачи (рис. 3):
Этап 1.
Формирование функций принадлежности, количественно характеризующихе степень сложности вопроса (весовые коэффициенты а1, а2,...,ат) по описанной и обоснованной выше методике теории нечетких множеств и экспертных попарных сравнений.
Этап 2.
Определение общего количества баллов, выделяемых для вопросов определенной сложности, будет производиться по следующей формуле:
ВГВ* а 0=1,т),
где
В - общее количество баллов, выделяемых на оценку знаний;
т - количество уровней сложности вопросов.
Этап 3.
Формирование нечеткой базы знаний определения количества баллов за одно тестовое задание.
Нечеткая ба за знаний, предна значенна я для принятия решения по идентификации количества баллов за одно тестовое задание в зависимости от сложности темы, основана на продукционной модели представления зна-
Функции принадлежности,
количественно характеризующие степень сложности вопроса
Весовые коэффициенты (аь а2,... ,ат)
2 этап
ОПРЕДЕЛЕНИЕ ОБЩЕГО КОЛИЧЕСТВА БАЛЛОВ, ВЫДЕЛЯЕМЫХ ДЛЯ ВОПРОСОВ ОПРЕДЕЛЕННОЙ СЛОЖНОСТИ
Исходные данные:
• Общее количество баллов на тест (без учета динамического коэффициента)- В
• Идентификация степени сложности вопроса (а1, а2, аз, 04)
3 этап
ИДЕНТИФИКАЦИЯ ОБЪЕКТА С ОДНИМ ВЫХОДОМ И НЕСКОЛЬКИМИ ВХОДАМИ
Инструменты: Теория нечетких множеств Исходные данные:
• Количество баллов, выделяемых на вопросы определенной сложности
• Идентификация степени сложности темы ^1, d2, dз, d4)
• Количество вопросов определенной сложности в каждой теме К
Результат
\ 1/
Нечеткая база знаний
Basa S
Рис. 3. Этапы решения задачи формирования алгоритма учета сложности темы при определении количества баллов, выделяемых на каждый вопрос
ний. Структуру продукционной модели можно представить совокупностью правил вывода вида [12, 13]:
Если <входы>, то <выход>,
которые отражают знания эксперта в виде формализации причинно-следственных связей входных переменных с одним из возможных типов решения задачи принятия решения.
Рассматриваемая нами задача может быть представлена в виде объекта с двумя входами и одним выходом:
V = Y(Xl,X2),
(12)
Входы Выход
Вход 1 Вход 2
(Х1= ао И (Х2= а1) V=v11
ЕСЛИ (Х1= а2) (Х2= аО ТО V=V2l
(Х1= си) (Х2= а2) V=V42
• в виде нечеткой базы знаний BASA_S для определения количества баллов за одно тестовое задание в зависимости от сложности темы (пример для двух уровней сложности вопросов, табл. 5)
Таблица 5
Уровень сложности темы Уровень сложности вопроса
а1 а2
¿1 v11= (а1* а1)*В / К11 V12= (¿1* а2)*В / К12
¿2 V21= (¿2* а1)*В / К21 v22= (¿2* а2)*В / К22
¿3 V31= (¿3* а1)*В / К31 V32= (¿3* а2)*В / К32
¿4 V4l= (¿4* а1)*В / К41 V42= (¿4* а2)*В / К42
Расчетную формулу определения Vij в общем виде можно представить следующим образом:
*В
(1=1,4; j=1,2),
(13)
где аj) / Ку - весовой (поправочный) коэф-
фициент, позволяющий корректировать четкие (фактические) показатели результатов тестирования с поправкой на распознавание (идентификацию) уровня сложности темы и вопроса.
Пример результатов расчетов нормативного количества баллов Vij за одно тестовое задание в зависимости от сложности темы по данной методике, представ-
лены в табл. 6 (общее нормативное количество баллов В=400, количество вопросов разной сложности К в каждой теме равное):
Таблица 6
где V - количественная переменная (выход), отображающая нормативное количество баллов за ответ;
Х1, Х2 - входные количественные переменные, установленные на основе теории нечетких множеств:
Х1 - идентификаторы сложности темы (¿1, d2, dз, d4); Х2 - идентификаторы сложности вопроса (а1, а2). Согласно данному определению, формализация искомого соотношения (12) для принятия решений по обоснованию количества баллов за одно тестовое задание, может быть представлена следующим образом:
• в общем виде (табл. 4)
Таблица 4
№ темы Общее количество вопросов в теме Идентификатор степени сложности темы Идентификатор степени сложности вопроса
а1=0,33 а2=0,7
1 ТЕМА 8 ¿1=0,34 11 23
2 ТЕМА 10 ¿2=0,23 6 12
3 ТЕМА 6 ¿3=0,23 10 20
4 ТЕМА 6 ¿4=0,20 9 18
Выводы
Таким образом, решая задачу формирования правил обоснования количества баллов за одно тестовое задание на уровне структурной идентификации, был получен новый алгоритм оценки уровня знаний, основанный на нечетких логических высказываниях, который позволяет:
• более гибко и объективно оценить знания тестируемого с учетом сложности темы и ее отдельных вопросов;
• имитировать эффект присутствия "человеческого фактора" при формировании результатов тестирования.
Литература
1. Глущенко А.И. Информационная система принятия решений по формированию индивидуальных учебных планов [Текст] / А.И. Глущенко // Выпуск 15. - Самара.: СГАУ, 2006. - С.79-91.
2. Васильева Н. А. Квалиметрические основы рейтинговой системы контроля знаний студентов [Текст]: Дис. ... канд. пед. наук / Н. А. Васильева - Ижевск, 1998. - 151 с.
3. Семенюк Е. А. Рейтинговая система контроля знаний студентов по физике в вузе [Текст]: Дис. ... канд. пед. наук / Е. А. Семенюк - Москва, 2005. - 202 с.
4. Система рейтингового тестирования уровня подготовки к обучению в высшем учебном заведении [Текст]: пат. 214544 Рос. Федерация: МПК G09B7/02 / Базу-нов А. В.; Заявитель и патентообладатель: Московский государственный институт стали и сплавов (Технологический университет). - № 98110051/28, заявл. 28.05.1998, опубл. 10.02.2000.
5. Агаев Ф. Т. Виртуальное образование и оценка сложности теста в обучающих системах [Текст] / Ф. Т. Агаев // Международная научно-техническая конференция "Информационные системы в экономике, управлении производством и образовании". Т.1. - 2003. - С.10-13.
6. Сысоева Л.А. Предметно-критериальная методика составления тестов [Текст] / Л.А. Сысоева // Роль информационных технологий при обучении по программе МВА. Матер. научно-практ. конф.(30-31 янв. 2003). М.: МЭСИ, 2003. - С.43-45.
V
7. Методика тестирования "RSDN BENCH" [Электронный ресурс] / Режим доступа Ьир://^даж^п.ш^йе/640методика_те-crapoBaHra_RSDN.doc. - Загл. с экрана.
8. Автоматизована система тестування, навчання та мониторингу [Текст]: пат. 43616 Украша: МПК G09B 7/00 / Цщелко В. Д., Яремчук Н. А., Шведова В. В.; Замовник та патентовласник: Нацюнальний техшчний ушверситет Украши "Кшвський полiтехнiчний iнститут". - № u200902620, заявл. 23.03.2009, опубл. 25.08.2009, Бюл.№ 16, 2009 р.
9. Сметанюк Л.В., Кравцов Г.М. К теории и практике использования адаптивных тестов [Текст] / Л.В. Сметанюк, Г.М. Кравцов // Журнал "Information Technologies in Education", 2008. - вып. 3.
10. Штовба С.Д. Введение в теорию нечетких множеств и нечеткую логику [Электронный ресурс] / Режим доступа http://matlab. exponenta.ru/ fuzzylogic/bookl/index.php. - Загл. с экрана.
11. Захаров В.А. О выборе методов построения функций принадлежности для формализации задач принятия решений [Текст] / В. А. Захаров // Лаборатория специального математического и программного обеспечения (СМПО). Научно-исследовательский центр (НИЦ) ВА В ПВО ВС РФ, 2006. - 120 с.
12. Коджа Т.И., Гогунский В.Д. Эффективность применения методов нечеткой логики в тестировании [Текст] / Т.И.Коджа, В.Д. Гогунский // ААЭКС, Информационно-управляющие комплексы и системы, 2003. - №1(11).
13. Теленик С.Ф., Бщюк П.1., Коршевнюк Л.О., Хмелюк В.С. Метод формування лопчного висновку iз залученням експертного комитету [Текст] / С.Ф.Теленик, ПЛ.Бщюк, Л.О.Коршевнюк, В.С. Хмелюк // Проблеми програмування, 2008. - №4. - С. 73-83.
-□ □-
Описано можливостi та методику оцтю-вання якостi результатiв штеграцп даних. Запропоновано метрику якостi даних, що Грунтуеться на формалiзацii експертних оцток засобами логжи антонiмiв
Ключовi слова: неодноридш дат, ттегра-щя даних, ятсть даних, метрика якостi,
логжа антонiмiв
□-□
Рассмотрены возможности и методика оценки качества результатов интеграции данных. Предложена метрика качества данных, основывающаяся на формализации экспертных оценок при помощи средств логики антонимов
Ключевые слова: неоднородные данные, интеграция данных, качество данных,
метрика качества, логика антонимов □-□
Any possibilities and methodology of quality evaluation of data integration processes results. Data quality metric based on formalization of expert estimations by logic of antonymous tools has been proposed
Key words: heterogeneous data, data integration, data quality, quality metric, logic of
antonymous -□ □-
УДК 004.652
методика комплексного оц1нювання якост1 1нтегрованих даних
А.Ю. Берко
Кандидат техычних наук, доцент Кафедра шформацтних систем та мереж Нацюнальний уыверситет "Львiвська пол^ехшка" вул. С. Бандери, 12, м. Львiв, УкраТна, 79013 Контактний тел.: (032) 258-25-38 E-mail: [email protected]
1. Вступ
Проблеми штеграцп даних е актуальними з огляду на активний розвиток корпоративних та сустльних шформацшних ресурив, зростання ïx обсяпв та рiзно-машття способiв подання. Осюльки процеси штеграцп передбачають об'еднання рiзнорiдниx за походженням, змштом, форматами, способами опрацювання даних, то при цьому актуальною е проблема оцшювання вщпо-
вщносп результапв штеграцп певним вимогам якост результапв.
Оцшювання якост даних передбачае реалiзацiю, зокрема, таких процеав як вимiрювання, мониторинг i тдтримання. На кожному з цих етатв необхщним елементом е система показниюв i критерпв якость У запропонованш робот розглянуто один з аспектiв ощ-нювання якостi iнтегрованиx iнформацiйниx ресурив, що Грунтуеться на системi показниюв та метрик сервк-