Тест: ТОИ


Список вопросов


1. Адаптивная модель прогнозирования (Adoptive model of forecasting) это …

1) Самонастраивающаяся динамическая модель.
2) Самонастраивающаяся динамическая модель, учитывает информационную ценность его элементов.
3) Самонастраивающаяся рекуррентная модель.
4) Самонастраивающаяся рекуррентная модель, отражает динамические свойства временного ряда, учитывает информационную ценность его элементов.

2. Под абстрагированием понимается

1) Выделение существенных деталей реализации некоторого процесса или объекта.
2) Выделение существенных характеристик некоторого процесса или объекта.
3) Выделение существенных характеристик некоторого процесса или объекта, которые отличают его от всех остальных и таким образом четко определяют их концептуальные границы относительно дальнейшего рассмотрения и анализа.
4) Выделение существенных входных данных некоторого процесса или объекта.

3. Адекватность аналитической модели это…

1) Полнота и точность описания предмета исследования.
2) Степень соответствия модели реальному объекту или процессу, полнота и точность описания предмета исследования.
3) Степень соответствия модели реальному объекту или процессу в зависимости от цели исследования.
4) Степень соответствия модели реальному объекту или процессу.

4. Алгоритм Apriori связан с….

1) Поиском ассоциативных правил при анализе транзакционной базы данных
2) Анализом фреймовой базы данных.
3) Анализом транзакционной базы данных.
4) Поиском ассоциативных правил.

5. Алгоритм CART позволяет

1) Производить фильтрацию данных
2) Модифицировать нечеткие данные.
3) Сглаживать аномальные выбросы.
4) Строить деревья решений.

6. С какими данными работает алгоритм CART

1) С лингвистической переменной.
2) С двоичным представлением информации.
3) Только с дискретными данными.
4) Как с непрерывной, так и с дискретной выходной переменной.

7. Какой основной принцип работы алгоритма CART

1) Алгоритм строит деревья решений, которые содержат не более десяти потомков в каждом узле.
2) Алгоритм строит деревья решений, которые содержат не более пяти потомков в каждом узле.
3) Алгоритм строит бинарные деревья решений, которые содержат только два потомка в каждом узле.
4) Алгоритм строит деревья решений, которые содержат только три потомка в каждом узле.

8. Назначение алгоритма CHAID (Chi-square Automatic Interaction Detector)

1) Используется для предсказания или обнаружения взаимосвязей между переменными.
2) Определяет значимость разбиения.
3) Используется как классификатор.
4) Используется только для предсказания изменения переменных.

9. Какой критерий используется для оценки значимости узла в алгоритме CHAID (Chi-square Automatic Interaction Detector)

1) Хи-квадрат и критерий Фишера
2) Критерий Стьюдента.
3) Критерий Фишера.
4) Хи-квадрат.

10. Алгоритм ближайшего соседа (k-nearest neighbor algorithm) способен

1) Решать задачу регрессии
2) Решать задачу кластеризации
3) Решать задачу классификации и регрессии.
4) Восстанавливать пропущенные данные.

11. Суть алгоритма обратного распространения ошибки

1) Алгоритм обучения нейронных сетей, основанный на максимизации математического ожидания.
2) Градиентный алгоритм обучения нейронных сетей, основанный на минимизации среднеквадратической ошибки на выходах сети.
3) Градиентный алгоритм обучения нейронных сетей, основанный на минимизации дисперсии на выходах сети.
4) Алгоритм обучения нейронных сетей, основанный на минимизации времени рещения задачи.

12. Алгоритм последовательного покрытия позволяет..

1) Разбить исходный набор данных на минимальное количество однородных подмножеств.
2) Разбить исходный набор данных на два однородных подмножества
3) Разбить исходный набор данных на три однородных подмножества.
4) Разбить исходный набор данных на максимальное количество однородных подмножеств.

13. Амплификация это

1) Метод прогнозирования
2) Принцип, утверждающий, что сложные системы значительно меньше реагируют на внешние воздействия, чем простые.
3) Метод кластеризации.
4) Принцип, утверждающий, что сложные системы значительно сильнее реагируют на внешние воздействия, чем простые.

14. Анализ с последовательной детализацией это …

1) Получения более детальных сведений об исследуемых процессах или явлениях.
2) 1,2 и 3 все вместе.
3) Метод, предусматривающий пошаговый переход к более низким уровням иерархии элементов измерений.
4) Метод анализа информации в хранилищах данных.

15. Перед выполнением аналитической обработки аномальные значения необходимо

1) Обрабатывать без изменений
2) Удалить.
3) Подавить или удалить в зависимости от задачи.
4) Подавить.

16. Аппроксимация это …

1) Математический метод, в основе которого лежит замена одних математических объектов аналитическими зависимостями близкими к исходным.
2) Экстраполяция данных на несколько временных шагов вперед.
3) Оценка предистории данных.
4) Синоним интерполяции.

17. Аттрактор

1) Алгоритм анализа данных.
2) Множество точек фазового пространства некоторой динамической системы, к которым она стремится в процессе эволюции.
3) Поглощающее состояние узла нейросети
4) Узел сценария предварительной обработки данных

18. Бектрекинг

1) Процедура возврата алгоритма, использующего ветвление при поиске на некоторой структуре данных.
2) Последовательность алгоритмов интеллектуального анализа данных.
3) Этап алгоритма аппроксимации.
4) Элемент нейросети.

19. Валидация модели

1) Проверка правильности работы предсказательной способности аналитической модели.
2) Изменение последовательности обработки информации.
3) Оценка достоверности модели.
4) Проверка адекватности исходных данных.

20. Вейвлет

1) Точка максимума спектральной плотности.
2) Амплитудно-частотная характеристика входных данных
3) Это класс математических функций, позволяющих анализировать различные временные компоненты данных
4) Это класс математических функций, позволяющих анализировать различные частотные компоненты данных.

21. Витрина данных

1) Обычная реляционная база данных.
2) База данных, построенная на основе фреймовой модели.
3) Витрина данных- это относительно небольшое хранилище или же его часть, представленное в виде срезов информации с точки зрения решения конкретных задач.
4) То же самое что и хранилище данных

22. Вычислительная сложность алгоритма

1) Число параллельных вычислительных процессов, необходимых для решения задачи за минимальное время.
2) Количество элементарных операций, затрачиваемых алгоритмом для решения конкретной задачи.
3) Время, затраченное специалистом на решение задачи с использованием вычислительных средств.
4) Объем оперативной памяти, необходимый для решения задачи на ЭВМ.

23. Гистограмма

1) Плотность распределения вероятностей.
2) Диаграмма которая используется в статистике для графического представления распределения вероятностей значений некоторой случайной величины.
3) Любая функция, построенная с использованием столбиковой диаграммы
4) Диаграмма которая используется для графического представления распределения дисперсии.

24. Пусть задан временной ряд значений за май, июнь, июль. Какие значения будут анализироваться при горизонте прогнозирования равного 2?

1) За июнь.
2) За май, июнь, июль, август, сентябрь
3) За июнь и июль.
4) За февраль.

25. Дендрограмма

1) Дендрограмма показывает трехмерное изображение диаграммы связей.
2) Визуализатор, используемый для представления результатов работы нейросети.
3) Дендрограмма показывает результаты вейвлет преобразования данных.
4) Дендрограмма показывает степень близости отдельных объектов и кластеров и демонстрирует в графическом виде последовательность их объединения или разделения.

26. Какие понятия используются при построении дерева решений а) корень, б)листья, в)узлы, г) ветви

1) а), б), в).
2) б), в).
3) а).
4) а), б), в), г).

27. Что откладывается по горизонтальной оси диаграммы рассеяния

1) Значения, оцененные моделью,
2) Множество объектов классификации,
3) Множество исходных данных.
4) Целевые значения обучающих примеров.

28. Дихотомия

1) Однократное деление множества данных на две части
2) Последовательное деление множества данных на две части
3) Однократное деление множества данных на тридве части
4) Последовательное деление множества данных на четыре части

29. Значимость регрессионной модели

1) Оценка достоверности выходных переменных регрессионной модели
2) Степень статистической связи между выходными переменными регрессионной модели
3) Степень статистической связи между входной (набором входных) и выходной переменными регрессионной модели.
4) Степень статистической связи между входными переменными регрессионной модели.

30. Являются ли измерениями в хранилище данных названия товаров, городов, фирм поставщиков или покупателей, ФИО людей и т. д.

1) Могут являться.
2) Являются свойствами
3) Да.
4) Нет

31. Какое измерения является согласованным

1) Если одно измерение является точным подмножеством другого на уровне определения (одинаковые названия столбцов)
2) Если одно измерение является точным подмножеством другого на уровне значений (одинаковые значения в строках).
3) Если одно измерение является точной копией другого на уровне определения (одинаковые названия столбцов)
4) Если одно измерение является точным подмножеством другого как на уровне определения (одинаковые названия столбцов), так и на уровне значений (одинаковые значения в строках).

32. Инициализация карты Кохонена

1) Проверка обучения на тестовой выборке
2) Запуск обучения карты Кохонена.
3) Процесс присвоения начальных значений весам нейронов карты
4) Задание обучающей выборки.

33. Добыча данных (Data Mining)

1) Обнаружение в
2) Любая трансформация данных для последующего анализа.
3) Формирование репрезентативного подмножества.
4) Трансформация данных скользящим окном.

34. Что относится к интеллектуальному анализу данных

1) Сэмплинг.
2) Понижение разнообразия уникальных значений
3) Кластеризация, ассоциативные правила
4) Формирование конечных классов.

35. Интерполяция

1) Метод нахождения неизвестных промежуточных значений некоторой функции по имеющемуся дискретному набору ее известных значений
2) Нахождение среднего значения двух соседних измерений.
3) Нахождение данных функции аппроксимации.
4) Нахождение данных в результате прогнозирования на один шаг дискретизации.

36. Какие критерии не относятся качеству данных

1) Никакие.
2) Интерпретируемость.
3) Своевременность, точность.
4) Своевременность .

37. Какой порядок квантиля называется квартилем

1) x0,1…x0,9.
2) x0,01…x0,99.
3) Все.
4) x1/4, x1/2, x3/4.

38. Под кластеризацией понимается

1) Объединение объектов или наблюдений в пересекающиеся группы, пересекающиеся не более чем на 15%, на основе близости значений их атрибутов (признаков).
2) Объединение объектов или наблюдений в пересекающиеся группы, пересекающиеся не более чем на 50%, на основе близости значений их атрибутов (признаков).
3) Объединение объектов или наблюдений в пересекающиеся группы, пересекающиеся не более чем на 10%, на основе близости значений их атрибутов (признаков).
4) Объединение объектов или наблюдений в непересекающиеся группы на основе близости значений их атрибутов (признаков).

39. Ковариация служит мерой …

1) Взаимной связи между случайными величинами y и x, то есть стремление одной случайной величины возрастать или убывать при возрастании или убывании другой.
2) Взаимной связи между случайными величинами y и x, то есть стремление одной случайной величины убывать при убывании другой.
3) Взаимной связи между неслучайными величинами y и x.
4) Взаимной связи между случайными величинами y и x, то есть стремление одной случайной величины возрастать при возрастании другой.

40. Какие операции предусматривает консолидация данных

1) Все перечисленные.
2) Обеспечение необходимого уровня их информативности и качества.
3) Преобразование к единому формату, в котором они могут быть загружены в хранилище данных или аналитическую систему.
4) Извлечение данных из различных источников.

41. Какой этап не включает корреляционный анализ для двух случайных величин

1) Проверка статистической гипотезы значимости связи.
2) Вычисление выборочных коэффициентов корреляции и корреляционных отношений.
3) Установлении конкретного вида зависимости между случайными величинами.
4) Построение корреляционного поля и составление корреляционной таблицы.

42. Коэффициент вариации

1) Отношение коэффициента корреляции случайной величины к ее математическому ожиданию.
2) Отношение стандартного (среднеквадратичного) отклонения случайной величины к ее математическому ожиданию.
3) Отношение максимального значения случайной величины к ее математическому ожиданию.
4) Отношение дисперсии случайной величины к ее математическому ожиданию.

43. В каком диапазоне изменяется коэффициент корреляции

1) От -1 до 0..
2) От 0 до 1.
3) От -0,5 до +0,5.
4) От -1 до +1.

44. Лаг это…

1) Ширина временного окна при фильтрации данных.
2) Показатель, отражающий опережение во времени одного ряда данных от другого.
3) Показатель, отражающий отставание или опережение во времени одного ряда данных от другого.
4) Показатель, отражающий отставание во времени одного ряда данных от другого.

45. Каким образом для уравнения регрессии y=ax+b выбираются коэффициенты a и b.

1) Чтобы сумма квадратов отклонений точек, соответствующих реальным наблюдениям данных от линии регрессии была бы минимальной
2) Чтобы дисперсия реальных наблюдений от линии регрессии была бы минимальной.
3) Чтобы среднее значение отклонений точек, соответствующих реальным наблюдениям данных от линии регрессии было бы минимальным.
4) Чтобы разность отклонений точек, соответствующих реальным наблюдениям данных от линии регрессии была бы минимальной.

46. Идея лифтинга …

1) Заключается в сокращении числа отсчетов сигнала за счет удаления избыточных значений, попадающих в квантили разбиения.
2) Предсказание значений некоторой серии на основании других отсчетов
3) Заключается в сокращении числа отсчетов сигнала за счет удаления коррелирующих значений при сохранении среднего значения сигнала.
4) Заключается в восстановлении пропущенных данных при сохранении среднего значения сигнала.

47. При применении метода k-ближайших соседей k=10 означает

1) Выбирается 10 признаков классификации с 10-тью ближайшими соседями.
2) Выбирается ближайший сосед по 10 признакам
3) Каждый объект сравнивается с 10-ю соседями.
4) Выбирается 10 признаков классификации с одним ближайшим соседом.

48. Условие окончания классификации методом k-средних

1) После нахождения центров тяжести кластеров.
2) После окончания анализа всех записей.
3) Границы кластеров и расположения центроидов не перестанут изменяться от итерации к итерации.
4) Перестанут изменятся средние значения признаков, вычисленные по всем записям кластера.

49. Метод главных компонент

1) Производит выбор тех компонентов, которые имеют физический смысл.
2) Учитывает все компоненты но с разными весовыми коэффициентами.
3) Производит перевод в новую систему координат и вводит новые обобщенные признаки.
4) Исключает из рассмотрения часть признаков и сокращает пространство анализа.

50. При использовании метода скользящего окна для обучения при окне в 5 дней определить назначение данных для третьего окна (Картинка: https://clck.ru/ajtUn )

1) Y1- прогноз по данным за 3-7 день, сравнение со средним значением 6-8 дня.
2) Y1- прогноз по данным за 2-6 день, сравнение с реальными данными 7 дня.
3) Y1- прогноз по данным за 1-5 день, сравнение с реальными данными 6 дня.
4) Y1- прогноз по данным за 3-7 день, сравнение с реальными данными 8 дня.

51. Что не относится к многомерному представлению в OLAP приложениях.

1) Обработка
2) Формирование SQL запросов.
3) Хранение.
4) Представление данных.

52. Какие типы мультикубов используются в многомерной базе данных?

1) Смешанный
2) Параллельный
3) Блочный и последовательный
4) Последовантельный

53. Структура многослойного перцептрона...

1) Представляет собой сеть с обратной связью
2) Представляет собой однослойную сеть
3) С одним входным, одним выходным и одним или более скрытыми слоями нейронов
4) Представляет собой сеть с одним входным и одним выходным слоями нейронов

54. В каких алгоритмах используется обучающее множество

1) Всех перечисленных
2) Карты Кохонена
3) Деревья решений
4) Алгоритм нейронных сетей

55. Чем отличается сеть Хемминга от сети Хопфилда

1) Сеть Хемминга имеет большие затраты на память и объём требуемых вычислений
2) Сеть Хемминга имеет большие затраты на память и меньшие на объём требуемых вычислений
3) Сеть Хемминга имеет меньшие затраты на память и большие на объём требуемых вычислений
4) Сеть Хемминга имеет меньшие затраты на память и объём требуемых вычислений

56. Что такое потенциал нейрона

1) Взвешенная сумма входов нейрона
2) Нормированное значение функции
3) Значение функции активации
4) Взвешенная сумма выходов нейрона

57. Чему равно расстояние Левенштейна для двух строк абсврно абсчркоо

1) 1
2) 3
3) 7

58. Расстоянием Хэмминга в двух бинарных векторах называется...

1) Среднеарифметическое между значениями бит
2) Процент несовпадений от общего числа бит в векторах
3) Число отличающихся бит в десятичной счислении
4) Число несовпадений значений признаков в рассматриваемых i-м и j-м объектах

59. Что такое регрессия

1) Корреляционная взаимосвязь значения случайной величины с другой случайной величиной.
2) Зависимость среднего значения случайной величины только от некоторой другой величины.
3) Функциональная зависимость выходных данных от входных.
4) Зависимость среднего значения случайной величины от некоторой другой величины или даже нескольких

60. Чему равно значение сигмоидальной функции при x=0

1) 1
2) 0,5
3) -1

61. Для чего применяется алгоритм "скользящее среднее"

1) Применяется с целью прогнозирования данных на достаточно болшой интервал скольжения.
2) Применяется с целью исключения сильных шумов.
3) Применяется при сглаживании случайных величин с целью уменьшения дисперсии.
4) Применяется при сглаживании временных рядов с целью исключения сильных сезонных колебаний

62. Что понимается под сэмплингом?

1) Решение задачи оценки кредитной истории
2) Аналог линейной регрессии.
3) Аналог задачи анализа классов
4) Процесс отбора из исходной совокупности данных выборки, представляющей интерес для анализа

63. Какие переменные входят в формулу чувствительности при бинарной классификации

1) TP - число истинно положительных наблюдений, FN – число ложно отрицательных наблюдений
2) TP - число ложно положительных наблюдений, FN – число ложно отрицательных наблюдений
3) TP - число ложно положительных наблюдений, FN – число истинно отрицательных наблюдений
4) TP - число истинно положительных наблюдений, FN – число истинно отрицательных наблюдений

64. Выберите спектр для полигармонического процесса (Картинка: https://clck.ru/ajtUK )

1) г
2) в
3) а
4) б

65. Выберите спектр для почти периодического процесса (Картинка: https://clck.ru/ajtUK )

1) а
2) б
3) в
4) г

66. Какой из вариантов перечисленных ниже процессов является стационарным

1) почти периодический
2) эргодический
3) полигармонический
4) периодический

67. Для какого случайного процесса среднее значение по времени отдельной выборочной функции совпадает со средним значением по ансамблю реализаций

1) эргодический
2) стационарный
3) нестационарный
4) детерминированный

68. Для какого случайного процесса все его статистические параметры могут быть определены по одной выборочной функции

1) стационарный
2) нестационарный
3) детерминированный
4) эргодический

69. Для каких типов случайных процессов используют детерминированный множитель для их описания

1) стационарный
2) нестационарный
3) детерминированный
4) эргодический

70. Выберите вариант спектральной плотности для гармонического процесса (Картинка: https://clck.ru/ajtjb )

1) г
2) в
3) б
4) а

71. Выберите вариант спектральной плотности для суммы гармонического процесса со случайным шумом (Картинка: https://clck.ru/ajtjb )

1) г
2) б
3) в
4) а

72. Выберите вариант спектральной плотности для широкополосного шума (Картинка: https://clck.ru/ajtjb )

1) г
2) в
3) б
4) а

73. Выберите вид автокорреляционной функции для гармонического процесса (Картинка: https://clck.ru/ajtoW )

1) г
2) в
3) б
4) а

74. Выберите вид автокорреляционной функции для узкополосного случайного шума (Картинка: https://clck.ru/ajtoW )

1) г
2) в
3) б
4) а

75. Выберите вид автокорреляционной функции широкополосного случайного шума (Картинка: https://clck.ru/ajtoW )

1) г
2) в
3) б
4) а

76. Выберите требование характерное для построения хранилища данных

1) Избыточность данных не допускается
2) Хранение как детализированных данных, так и обобщённых данных
3) Должна быть возможность в любое время редактировать данные
4) Доступность системы в любой момент времени

77. Выберите требование характерное для построения хранилища данных

1) Избыточность данных не допускается
2) Доступность системы в любой момент времени
3) Время отклика системы на запрос пользователя некритично
4) Загрузка вычислительной мощности равномерна

78. Выберите требование нехарактерное для построения хранилища данных

1) Доступность данных за большой отрезок
2) Хранение как детализированных так и обобщенных данных
3) Возможность дублирования данных
4) Время отклика системы на запрос – минимально и измеряется секундами

79. Выберите требование нехарактерное для построения хранилища данных

1) Доступ ко всем данным за большой период времени
2) Время отклика системы может составлять минуты
3) Характер вычислительной нагрузки на систему – постоянный (средняя загрузка процессора)
4) Хранение как детализированных так и обобщенных данных

80. Выберите верное утверждение для витрины данных

1) Используется всеми подразделениями компании
2) Содержит только тематически объединённые данные
3) Реализуется только самостоятельно
4) Реализуется только из данных из ХД

81. Выберите неверное утверждение для витрины данных

1) Данные обновляются в режиме on-line
2) Дешевле в реализации
3) Может быть реализована из ХД
4) Может быть реализована самостоятельно для подразделения компании

82. Продолжите фразу "При использовании виртуального ХД и витрины данных…"

1) Данные доступны при неработающей системе оперативного учета
2) Аналитический запрос адресуется к витрине данных
3) Аналитический запрос адресуется к ХД
4) Данные из оперативных источников должны иметь один формат

83. Продолжите фразу "При использовании виртуального ХД и витрины данных…"

1) Аналитический запрос возможен из любого подразделения компании
2) Аналитический запрос возможен только при работе всех оперативных источников данных
3) Аналитический запрос адресуется к ХД
4) Данные из оперативных источников могут иметь различный формат

84. Выберите архитектуру с наименьшим временем отклика системы СППР:

1) Витрина данных с физическим ХД
2) Витрина данных с виртуальным ХД
3) Самостоятельная витрина данных с физическим ХД
4) Самостоятельная Витрина данных с виртуальным ХД

85. Что не является достоинством использования автономной витрины данных

1) Хранение данных в разных ВД
2) Круг вопросов для анализа наиболее определен и обозрим
3) Упрощение процедур заполнения ВД
4) Быстрое внедрение и получение отдачи

86. Выберите неверное утверждение при совмещении ХД с витриной данных:

1) Конечные пользователи имеют доступ к данным из витрины данных
2) Конечные пользователи не имеют доступ к детальным данным из ХД
3) ВД является подмножеством данных из ХД
4) ХД представляет собой централизованный источник информации для всех предметных областей

87. Выберите, для какого вида предобработки данных используется способ «преобразование даты»

1) Трансформация данных
2) Сглаживание
3) Удаление шумов
4) Заполнение пропусков в значении данных

88. Выберите, для какого вида предобработки данных используется квантование значений

1) Редактирование аномальных значений
2) Трансформация данных
3) Сглаживание
4) Заполнение пропусков в значении данных

89. Какие средства увеличения производительности программы анализа достигаются не свойствами СУБД

1) Размещение вспомогательные таблицы, данные на вспомогательных дисках
2) Сокращение числа итераций обращения к данным
3) Разбиение таблиц на разделы и табличные пространства
4) Кэширование таблиц в оперативную память

90. Что является способом обработки данных для сокращения времени работы программы анализа

1) Увеличение дискового пространства
2) Параллельная обработка
3) Увеличение оперативной памяти
4) Увеличение тактовой частоты работы ВТ

91. Выберите инструмент для сокращения времени анализа больших объемов данных, не используя СУБД

1) Подготовка исходных данных
2) Предварительный пересчет
3) Создание таблиц часто используемых данных
4) Кэширование данных в памяти

92. Какие технические средства не влияют на время анализа данных

1) Увеличение ОП
2) Использование многоядерных процессоров
3) Увеличение дискового пространства
4) Увеличение тактовой частоты

93. Выберите, для какого вида предобработки данных используется способ аппроксимации данных

1) Заполнение пропусков в значении данных
2) Редактирование аномальных значений
3) Удаление шумов
4) Сглаживание

94. Выберите, для какого вида предобработки данных используется способ «замена данных»

1) Удаление шумов
2) Заполнение пропусков в значении данных
3) Редактирование аномальных значений
4) Сглаживание

95. Какое техническое средство не влияет на производительность алгоритма DM

1) Увеличение дискового пространства
2) Увеличение оперативной памяти
3) Увеличение тактовой частоты компьютера
4) Использование многоядерных процессоров

96. Что является способом обработки данных для сокращения времени работы программы DM

1) Разбиение таблиц на разделы и табличные пространства
2) Использование многоядерного процессора
3) Сокращение обращений к исходным данным
4) Комбинирование моделей

97. Что определяется алгоритмом, а не является способом обработки данных для сокращения времени работы программы анализа

1) Сокращение обращений к исходным данным
2) Параллельная обработка
3) Использование репрезентативной выборки
4) Комбинирование моделей

98. Какой прием сокращения времени анализа определяется возможностью СУБД

1) Использование репрезентативной выборки
2) Уменьшение обращений к дисковой памяти
3) Использование при анализе разделов и табличных пространств таблиц
4) Использование многоядерных процессоров

99. Выберите для какого вида предобработки данных используется способ максимального правдоподобия

1) Редактирование аномальных значений
2) Заполнение пропусков в значении данных
3) Удаление шумов
4) Трансформация данных

100. Выберите, для какого вида предобработки данных используется способ «агрегирование данных»

1) Трансформация данных
2) Заполнение пропусков в значении данных
3) Удаление шумов
4) Сглаживание

101. Что не влияет на производительность алгоритма DM

1) Предварительный обсчет данных
2) Увеличение оперативной памяти
3) Кэширование таблиц в оперативную память
4) Увеличение дискового пространства

102. Что является способом обработки данных для сокращения времени работы программы DM

1) Сокращение обращений к исходным данным
2) Кэширование таблиц
3) Использование репрезентативной выборки
4) Увеличение оперативной памяти

103. Что не является способом обработки данных для сокращения времени работы программы

1) Кэширование данных
2) Параллельная обработка
3) Использование репрезентативной выборки
4) Комбинирование моделей

104. Какой прием сокращения времени анализа определяется возможностью СУБД

1) Использование многоядерных процессоров
2) Уменьшение числа итераций к дисковой памяти
3) Использование репрезентативной выборки
4) Кэширование данных

105. Из представленных утверждений для описания основных статистических характеристик стационарного случайного процесса выберите ОШИБОЧНОЕ

1) Среднее значение стационарного случайного процесса
2) Автокорреляционная функция
3) Плотность распределения
4) Среднее значение квадрата случайного процесса

106. Из представленных утверждений для описания спектральной плотности статистических характеристик стационарного случайного процесса выберите ОШИБОЧНОЕ

1) Применяется для исследования частотной структуры физической системы
2) Справедливы соотношения связи a. С автокорреляционной функцией Rx(דּ) через преобразование Фурье b. Со средним значением μx c. Со средним значением квадрата ψ2
3) Описывает среднее значение квадрата значений реализации по частоте Gx(f)
4) Функция Gx(f) может принимать положительные и отрицательные значения

107. Выберите утверждение, попадающее под определение «Информация»

1) Видеозапись, зафиксированная цифровым регистратором
2) Журнал записей состояния технического объекта на фиксированный момент времени
3) Диаграмма состояния объекта (графический мониторинг)
4) Сведение об объекте, уменьшающее степень неопределенности

108. Выберите правильное утверждение об единице измерения объема информации

1) Файл видеозаписи, зафиксированный цифровым регистратором
2) Папка с файлами
3) 1 ГБ
4) Машинное слово

109. Какой из видов статистического анализа позволяет выявить скрытые переменные факторы

1) Факторный
2) Корреляционный
3) Дисперсионный
4) Регрессионный

110. Какой из предложенных методов не используется для установления факторной структуры

1) Корреляционный анализ
2) Метод максимального правдоподобия
3) МГК
4) Экспертные оценки

111. Какой из видов статистического анализа является исследованием факторов, связь которых с результативными показателями носит функциональный характер.

1) Регрессионный
2) Дисперсионный
3) Корреляционный
4) Факторный

112. Какой из видов статистического анализа характеризует изменчивость признака под влиянием каких-либо контролируемых переменных факторов.

1) Факторный
2) Корреляционный
3) Регрессионный
4) Дисперсионный

113. Какой из видов статистического анализа характеризует Вариативность, обусловленную взаимодействием исследуемых независимых переменных.

1) Факторный
2) Корреляционный
3) Дисперсионный
4) Регрессионный

114. Для какого вида анализа обязательным условием является проверка, что распределение результативного признака является нормальным.

1) Корреляционный
2) Дисперсионный
3) Регрессионный
4) Факторный

115. Какой вид анализа позволяет оценивать тесноту связи между двумя и более переменными

1) Корреляционный
2) Дисперсионный
3) Регрессионный
4) Факторный

116. Выберите ошибочное утверждение по отношению к корреляционной зависимости:

1) Коэффициент корреляции более 0.7 является сильным
2) Ранговая корреляция позволяет определить силу и направление корреляционной связи между двумя признаками, измеренными в ранговой шкале или между двумя иерархиями признаков
3) Коэффициент корреляции не может быть равен 0
4) Корреляция бывает линейной и нелинейной

117. Выберите ошибочное утверждение по отношению к корреляционной зависимости:

1) Коэффициент детерминации определяет процентное взаимное влияние переменных
2) Квадрат коэффициента корреляции называется коэффициентом детерминации
3) Коэффициент корреляции определяет процентное взаимное влияние переменных
4) Уровень значимости коэффициента корреляции вычисляется при помощи таблицы критических значений.

118. Выберите верное утверждение по отношению к корреляционной зависимости:

1) Коэффициент корреляции не может быть равен 0
2) Уровень значимости коэффициента корреляции вычисляется при помощи таблицы критических значений.
3) Сильная корреляция всегда высокозначима
4) Слабая корреляция всегда недостоверна

119. Выберите верное утверждение при наличии коэффициента корреляции:

1) Коэффициент корреляции не зависит от масштаба измерения любой переменной (кг, г, тонна; м, см, мм; …)
2) Адекватно оценивается теснота связи одной переменной от другой вне зависимости вида этой зависимости
3) Позволяет утверждать, что одна из переменных предшествует или является причиной изменения
4) Наличие причинно-следственной связи между парами признаков

120. Из представленных утверждений для описания основных статистических характеристик стационарного случайного процесса выберите ОШИБОЧНОЕ:

1) Распределение вероятностей процесса на частотной шкале
2) Интенсивность процесса
3) Интенсивность процесса на временной шкале
4) Среднее значение стационарного случайного процесса

121. Выберите утверждение, попадающее под определение «Информация»

1) Сведение об объекте, уменьшающее неполноту знания
2) Журнал записей температуры больных по отделениям и палатам
3) Графическое представление данных о состоянии технического объекта в «черном ящике»
4) База данных показаний датчиков состояния технического объекта

122. Выберите понятие, которое не относится к единице хранения и обработке информации в компьютере

1) Папка
2) Файл
3) Машинное слово
4) 1 Кб

123. Какой из предложенных методов не используется для отыскания латентной переменной

1) Метод максимального правдоподобия
2) Экспертные оценки
3) МГК
4) Корреляционный анализ

124. Какой из видов статистического анализа позволяет описать анализируемый объект более компактно

1) Дисперсионный
2) Корреляционный
3) Регрессионный
4) Факторный

125. Какой из видов статистического анализа является исследованием факторов, связь которых с результативными показателями является вероятностной.

1) Факторный
2) Корреляционный
3) Дисперсионный
4) Регрессионный

126. Для какого вида стат. анализа обязательным условием является, чтобы асимметрия и эксцесс более чем в 3 раза превышали свои ошибки репрезентативности.

1) Факторный
2) Корреляционный
3) Регрессионный
4) Дисперсионный

127. Для какого вида статистического анализа обязательным условием применения является, чтобы число наблюдений превышало число факторов не менее чем в 5-6 раз

1) Корреляционный
2) Дисперсионный
3) Регрессионный
4) Факторный

128. Выберите ошибочное утверждение по отношению к корреляционной зависимости:

1) Сильная корреляция всегда высокозначима
2) Сильная корреляция может быть, недостоверной
3) К-т корреляции Пирсона позволяет определить силу связи между двумя признаками, измеренными в метрических шкалах.
4) Коэффициент корреляции может меняться от -1 до 1

129. Выберите ошибочное утверждение по отношению к корреляционной зависимости:

1) Коэффициент корреляции более 0.7 является сильным
2) Корреляция бывает линейной и нелинейной
3) Коэффициент корреляции определяет процентное взаимное влияние переменных
4) Уровень значимости коэффициента корреляции вычисляется при помощи таблицы критических значений.

130. Выберите верное утверждение по отношению к корреляционной зависимости:

1) Коэффициент корреляции не может быть равен 0
2) Коэффициент детерминации определяет процентное взаимное влияние переменных
3) Слабая корреляция всегда недостоверна
4) Сильная корреляция всегда высокозначима

131. Выберите верное утверждение при наличии коэффициента корреляции:

1) Позволяет утверждать, что одна из переменных предшествует или является причиной изменения
2) Адекватно оценивается теснота связи одной переменной от другой вне зависимости вида этой зависимости
3) Наличие причинно-следственной связи между парами признаков
4) Коэффициент корреляции – безразмерная величина

132. Из представленных утверждений для описания основных статистических характеристик стационарного случайного процесса выберите ОШИБОЧНОЕ:

1) Распределение вероятностей процесса на частотной шкале
2) Интенсивность процесса
3) Интенсивность процесса на временной шкале
4) Среднее значение стационарного случайного процесса

133. Выберите понятие, которое не относится к единице хранения и обработке информации в компьютере

1) 1 Кб
2) Файл
3) Машинное слово
4) Папка

134. Какой из предложенных методов не используется для отыскания латентной переменной

1) Метод максимального правдоподобия
2) МГК
3) Экспертные оценки
4) Корреляционный анализ

135. Какой из видов статистического анализа позволяет описать анализируемый объект более компактно

1) Корреляционный
2) Дисперсионный
3) Регрессионный
4) Факторный

136. Какой из видов статистического анализа является исследованием факторов, связь которых с результативными показателями является вероятностной.

1) Факторный
2) Корреляционный
3) Дисперсионный
4) Регрессионный

137. Для какого вида анализа обязательным условием является проверка, что распределение результативного признака является нормальным.

1) Корреляционный
2) Дисперсионный
3) Регрессионный
4) Факторный

138. Для какого вида стат. анализа обязательным условием является, чтобы ассимметрия и эксцесс более чем в 3 раза превышали свои ошибки репрезентативности.

1) Факторный
2) Корреляционный
3) Регрессионный
4) Дисперсионный

139. Выберите ошибочное утверждение по отношению к корреляционной зависимости:

1) Сильная корреляция может быть, недостоверной.
2) К-т корреляции Пирсона позволяет определить силу связи между двумя признаками, измеренными в метрических шкалах.
3) Сильная корреляция всегда высокозначима
4) Коэффициент корреляции может меняться от -1 до 1

140. Выберите ошибочное утверждение по отношению к корреляционной зависимости:

1) Корреляция бывает линейной и нелинейной
2) Коэффициент корреляции более 0.7 является сильным
3) Коэффициент корреляции определяет процентное взаимное влияние переменных
4) Уровень значимости коэффициента корреляции вычисляется при помощи таблицы критических значений.

141. В каком варианте поставки возможно выполнение следующих функций с данными. Построение моделей: • линейная регрессия, • нейронные сети, • деревья решений, • ассоциативные правила

1) Enterprise
2) В любом
3) Academic
4) Professional

142. Какие источники/приемники данных допустимы для поставки Academic

1) Oracle
2) Sybase
3) Файлы .XML, HTML
4) Текстовые файлы

143. В составе какой поставки возможно осуществлять экспорт/ импорт данных для Баз данных (Oracle, MS SQL, Firebird, Interbase, Sybase, MySQL)

1) В любом
2) Profes+Enterprise
3) Professional
4) Academic

144. В состав, какой версии программы входят средства для удаленной работы с системой

1) Во все версии
2) Prof и Enterpr
3) Enterprise
4) Professional

145. В каком варианте поставки возможно выполнение следующих функций с данными. Трансформация данных: группировка, сортировка, замена, слияние

1) В любом
2) Enterprise
3) Professional
4) Academic

146. Какие источники/приемники данных допустимы для поставки Academic

1) Dbase III, IV
2) OLE DB, ODBC, ADO, dbExpress
3) Текстовые файлы
4) Офисные приложения (MS Access, MS Excel, MS Office2007+)

147. В составе какой поставки возможно осуществлять экспорт/ импорт данных для Офисные приложения (MS Excel, MS Access, в том числе MS Office 2007+) или 1C:Предприятие 7.7, 8.X

1) Любая
2) Prof и Enterpr
3) Enterprise
4) Professional

148. Какой вариант поставки программы «Дедуктор» позволяет использовать БД Oracle для построения ХД

1) Enterprise
2) Все варианты
3) Professional и Enterprise
4) Academic

149. Какие базы данных допустимы для аналитической работы Дедуктор в поставке Academic:

1) Dbase III, Dbase IV
2) Firebird
3) Oracle
4) Все

150. В каком варианте поставки возможно выполнение следующих функций с данными. Очистка данных: заполнение пропусков, редактирование аномалий, сглаживание, фильтрация

1) Enterprise
2) Professional
3) В любом
4) Academic

151. Какие источники/приемники данных допустимы для поставки Academic

1) Офисные приложения (MS Access, MS Excel, MS Office2007+)
2) Файлы .XML, HTML
3) OLE DB, ODBC, ADO, dbExpress
4) Текстовые файлы

152. В составе какой поставки возможно осуществлять экспорт/ импорт данных используя механизмы обмена OLE DB, ODBC, ADO, dbExpress

1) Enterprise
2) Professional
3) Academic
4) Prof и Enterpr

153. Какой вариант поставки программы «Дедуктор» позволяет использовать БД MS SQL для построения ХД

1) Enterprise
2) Все варианты
3) Professional и Enterprise
4) Academic

154. В состав какой версии программы входят средства аналитической обработки (очистки данных, трансформации данных, построения моделей)

1) Во все версии
2) Prof и Enterpr
3) Enterprise
4) Professional

155. Выберите из предложенных вариантов суть операции «Консолидация»:

1) Пересчет данных
2) Формирование подмножества многомерных массивов данных, соответствующего единственному значению одного или нескольких измерений
3) Переход от детального представления данных к агрегированному
4) Drill Down

156. Какая модель данных более всего чувствительна к изменениям в предметной области анализа

1) ROLAP
2) HOLAP
3) MOLAP
4) OLAP -сервер

157. Выберите верное утверждение для определения OLAP систем:

1) Конкретный программный продукт
2) Инструмент проверки гипотез при анализе данных
3) Инструмент построения хранилища данных
4) Язык программирования

158. Выберите продолжение фразы: «Детализация - это операция …»

1) Изменение расположений измерений в многомерном массиве
2) Очистка данных
3) Drill Down
4) Drill Up

159. Выберите, какие задачи решает OLAP система на телефонной станции:

1) Характеристики постоянных клиентов компании
2) Характеристики, которые отличают клиентов, которые покинули телефонную компанию.
3) Характеристики, которые отличают клиентов, которые, по всей вероятности, собираются отказаться от услуг телефонной компании
4) Средние размеры телефонных счетов бывших клиентов

160. Выберите, какие задачи решает OLAP система в банке:

1) Схемы покупок характерны для мошенничества с кредитными карточками Master Card
2) Отличительные характеристики клиентов с украденной картой VISA
3) Средняя величина ежедневных покупок по украденной кредитной карточке VISA
4) Схемы покупок характерны для мошенничества с кредитными карточками VISA

161. Выберите задачу, решаемую системой класса OLAP

1) Построение дерева решений
2) Группирование объектов на основании данных описывающих их сущность
3) Отнесение объекта анализа к одному из ранее определенных классов
4) Установление зависимости выходных данных от входных

162. Выберите определение "Система оперативного учета - это ….":

1) Система класса ERP
2) Система класса OLAP
3) Экспертная система
4) Система класса OLTP

163. Для какого класса ПО сформулированы 12 правил Кодда

1) ERP
2) OLAP
3) OLTP
4) KDD

164. Выберите неверное утверждение по отношению OLAP системы

1) Система для подготовки данных для принятия управленческих решений
2) Система проверки гипотез, выдвигаемых пользователем
3) Система выявления знаний из данных
4) Ограничение по числу измерений одновременно участвующих в анализе данных

165. Выберите из предложенных вариантов суть операции «Консолидация»

1) Пересчета данных для включения в измерение
2) Изменение расположений измерений в многомерном массиве
3) Переход от детального представления данных к агрегированному
4) Drill Down

166. Какая модель данных более всего чувствительна к изменениям в предметной области анализа

1) ROLAP
2) Реляционная модель
3) HOLAP
4) MOLAP

167. Выберите из предложенных утверждений верное для определения OLAP систем

1) Язык программирования
2) Инструмент построения хранилища данных
3) Инструмент проверки гипотез при анализе данных
4) Это конкретная технология

168. Выберите продолжение фразы: «Вращение измерений - это операция …»

1) Drill Down
2) Переход от детального представления данных к агрегированному
3) Изменение расположений измерений в многомерном массиве
4) Drill Up

169. Выберите, какие задачи решает OLAP система в банке:

1) Отличительные характеристики клиентов с украденной картой VISA по отношению к клиентам с украденной картой Master Card
2) Схемы покупок характерны для мошенничества с кредитными карточками VISA
3) Процент воровства по украденной кредитной карточке VISA
4) Отличительные характеристики клиентов с украденной картой VISA

170. Выберите, какие задачи решает OLAP система при анализе травматизма

1) Определение зависимости тяжести травмы от степени опьянения
2) Отличительные характеристики травматизма в состоянии алкогольного опьянения
3) Факторы лучше всего предсказывающие несчастные случаи в быту
4) Отличительные характеристики несчастных случаев на автотранспорте

171. Выберите задачу, решаемую системой класса OLAP:

1) Прогнозирование результатов исследования
2) Отнесение объекта анализа к одному из ранее определенных классов
3) Построение ассоциативных правил
4) Проверка гипотезы зависимости переменных

172. Выберите определение "Система анализа данных - это …." :

1) Экспертная система
2) Система класса OLTP
3) Система класса ERP
4) Система класса OLAP

173. Выберите верное утверждение для OLAP системы как технологии …

1) Аналитической обработки данных
2) Искусственного интеллекта
3) Разведки данных (data mining)
4) Обработки данных оперативного учета

174. Выберите неверное утверждение по отношению OLAP системы

1) Ограничение по числу измерений одновременно участвующих в анализе данных
2) Система выявления знаний из данных
3) Система проверки гипотез, выдвигаемых пользователем
4) Ограничение исследования по числу уровней агрегации одного измерения

175. Какая модель данных предпочтительна для анализа, когда задачи имеют неопределенность при последующем использовании OLAP системы

1) Сетевая
2) Иерархическая
3) Многомерная
4) Табличная

176. Выберите из предложенных вариантов суть операции «Детализация»:

1) Изменение расположений измерений в многомерном массиве
2) Drill Down
3) Очистка данных
4) Переход от детального представления данных к агрегированному

177. Какая архитектура OLAP будет иметь наименьшее время отклика при анализе данных V3

1) Реляционная модель
2) ROLAP
3) HOLAP
4) MOLAP

178. Выберите из предложенных утверждений неверное для OLAP систем:

1) Ограничение по числу уровней агрегации и путей консолидации данных
2) Инструмент анализа данных
3) Число измерений неограниченно
4) Это всегда поддержка иерархии в данных по измерению

179. Выберите продолжение фразы: Срез данных это операция .. ..»

1) Изменение расположений измерений в многомерном массиве
2) Формирование подмножества многомерных массивов данных, соответствующего единственному значению одного или нескольких измерений
3) Drill Down
4) Drill Up

180. Выберите, какие задачи решает OLAP система на телефонной станции

1) Средние размеры телефонных счетов бывших клиентов
2) Отличительные характеристики клиентов, покинувших компанию, по отношению к характеристикам постоянных клиентов
3) Характеристики постоянных клиентов компании
4) Характеристики, которые отличают клиентов, которые покинули телефонную компанию

181. Выберите, какие задачи решает OLAP система при анализе травматизма

1) Отличительные характеристики несчастных случаев на автотранспорте
2) Факторы лучше всего предсказывающие несчастные случаи в быту
3) Отличительные характеристики случаев травматизма для курящих и некурящих
4) Определение зависимости тяжести травмы от степени опьянения

182. Выберите задачу, решаемую системой класса OLAP

1) Прогнозирование результатов исследования
2) Отнесение объекта анализа к одному из ранее определенных классов
3) Построение ассоциативных правил
4) Проверка гипотезы зависимости переменных

183. Для какого класса ПО сформулирован тест FASMI

1) OLAP
2) OLTP
3) Data Mining
4) ERP

184. Выберите верное утверждение для OLAP системы как технологии …

1) ситуационного управления
2) разведки данных (data mining)
3) аналитической обработки данных
4) аналитической обработки данных

185. Выберите неверное утверждение по отношению OLAP системы

1) Система проверки гипотез, выдвигаемых пользователем
2) Система выявления знаний из данных
3) Получение вероятностных характеристик по данным
4) Получение статистических результатов по данным

186. Выберите задачу кластеризации, решаемую DM

1) Отнесение объекта анализа к одному из ранее определенных классов
2) Проверка гипотезы зависимости переменных
3) Установление коэффициента корреляции между переменными
4) Группирование объектов на основании данных описывающих их сущность

187. Выберите задачу классификации, решаемую DM

1) Группирование объектов на основании данных описывающих их сущность
2) Установление коэффициента корреляции между переменными
3) Проверка гипотезы зависимости переменных
4) Отнесение объекта анализа к одному из ранее определенных классов

188. Продолжите фразу «Главное преимущество нейронной сети - …"

1) Нет необходимости делать гипотезы о важности переменных для анализа
2) Легкая интерпретация результатов в традиционных аналитических терминах
3) Обучение сети
4) Легкая интерпретация результатов с помощью дерева решений

189. Какой из методов DM наиболее употребим для решения задачи прогнозирования

1) Ассоциативные правила
2) Нейронные сети
3) Регрессии
4) Кластеризации

190. Выберите метод, не используемый для решения задач DM

1) Эвристика
2) Статистический анализ
3) Численный метод последовательных приближений
4) Методы теории вероятностей

191. Продолжите фразу: «Методы анализа для любой задачи отличаются …»

1) Во всем
2) Требованиям к данным
3) Качеству результатов
4) По производительности

192. Выберите класс задачи фильтрации электронной почты от спама для поставщика услуги

1) Задача регрессии
2) Задача распознавания образов
3) Задача классификации
4) Задача кластеризации

193. Выберите независимые переменные одного типа для определения кредитоспособности клиента из списка: Фамилия, Имя, Возраст, количество Детей, Зарплата, Стаж, Пол.

1) Ф+И+С+В+З
2) В+Д+З+С
3) Ф+В+Д+З
4) Ф+ В+Д+З+С

194. Какие задачи решает Data Mining для банков

1) Средний возраст клиента просроченной кредитной историей
2) Особенности суммы покупки, характерные для мошенничества с кредитными карточками VISA
3) Доля мошеннических транзакций с VISA по отношению ко всем другим картам
4) Средняя величина ежедневных покупок по украденной кредитной карточке VISA

195. Какие задачи решает Data Mining для операторов телефонной связи

1) Доля клиентов, которые покинули телефонную компанию за предыдущие периоды за долги
2) Характеристики, которые отличают клиентов, отказавшихся от услуг телефонной компании
3) Доля клиентов, которые покинули телефонную компанию за предыдущие периоды
4) Средние размеры телефонных счетов бывших клиентов

196. Какая из методологий ИТ позволяет получать новые знания из данных учета Производственно-хозяйственной деятельности (ПХД) :

1) ERP
2) MRP
3) Разведка данных(data mining)
4) OLAP

197. Суть какой задачи заключается в определении часто встречающихся наборов объектов в большом множестве таких наборов

1) Задача регрессии
2) Задача прогнозирования
3) Задача кластеризации
4) Задача поиск ассоциативных правил

198. Выберите задачу, которая не попадает под «определение» Data mining

1) Распознавание образов
2) Установление коэффициента корреляции между анализируемыми параметрами
3) Прогнозирование результатов
4) Выявление ассоциативных правил

199. Продолжите фразу «Главный недостаток нейронной сети…»

1) Невозможность решать задачи прогнозирования
2) Выбор архитектуры сети (слоев и нейронов в слое)
3) Нет необходимости делать гипотезы о важности переменных для анализа
4) Проведение обучения сети

200. Выберите наиболее простой метод представления знаний решения задачи кластеризации для количественных данных

1) Вербальное описание
2) Линейные зависимости
3) Нелинейные зависимости
4) Продукционные правила

201. Выберите данные, которые не могут участвовать в анализе методами DM

1) Не структурированные данные
2) Количественные результаты
3) Звук
4) Текст

202. Выберите утверждение, которое не подходит к идее применения алгоритмов DМ

1) Математическая статистика и вероятностный подход адекватно описывают предметную область и дают адекватный ответ на решаемую задачу
2) Любая модель – некоторый взгляд на реальность
3) Знания о процессе – всегда в какой-то мере приближение
4) Реальное положение вещей – всегда некоторое уточнение теории

203. Выберите неправильное утверждение по отношении к универсальности способов и алгоритмов анализа для любых объемов и типов данных, используемых в DM

1) Алгоритмы DM в случае решения задачи регрессии для численных данных дают адекватный ответ
2) Нет универсальных способов решения для любых задач
3) Нет универсальных алгоритмов для любых объемов данных
4) Нет универсальных алгоритмов для любых типов данных

204. Выберите неверное утверждение для фразы: «Подготовка данных для анализа производится…»

1) С выделения наиболее значимых параметров в контексте исследования
2) Всегда
3) В зависимости от сложности алгоритма
4) С выбора параметров, характеризующих предметную область

205. Какие задачи решает Data Mining при анализе травматизма

1) Доля травматизма в состоянии алкогольного опьянения
2) Факторы лучше всего предсказывающие несчастные случаи
3) Средние показатели травматизма для курящих и некурящих
4) Доля несчастных случаев на автотранспорте

206. Главный недостаток нейронной сети

1) Интерпретация результатов в традиционных аналитических терминах
2) Нет необходимости делать гипотезы о важности переменных для анализа
3) Невозможность решать задачи прогнозирования
4) Возможность аппроксимации любой функции

207. Выберите параметры, которые не могут участвовать в анализе методами DM

1) Параметр типа «дата»
2) Категориийные параметры
3) Числовые
4) Неизменяемые параметры (не имеют данных по измерению)

208. Выберите утверждение, которое не подходит к идее применения алгоритмов DМ

1) Математическая статистика и вероятностный подход дают адекватный ответ в задачах DM
2) Знания о процессе – всегда в какой-то мере приближение
3) Реальное положение вещей – всегда некоторое уточнение теории
4) Похожие ситуации на входе приводят к похожим выходным реакциям

209. Выберите правильное продолжение фразы «Методы анализа для любой задачи отличаются …»

1) Во всем
2) Качеству результатов
3) Требованиям к данным
4) Способам обработки данных

210. Выберите неверное утверждение для фразы: «Подготовка данных для анализа производится…»

1) Всегда
2) С исключением зависимых параметров методами статистического анализа
3) В зависимости от анализируемого набора данных
4) С исключением зависимых параметров исходя из целей исследования

211. Какие задачи решает Data Mining для операторов телефонной связи:

1) Доля клиентов, которые покинули телефонную компанию за предыдущие периоды
2) Средние размеры телефонных счетов бывших клиентов
3) Характеристики, которые отличают клиентов, отказавшихся от услуг телефонной компании
4) Средние размеры телефонных счетов существующих клиентов

212. Обработчик «Конечные классы» предназначен для решения задач

1) Прогнозирования загруженности веб-сервиса
2) Снижения разнообразия значения признаков без ущерба для информативности данных
3) Анализа эластичности спроса
4) Диагностики финансового состояния

213. Обработчик «Конечные классы» предназначен для решения задач

1) Анализа эластичности спроса
2) Снижения размерности данных за счет исключения признаков с низкой значимостью
3) Прогнозирования загруженности веб-сервиса
4) Прогнозирования поведения клиента

214. Обработчик «Конечные классы» предназначен для решения задач

1) Выявления целевой аудитории
2) Обнаружения аномалий
3) Восстановления пропусков
4) Анализа эластичности спроса

215. Обработчик «Конечные классы» предназначен для решения задач

1) Кластеризации клиентов
2) Поведенческого таргетинга
3) Анализа миграции клиентов
4) Борьбы с выбросами и экстремальными значениями

216. Обработчик «Конечные классы» предназначен для решения задач

1) Анализа миграции клиентов
2) Прогнозирования загруженности веб-сервиса
3) Обнаружения аномалий
4) Упрощения описания исследуемых объектов

217. В формуле WoEi=ln(F-/F+), i - это...

1) Информационный индекс
2) Относительная частота появления событий в классе
3) Индекс начального класса
4) Относительная частота появления не-событий в классе

218. В формуле WoEi=ln(F-/F+), F+ - это...

1) Информационный индекс
2) Относительная частота появления событий в классе
3) Индекс начального класса
4) Относительная частота появления не-событий в классе

219. В формуле WoEi=ln(F-/F+), F- - это...

1) Информационный индекс
2) Относительная частота появления событий в классе
3) Относительная частота появления не-событий в классе
4) Индекс начального класса

220. В формуле (Картинка: https://clck.ru/akCNj ) VI - это...

1) Информационный индекс
2) Относительная частота появления событий в классе
3) Относительная частота появления не-событий в классе
4) Индекс начального класса

221. Карта Кохонена – это …

1) Название обработчика исходного множества
2) Способ анализа исходной выборки
3) Популярный алгоритм оптимизации на сетевой модели
4) Самообучающаяся нейронная сеть для кластеризации

222. Кластеризацию также называют …

1) Сортировкой
2) Квантованием
3) Сегментацией
4) Прогнозированием

223. Преимуществами карт Кохонена является …

1) Все вышеперечисленное
2) Быстрое и неуправляемое обучение
3) Возможность визуализировать многомерные входные данные
4) Устойчивость к зашумленным данным

224. Результат обучения самоорганизующихся карт Кохонена зависит от …

1) Не зависит от структуры данных
2) От структуры выходных данных
3) От входных и выходных данных
4) От структуры входных данных

225. При обучении самоорганизующихся карт используется метод …

1) Преобразования
2) Обучения без учителя
3) Группировки
4) Уменьшения неопределенности

226. Количество нейронов в сетке определяет …

1) Разрядность таблицы
2) Степень детализации результата работы алгоритма
3) Количество строчек
4) Количество столбцов

227. Перед началом обучения карты Кохонена необходимо …

1) Проинициализировать весовые коэффициенты нейронов
2) Преобразовать последовательность значений ряда
3) Исключить неполные записи
4) Отобрать наиболее важные данные

228. Самоорганизующиеся карты – это …

1) Одна из разновидностей нейросетевых алгоритмов
2) Набор искусственных нейронов, связанных между собой
3) Процесс автокорреляционного анализа
4) Набор информационных индексов

229. В алгоритме SOM существует … конфигурация сетки

1) Треугольная и прямоугольная
2) Шестиугольная
3) Прямоугольная и шестиугольная
4) Прямоугольная

230. На рисунке изображена (Картинка: https://clck.ru/akCXi )

1) Набор данных
2) Карта Кохонена
3) Временной ряд
4) Дерево решений

231. Кластеризация - это …

1) Самообучающаяся модель, имитирующая деятельность человеческого мозга
2) Алгоритм построения моделей бинарной классификации и вероятностного предсказания
3) Популярный алгоритм классификации, в котором решающие правила извлекаются непосредственно из исходных данных в процессе обучения
4) Выделение из исходного множества данных групп объектов со схожими свойствами

232. Кластеризация может быть применена для …

1) Прогнозирования распространения инфекционного заболевания
2) Каннибализации товаров
3) Коррекции распределений
4) Снижения трудоёмкости

233. Центроид – это …

1) Начальный центр кластера
2) Центр кластера
3) Центр тяжести кластера
4) Центральное значение ряда

234. Недостаток алгоритма k-means заключается в том, что …

1) Отсутствует ясный критерий для выбора оптимального числа кластеров
2) Когда границы кластеров и расположение центроидов перестает изменяться производится остановка алгоритма
3) Алгоритм находит набор стабильных кластеров за несколько десятков итераций
4) Необходимо вычислять центроиды

235. Алгоритм, позволяющий производить автоматический выбор оптимального числа кластеров на основании гауссовского (нормального) закона распределения называется …

1) k-means
2) f-means
3) g-means
4) l-means

236. Кластеризация лучше, когда …

1) Объекты разных кластеров имеют минимальные отличия
2) В кластерах насчитывается одинаковое количество объектов
3) Объекты внутри кластеров сильно схожи, а объекты разных кластеров сильно отличаются
4) Объекты внутри кластеров сильно различаются, и объекты разных кластеров имеют много свойств

237. Кластеризация позволяет …

1) Получить прогноз непрерывных числовых переменных
2) Разбить исходный набор данных на два подмножества (обучающее и тестовое).
3) Провести оценку качества наборов данных на основе количества обнаруженных пропусков, выбросов и экстремальных значений
4) Улучшить понимание данных за счет выявления структурных групп

238. Алгоритм кластеризации k-means состоит из …

1) 2 шагов
2) 3 шагов
3) 5 шагов
4) 4 шагов

239. Алгоритм кластеризации k-means останавливается, когда …

1) Произведено вычисление всех центроидов
2) Для каждой записи исходной выборки определён ближайший к ней центр кластера
3) Найдены все начальные центры кластеров
4) Границы кластеров и расположение центроидов перестают изменяться (на каждой итерации в каждом кластере остается один и тот же набор записей)

240. По способу разбиения на кластеры алгоритмы бывают двух типов:

1) Иерархические и неиерархические
2) Восходящие и нисходящие
3) Сужающиеся и расширяющиеся
4) Линейные и нелинейные

241. Логистическая регрессия – алгоритм построения модели…

1) Пороговой фильтрации
2) Мультизначной классификации
3) Мультиклассовой классификации
4) Бинарной классификации

242. Преимуществом алгоритма логистической регрессии является возможность …

1) Лёгкий подбор
2) Высокая точность классификации
3) Высокая вычислительная стоимость
4) Оценки качества модели

243. Регрессионное уравнение для преобразования стандартного уравнения регрессии …

1) P=1/(1-e)
2) P=1/(1+e^-y)
3) P=1/(1+e)
4) P=1/(1-e^-y)

244. Для ROC-анализа верно классифицированные положительные примеры относятся к классу:

1) FP
2) FN
3) TN
4) TP

245. Для прогнозирования вероятности наличия заболеваний положительным исходом будет класс …

1) Нельзя определить
2) Пациент
3) Здоровый пациент
4) Больной пациент

246. Чувствительность модели определяет …

1) Долю ложно отрицательных случаев
2) Долю истинно положительных случаев
3) Долю истинно отрицательных случаев
4) Долю ложно положительных случаев

247. Специфичность модели определяет …

1) Долю ложно отрицательных случаев
2) Долю ложно положительных случаев
3) Долю истинно отрицательных случаев
4) Долю истинно положительных случаев

248. Методом оценки сравнения ROC-кривых является …

1) Оценка синусов кривых
2) Оценка площадей под кривыми
3) Оценка тангенсов кривых
4) Оценка длин кривых

249. Модель с численным показателем площади под ROC-кривой равной единице называется …

1) Средней
2) Отличной
3) Неудовлетворительной
4) Идеальной

250. Когда прогнозирование появляется в мастере обработки?

1) После включения в настройках
2) После сортировки данных
3) После построения нейросети
4) Есть всегда

251. Что имеет смысл прогнозировать?

1) Варианты решения гипотезы Коллатца
2) Сумма продаж за год
3) Результаты голосования
4) Символы числа пи

252. Какой фактор не нужен для прогнозирования?

1) Горизонт прогнозирования
2) Окно прогноза
3) Столбец с данными
4) Глубина погружения

253. Что такое горизонт прогноза?

1) То, на сколько вперёд идёт прогноз
2) Первые значения прогноза
3) Исходные данные
4) Предел разброса

254. Какой прогноз обычно используется, если объём выборки данных мал?

1) Прогноз невозможен
2) Интуитивный прогноз
3) Прогноз с построением пользовательских моделей
4) Прогноз с использованием нейросети

255. Что обеспечивает качество построения модели прогноза?

1) Очистка данных от шумов
2) Фильтрация данных по временному периоду
3) Сортировка данных
4) Применение пользовательских моделей

256. В чём преимущество прогнозирования с применением пользовательских моделей?

1) Отсутствие задающихся формул
2) Возможность краткосрочного прогноза
3) Возможность долгосрочного прогноза
4) Простота настроек и быстрота построения

257. С помощью чего можно определить сезонность временного ряда?

1) Сглаживание
2) Автокорелляция
3) Прогнозирование
4) Очистка от шумов

258. Сколько столбцов данных необходимо для прогнозирования временного ряда?

1) 6
2) 3
3) 1
4) 2

259. Что используется при построении прогноза временного ряда?

1) Всё вышеперечисленное
2) Построение модели прогноза
3) Сглаживание
4) Очистка

260. Что обработчик “декомпозиция временного ряда” выделяет и изучает?

1) Составляющие временной прямой
2) Алгоритм разложения
3) Систематическую составляющую и случайную компоненту временного ряда
4) Временной ряд

261. Как используется прогнозирование спроса и оптимизация запасов?

1) Обработчик позволяет рассчитать оптимальность производства для избежания избыточности.
2) Обработчик позволяет предсказать спрос на товар, помочь с определением выработки производства
3) Обработчик позволяет предсказать поведение рынка
4) Обработчик позволяет автоматически находить сезонность и тренды, учесть влияние множества внешних факторов.

262. Как улучшить эффективность рекламных кампаний при помощи декомпозиции временного ряда?

1) Невозможно предсказать тенденции напрямую, потому данный инструмент не актуален для данной задачи
2) Обработчик позволяет определить эффект маркетинговых компаний, который представляет собой разницу между достигнутым уровнем продаж и тем уровнем продаж, который был бы достигнут без проведения акции
3) Обработчик использует данные для прогноза продаж после рекламной компании
4) Обработчик позволяет предопределить тренды продаж

263. Обработчик “прогнозирование и оптимизация пассажиропотока” используется для ...

1) Для избежания транспортных заторов и регулировки городского трафика
2) Автоматического составления расписания общественного транспорта
3) Составления маршрутов для оптимальной работы общественного транспорта
4) Автоматического нахождения сезонности и трендов в изменении спроса на определенный вид транспорта

264. Что необходимо контролировать на основе данных обработчика “прогнозирование и оптимизация пассажиропотока” ?

1) Мероприятия по регулированию транспортного парка
2) Мероприятия, связанные с перекрытием дорожного движения
3) Работу светофоров
4) Работу парковок

265. Функция исходного ряда в декомпозиции временного ряда:

1) y(t)=x(t)-s(t)
2) Y(t)=x(t)*s(t)*z(t)
3) Y(t)=x(t)+s(t)
4) Y(t)=x(t)+s(t)+z(t)

266. В функции исходного ряда в декомпозиции временного ряда x(t) это …

1) Случайная остаточная составляющая
2) Сезонная составляющая, периодически повторяющаяся компонента временного ряда
3) Остаток – величина, показывающая нерегулярную составляющую исходного ряда в определённом временном интервале
4) Тренд, устойчивая долговременная тенденция изменения значений временного ряда

267. В функции исходного ряда в декомпозиции временного ряда y(t) это …

1) Случайная остаточная составляющая
2) Остаток – величина, показывающая нерегулярную составляющую исходного ряда в определённом временном интервале
3) Тренд, устойчивая долговременная тенденция изменения значений временного ряда
4) Сезонная составляющая, периодически повторяющаяся компонента временного ряда

268. Результаты анализа декомпозиции временного ряда удобно оценивать с помощью визуализаторов

1) Трехмерная диаграмма и трехмерная таблица
2) Отчёт и функция зависимости
3) Диаграмма декомпозиции и настройка тренда и сезонных индексов
4) Моделирование трендов и прогнозирование изменений зависимых величин

269. В функции исходного ряда в декомпозиции временного ряда z(t) это …

1) Случайная остаточная составляющая
2) Сезонная составляющая, периодически повторяющаяся компонента временного ряда
3) Остаток – величина, показывающая нерегулярную составляющую исходного ряда в определённом временном интервале
4) Тренд, устойчивая долговременная тенденция изменения значений временного ряда

270. Выводы, полученные в ходе декомпозиции временного ряда, можно использовать ...

1) В качестве основного материала для определения общей динамики, прогнозирования
2) При определении ошибок в ходе принятия решений в прошлом
3) В области исторического анализа случайных событий
4) Для составления точной стратегии развития

271. Метод вращения варимакс –

1) Метод, цель которого – минимизировать количество переменных, имеющих высокие нагрузки на данных фактор
2) Метод, цель которого – выделить характерные признаки и персональные предпочтения клиентов
3) Метод, цель которого - дать возможность определить эффект от маркетинговых акций, который представляет собой разницу между достигнутым уровнем продаж и тем уровнем продаж, который был бы достигнут без проведения акции
4) Метод, цель которого – минимизировать количество факторов, необходимых для объяснения данной переменной

272. Метод вращения квартимакс –

1) Метод, цель которого – выделить характерные признаки и персональные предпочтения клиентов
2) Метод, цель которого - дать возможность определить эффект от маркетинговых акций, который представляет собой разницу между достигнутым уровнем продаж и тем уровнем продаж, который был бы достигнут без проведения акции
3) Метод, цель которого – минимизировать количество переменных, имеющих высокие нагрузки на данных фактор
4) Метод, цель которого – минимизировать количество факторов, необходимых для объяснения данной переменной

273. Алгоритм факторного анализа базируется на …

1) Методе геометрической оптики
2) Методе теоретического программирования
3) Методе главных компонент
4) Методологиии типизации данных

274. Суть метода главных компонент заключается в …

1) Распознавание образов
2) Преобразовании исходной матрицы и расчете собственных чисел
3) Возможности выделить характерные признаки и персональные предпочтения клиентов
4) Смешении и интеграции разнородных данных, таких как цифровая обработка сигналов и обработка естественного языка

275. Критерий значимости:

1) Отбираются только факторы с собственными значениями равными или большими 1
2) Особенно эффективен, когда модель генеральной совокупности известна и отсутствуют второстепенные факторы.
3) Данный критерий сочетает статистическую точность с субъективными интересами
4) Факторы ранжируются по доле детерминируемой дисперсии, когда процент дисперсии оказывается несущественным, выделение следует остановить

276. Процедура вращения факторов …

1) Перераспределение дисперсии по определённому методу
2) Используется для разбиения всего диапазона изменения того или иного признака на несколько начальных классов
3) Используется для максимизации значимости признака в бинарной классификационной модели
4) Процедура сокращения уникальных значений признака

277. Факторный анализ –

1) Позволяет уменьшить число значений исходного набора данных за счет их объединения в пределах некоторого интервала с использованием информации о бинарной выходной переменной
2) Выделяет и изучает составляющие временного ряда: систематическую составляющую (тренд, сезонность) и случайную (нерегулярную) компоненту или остаток
3) Перемещение клиентов между поставщиками товаров и услуг, причиной которой является изменение их запросов со временем
4) Многомерный метод, применяемый для изучения взаимосвязей между значениями переменных

278. Основная цель факторного анализа: A. определение взаимосвязей между переменными, (классификация переменных), то есть «объективная R-классификация»; B. сокращение числа переменных необходимых для описания данных.

1) Только А
2) Только В
3) А и В
4) Нет правильного ответа

279. Факторный анализ может быть:

1) Разведочным
2) Биохимическим
3) Описательным
4) Казуальным

280. Факторный анализ может быть:

1) Индуктивным
2) Казуальным
3) Конфирматорным
4) Биохимическим

281. Нагрузка, как понятие факторного анализа …

1) Воздействие на организм, вызывающее прибавочную функциональную активность и определяющее степень преодолеваемых трудностей
2) Количественный показатель, описывающий интенсивность или продолжительность работы функции
3) Часть цены, которую инвестиционные компании открытого типа запрашивают сверх чистой стоимости своих фондов
4) Корреляция между исходной переменной и фактором

282. Преимуществом EM-алгоритма кластеризации является:

1) Возможность построения желаемого числа кластеров
2) Возможность визуализировать многомерные входные данные
3) Отсутствие задающихся формул
4) Возможность долгосрочного прогноза

283. Преимуществом EM-алгоритма кластеризации является:

1) Быстрая сходимость при удачной инициализации
2) Возможность краткосрочного прогноза
3) Быстрое и неуправляемое обучение
4) Отсутствие задающихся формул

284. Нейронные сети могут использоваться для:

1) Прогноза остатков на счетах
2) Обнаружения аномалий
3) Разведочного анализа данных
4) Кластеризации клиентов

285. Нейронные сети могут использоваться для:

1) Оценки кредитоспособности клиента
2) Обнаружения аномалий
3) Борьбы с выбросами и экстремальными значениями
4) Поведенческого таргетинга

286. Нейронные сети могут использоваться для:

1) Кластеризации клиентов
2) Упрощения описания исследуемых объектов
3) Медицинской диагностики
4) Поведенческого таргетинга

287. Обработчик Конечные классы –

1) Подразумевает выделение из исходного множества данных групп объектов со схожими свойствами
2) Используется для обработки огромных массивов транзакционных данных, разбивая их таким образом, чтобы похожие операции оказались в одном кластере, а отличающиеся друг от друга – в разных
3) Мощный самообучающийся механизм кластеризации, позволяющий отобразить результаты в виде компактных и удобных для интерпретации двумерных карт
4) Позволяет уменьшить число значений исходного набора данных за счет их объединения в пределах некоторого интервала с использованием информации о бинарной выходной переменной

288. Кластеризация транзакций –

1) Используется для обработки огромных массивов транзакционных данных, разбивая их таким образом, чтобы похожие операции оказались в одном кластере, а отличающиеся друг от друга – в разных.
2) Мощный самообучающийся механизм кластеризации, позволяющий отобразить результаты в виде компактных и удобных для интерпретации двумерных карт.
3) Подразумевает выделение из исходного множества данных групп объектов со схожими свойствами
4) Позволяет уменьшить число значений исходного набора данных за счет их объединения в пределах некоторого интервала с использованием информации о бинарной выходной переменной

289. EM (Expectation-maximization) кластеризация –

1) Мощный самообучающийся механизм кластеризации, позволяющий отобразить результаты в виде компактных и удобных для интерпретации двумерных карт.
2) Популярный алгоритм кластеризации, позволяющий эффективно работать с большими объемами данных
3) Используется для обработки огромных массивов транзакционных данных, разбивая их таким образом, чтобы похожие операции оказались в одном кластере, а отличающиеся друг от друга – в разных.
4) Позволяет уменьшить число значений исходного набора данных за счет их объединения в пределах некоторого интервала с использованием информации о бинарной выходной переменной

290. Автокорреляция –

1) Используется для обработки огромных массивов транзакционных данных, разбивая их таким образом, чтобы похожие операции оказались в одном кластере, а отличающиеся друг от друга – в разных.
2) Мощный самообучающийся механизм кластеризации, позволяющий отобразить результаты в виде компактных и удобных для интерпретации двумерных карт.
3) Популярный алгоритм кластеризации, позволяющий эффективно работать с большими объемами данных
4) Используется при анализе временного ряда в целях обнаружения закономерности поведения ряда (например, сезонной периодичности или тренда), а также построения прогноза его дальнейшего развития

291. Линейная регрессия –

1) Предназначена для получения прогноза непрерывных числовых переменных
2) Позволяет уменьшить число значений исходного набора данных за счет их объединения в пределах некоторого интервала с использованием информации о бинарной выходной переменной
3) Мощный самообучающийся механизм кластеризации, позволяющий отобразить результаты в виде компактных и удобных для интерпретации двумерных карт.
4) Популярный алгоритм кластеризации, позволяющий эффективно работать с большими объемами данных

292. Выберите первый шаг алгоритма кластеризации k-means

1) Для каждой записи исходной выборки определяется ближайший к ней центр кластера
2) Случайным образом выбирается k записей, которые будут служить начальными центрами кластеров
3) Задается число кластеров k, которое должно быть сформировано из объектов исходной выборки.
4) Производится вычисление центроидов - центров тяжести кластеров

293. Выберите второй шаг алгоритма кластеризации k-means

1) Производится вычисление центроидов - центров тяжести кластеров
2) Для каждой записи исходной выборки определяется ближайший к ней центр кластера
3) Случайным образом выбирается k записей, которые будут служить начальными центрами кластеров
4) Задается число кластеров k, которое должно быть сформировано из объектов исходной выборки.

294. Выберите третий шаг алгоритма кластеризации k-means

1) Для каждой записи исходной выборки определяется ближайший к ней центр кластера
2) Случайным образом выбирается k записей, которые будут служить начальными центрами кластеров
3) Задается число кластеров k, которое должно быть сформировано из объектов исходной выборки.
4) Производится вычисление центроидов - центров тяжести кластеров

295. Выберите четвертый шаг алгоритма кластеризации k-means

1) Случайным образом выбирается k записей, которые будут служить начальными центрами кластеров
2) Задается число кластеров k, которое должно быть сформировано из объектов исходной выборки.
3) Для каждой записи исходной выборки определяется ближайший к ней центр кластера
4) Производится вычисление центроидов - центров тяжести кластеров

296. Преимуществом линейной регрессии является …

1) Широкая применимость
2) Всё вышеперечисленное
3) Скорость и простота получения модели
4) Интерпретируемость модели

297. Логистическая регрессия –

1) Подразумевает выделение из исходного множества данных групп объектов со схожими свойствами
2) Разновидность множественной регрессии, предназначенная для классификации записей на основании значений входных полей
3) Предназначена для получения прогноза непрерывных числовых переменных
4) Популярный алгоритм кластеризации, позволяющий эффективно работать с большими объемами данных

298. Дерево решений –

1) Популярный алгоритм классификации, в котором решающие правила извлекаются непосредственно из исходных данных в процессе обучения.
2) Подразумевает выделение из исходного множества данных групп объектов со схожими свойствами
3) Предназначена для получения прогноза непрерывных числовых переменных
4) Популярный алгоритм кластеризации, позволяющий эффективно работать с большими объемами данных

299. Алгоритм «Дерево решений» предназначен для решения задач:

1) Прогнозирования поведения клиента
2) Поведенческого таргетинга
3) Анализа эластичности спроса
4) Оценки кредитоспособности клиента при выдаче кредитов

300. Алгоритм «Дерево решений» предназначен для решения задач:

1) Поведенческого таргетинга
2) Диагностики различных заболеваний
3) Кластеризации клиентов
4) Анализа эластичности спроса

301. Для чего предназначена спектральная обработка?

1) Для прогнозирования загруженности веб-сервиса
2) Метод, применяемый для изучения взаимосвязей между значениями переменных
3) Улучшить понимание данных за счет выявления структурных групп
4) Для очистки от шумовой составляющей и сглаживания рядов данных.

302. Корреляционный анализ –

1) Применяется для оценки степени зависимости между парами факторов, производится с целью отбора и предобработки входных полей для использования в обучаемых на данных моделях
2) Используется для обработки огромных массивов транзакционных данных, разбивая их таким образом, чтобы похожие операции оказались в одном кластере, а отличающиеся друг от друга – в разных
3) Подразумевает выделение из исходного множества данных групп объектов со схожими свойствами
4) Мощный самообучающийся механизм кластеризации, позволяющий отобразить результаты в виде компактных и удобных для интерпретации двумерных карт