Работа с БД и статистическая обработка
Поможем в ✍️ написании учебной работы
Поможем с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой

БД – структурированный организованный набор данных, описывающих хар-ки каких-либо физич или виртуальных с-м. Организация структуры БД формируется исходя из: адекватность описываемому объекту или с-ме и удобство использования для ведения учета и анализа данных. Концептуальные БД – сущность-связь, семантические и графовые.

Логические модели БД – документальные (архивы) и фактографические (картотеки).

По модели представления данных БД классифицируются на: картотеки, иерархические, сетевые, реляционные, многомерные, объектно-ориентированные и дедуктивные.

На уровне физической модели БД представляет собой файл или их набор в формате TXT, CSV, Excel, DBF, XML и др.

В настоящее время наиболее распространены реляционные БД.

СУБД – специализир программа, а чаще комплекс программ, предназначенная для организации и ведения БД. Ее основные функции:

- управление данными на дисках, в оперативной памяти, журнализация изменений, резервное копирование и восстановление БД после сбоев

Классификация СУБД: по типу управляемой БД – иерархические, сетевые, реляционные, объектно-реляционные, объектно-ориентированные. По архитектуре организации хранения данных – локальные (все части размещены на одном компе) и распределенные (части на двух и более компах).

БД – совок-ть спец образом структурированных и взаимосвязанных данных, относящихся к определенной предметной области или прикладной задаче, предназначенных для хранения и выдачи пользователям по их запросу.

Ведение БД включает в себя – проектирование БД, непосредственно ввод данных, их редактирование, поиск данных по запросам пользователей, анализ и печать данных с помощью отчетов.

Для удобной и наглядной работы с данными СУБД предоставляется возможность создать окна, в которых отображается информация из БД, называемые Формами. В этих окнах, помимо данных, находится вспомогательная инф, характеризующая эти данные и возможные действия над ними. Окна являются основной частью информац с-мы. Окна и меню составляют интерфейс БД.

СУБД предоставляет возможность создания и печати итоговых документов по имеющейся в БД инф. Для этого используется генератор отчетов. Также здесь можно задать упорядочение и группировку данных по тем или иным значениям и сформировать значения для конкретных полей.

Существует большое кол-во СУБД (Debass, Paradox, Clipper). Одна из самых популярных – Microsoft Access.

БД – движущая сила директ-маркетинга. Хорошая Бд – 50% его успешности. Четкая отобранность ЦА. Соответствие БД целевой ауд является неотъемлемым условием успеха.

В БД следует отличать 4 основных категории данных:

- основные данные (адреса покупателей и т.н. постоянные данные о них, которые не зависят от предлагаемого фирмой товара и от потребит предпочтений покупателя).

- данные об акциях (+ о почтовых рассылках, которые достигли ЦА)

- данные об ответе (о реакции ЦА – заказы, запросы).

- данные о потенциальных возможностях (ориентированы на будущее и содержат инф, определяющую возможный спрос на определенную продукцию в определ момент в будущем. Дают основания прогнозировать ценность покупателей).

Данные о реальных и потенциальных покупателях должны регулярно обновляться и содержаться в идеальном порядке. Каждый контакт с каждым покупателем должен использоваться по назначению для того, чтобы актуализировать базу данных.

Иерархическая модель. Изображается в виде упорядоченного набора деревьев, вершины которых связаны вертикальными отношениями.

Сетевая модель. Позволяет любому объекту быть связанным с любым другим объектом, т.е. в ней существуют горизонтальные связи.

Объектно-ориентированная. Появилась в рез-те развития объектно-ориентировочного программирования, обеспечивает доступ к различным источникам данных; применяется в системе автоматизированного проектирования, моделирования, мультимедиа, издательском деле.

Реляционная. Совокупность характеризующих определенные предметные области двухмерных таблиц, инф в которых хранится в виде упорядоченных наборах записей, строк, таблиц.

Программы статистической обработки данных

Статистич анализ данных – один из обязательных этапов любого исследования. Все программы статистич обработки можно разделить на профессиональные, полупроф (популярные) и специализир (ориентированы на определенную узкую область анализа данных).

MS Excel. Широкое Распространение, наличие русскоязычной версии, тесная интеграция с Word и PowerPoint. Но статистич ф-ции просто доп встроенные формулы. Невозможно построить качественные научные графики. Хорошо подходит для накопления данных, промежуточного преобразования, предварительных статистич прикидок, для построения некоторых видов диаграмм. Существует макрос-дополнение XLSTAT-Pro, который включает в себя более 50 статистич ф-ций. STADIA. Программа отечественной разработки с 16-и летней историей. Все необходимые статистич ф-ции. Но внешне фактически не изменяется с 1996 года. Графики и диаграммы выглядят архаично. Цветовая гамма программы (красный шрифт на зел) очень утомляет в работе.

SPSS (Statistical Package for Social Science). Самый часто используемый пакет. http://www.spss.com/ Гибкость и мощность. Предназначен для всех этапов аналитич процесса: планирования, сбора данных, доступа к ним и управления ими, анализа, создания отчетов и распространения рез-тов. ПО, позволяющее решать бизнес-проблемы и исследовательские задачи, используя статистические методы. Позволяет проводить частотный анализ, описательную статистику, корреляционный анализ, дисперсионный, кластерный, факторный и регрессионный.

При помощи аналитических возможностей программы можно получить данные - наиболее выгодные сегменты рынка, стратегии позиционирования относительно аналогичных товаров/услуг конкурентов, оценка качества клиентами, перспективы развития, новые возможности для роста, подтверждение или опровержение исследовательских гипотез.

STATA. Профессиональный пакет с data-management system. STATISTICA. Включает большое кол-во методов, более 250 встроенных функций. Возможности провести непараметрическую статистику, Дисперсионный анализ, Множественная регрессия, Нелинейное оценивание, Анализ временных рядов и прогнозирование, Кластерный анализ, факторный, дискриминантный функциональный анализ, Многомерное шкалирование.

JMR. Один из мировых лидеров в анализе. SYSTAT, MINITAB 14

NCSS. рассчитана на непрофессионалов.

STATGRAPHICS PLUS.

 

МЕТОДЫ АНАЛИЗА ИНФ

Корредяционный анализ (корреляция – мера зависимости переменных. От -1 до +1. Если = о, связь между переменными отсутствует. Если =-1, то переменные имеют строго отрицат зависимость (чем выше, тем ниже). Если =+1 – строго положит зависимость.

Совместный анализ — для оценки и сравнения атрибутов продуктов с целью выявления тех, которые оказывают наибольшее влияние на покупат решения. Достоинство метода - возможность выявить латентные факторы, влияющие на поведение потребителей.

Кластерный анализ — совокупность методов, позволяющих классифицировать многомерные наблюдения, каждое из которых описывается неким набором переменных. Цель - образование групп схожих между собой объектов (кластеров). При помощи кластерного анализа можно производить сегментацию рынка (например, выделение приоритетных групп потребителей). Применение к сегментированию (выделение групп схожих потребителей). Для обоснования предположений используется метод дисперсионного анализа.

Дисперсионный анализ. С его помощью исследуют влияние одной или несколько независимых переменных на одну зависимую или на несколько зависимых переменных. Позволяет определить достоверность гипотез (например, можно проверить гипотезу о различиях двух групп потребителей, выделенных при помощи кластеризации). В отличие от корреляционного анализа не дает возможности оценить тесноту связи между переменными.

Регрессионный анализ. метод установления зависимости между независимыми и зависимыми переменными. На основе построенного уравнения регрессии определяет вклад каждой независимой переменной в изменение изучаемой (прогнозируемой) зависимой величины. В маркетинге часто используется для прогнозирования спроса.

Факторный анализ. На основе реально существующих связей признаков (или объектов) позволяют выявлять латентные, обобщающие хар-ки изучаемых явлений и процессов. Главная цель – классификация переменных. Классификация подразумевает выделение нескольких новых факторов из переменных связанных друг с другом. В маркетинге используется в связи с углублением анализа потребит поведения, развитием психографики и т.п.

 

Дата: 2019-05-28, просмотров: 219.