Реализация модуля статистической обработки информации

Реализация модуля статистической обработки информации

Для анализа данных, вводимых в Информационно-Аналитическую Базу (ИАБ) разрабатываемого Автоматизированного Рабочего Места (АРМ) поддержки кадрового потенциала промышленного комплекса (ПК), необходимо было создать модуль статистической обработки информации, функциями которого являются:

статистическая обработка накопленных в ИАБ данных;
получение информации, необходимой для прогнозирования;
вывод на экран монитора графика, отображающего как имеющиеся (первичные) данные, так и полученные после статистической обработки (вторичные). Модуль позволяет использовать следующие методы статистической обработки информации:
адаптивное экспоненциальное сглаживание;
модель Tempo Reale;
двойное экспоненциальное сглаживание Tyvek;
однопараметрическое экспоненциальное сглаживание Брауна (Brown);
метод скользящего усреднения;
метод среднего взвешенного. Данные методы позволяют построить прогноз и выявить тренд (тенденцию развития). Отчетный период, за который в ИАБ хранятся данные, может быть не только годом, но и кварталом. Поэтому помимо тренда необходимо было выявить возможные сезонные колебания. В связи с этим в модуле статистической обработки информации реализованы методология Хольта-Винтерса (Holt-Wnters) и методология Тейла-Вейджа (Tale-Wage). Реализованные методы довольно полно покрывают проблемы выявления тренда и сезонных колебаний при построении прогноза по выбранному показателю состояния кадрового потенциала ПК.

Источники информации для уточнения запросов в Информационно-Аналитическую Базу

При составлении запроса пользователь обычно использует слова, которые имеют достаточно широкое толкование и встречаются в текстах разной тематической направленности, что не позволяет получить результирующий список документов, удовлетворяющий пожеланиям пользователя. Одним из наиболее перспективных вариантов улучшения качества работы поисковых систем является уточнение пользовательского запроса на основе внутренних данных системы. Самым важным вопросом реализации данной задачи является выбор источников для построения семантических структур. В качестве основных источников рассматриваются: статистические данные по запросам пользователей, статьи тематических словарей, тексты тематических каталогов. В процессе работы с запросами пользователей анализируются частотные характеристики встречаемости слов, а также особое внимание уделяется эволюции запросов каждого отдельного пользователя в процессе работы с системой. Потому что пользователь, как правило, уточняет свой запрос на основе полученных результатов поиска. При работе с тематическими словарями анализируются словарные статьи, содержащие информацию о синонимах. Информация тематических каталогов имеет большую ценность только при условии, что каждый тематический раздел ведется компетентным в этой области человеком. В масштабах интернет этого добиться практически невозможно. Из рассмотренных источников в качестве наиболее удобного для использования в поисковых системах выделим анализ пользовательских запросов, который в сочетании со статистическими методами анализа позволяет автоматически пополнять базу знаний поисковой системы. На основе данного метода построена подсистема ассоциативных запросов в системе Rambler.

Дата публикации 25.04.2012, 15:55