авторефераты диссертаций БЕСПЛАТНАЯ  БИБЛИОТЕКА

АВТОРЕФЕРАТЫ КАНДИДАТСКИХ, ДОКТОРСКИХ ДИССЕРТАЦИЙ

<< ГЛАВНАЯ
АГРОИНЖЕНЕРИЯ
АСТРОНОМИЯ
БЕЗОПАСНОСТЬ
БИОЛОГИЯ
ЗЕМЛЯ
ИНФОРМАТИКА
ИСКУССТВОВЕДЕНИЕ
ИСТОРИЯ
КУЛЬТУРОЛОГИЯ
МАШИНОСТРОЕНИЕ
МЕДИЦИНА
МЕТАЛЛУРГИЯ
МЕХАНИКА
ПЕДАГОГИКА
ПОЛИТИКА
ПРИБОРОСТРОЕНИЕ
ПРОДОВОЛЬСТВИЕ
ПСИХОЛОГИЯ
РАДИОТЕХНИКА
СЕЛЬСКОЕ ХОЗЯЙСТВО
СОЦИОЛОГИЯ
СТРОИТЕЛЬСТВО
ТЕХНИЧЕСКИЕ НАУКИ
ТРАНСПОРТ
ФАРМАЦЕВТИКА
ФИЗИКА
ФИЗИОЛОГИЯ
ФИЛОЛОГИЯ
ФИЛОСОФИЯ
ХИМИЯ
ЭКОНОМИКА
ЭЛЕКТРОТЕХНИКА
ЭНЕРГЕТИКА
ЮРИСПРУДЕНЦИЯ
ЯЗЫКОЗНАНИЕ
РАЗНОЕ
КОНТАКТЫ

Научное мероприятие как объект информационной деятельности: базы данных и информационные продукты

На правах рукописи

Пожидаев Алексей Викторович НАУЧНОЕ МЕРОПРИЯТИЕ КАК ОБЪЕКТ ИНФОРМАЦИОННОЙ ДЕЯТЕЛЬНОСТИ:

БАЗЫ ДАННЫХ И ИНФОРМАЦИОННЫЕ ПРОДУКТЫ Специальность 05.25.05 Информационные системы и процессы, правовые аспекты информатики

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

Москва – 2008

Работа выполнена во Всероссийском институте научной и технической информации (ВИНИТИ) РАН

Научный консультант: Цветкова Валентина Алексеевна профессор, доктор технических наук

Официальные оппоненты: Черный Аркадий Иванович профессор, доктор технических наук Глухов Виктор Алексеевич кандидат технических наук

Ведущая организация: Библиотека по естественным наукам (БЕН) РАН

Защита состоится 28 января 2009 года, в 11 часов на заседании диссертационного совета Д002.026.01 при Всероссийском институте научной и технической информации РАН по адресу: 125190, Москва, ул. Усиевича, д.20, корп.1.

С диссертацией можно ознакомиться в библиотеке ВИНИТИ РАН

Автореферат разослан 22 декабря 2008 г.

Ученый секретарь диссертационного совета профессор, доктор технических наук В.А. Цветкова

Общая характеристика работы

Актуальность темы Научные коммуникации являются основой и транспортной средой науки. Без общения, без обмена опытом и мнениями невозможно достижение научных результатов. Если до конца 20-го столетия одной из наиболее эффективных форм научного общения были конференции, симпозиумы и другие научные мероприятия с прямым общением участников, то сейчас наибольшее значение приобретают научные коммуникации с использованием технологий Интернета (электронная почта, электронные журналы, электронные конференции и т.д.). Однако эти технологии не могут полностью заменить непосредственное общение ученых и специалистов, поэтому значение традиционных научных мероприятий остается востребованным.

Для того чтобы быть на передовом крае науки, специалист должен владеть информацией о проводимых мероприятиях по профилю его научной деятельности. Учитывая то, что по очень грубым оценкам в мире ежегодно проводится свыше 5 тысяч научных мероприятий (фундаментальные и технические науки), выбор и самостоятельное формирование подобного пользовательского списка представляется достаточно трудоемким процессом. До появления Интернета единственным источником сводных, систематизированных сведений о научных мероприятиях были печатные издания, наиболее ценными среди них - сводные обобщающие материалы. Практически все информационные центры издают или издавали подобные информационные материалы, научные общества и организации рассылали списки планируемых мероприятий. В ВИНИТИ РАН таким изданием является «Бюллетень международных научных съездов, конференций, конгрессов, выставок», издающийся с 1960 г. Сейчас автоматизированные и телекоммуникационные технологии активно вытесняют печатные издания, которые становятся производным элементом от самостоятельно развивающихся электронных технологий, основанных на поддержании банков данных. Банки данных становятся основным информационным продуктом, при этом пользователь получает принципиально новые возможности: он может активно работать со всем ретроспективным объемом данных, иметь доступ к оперативно подготавливаемой информации.

Принимая во внимание вышеизложенное, актуальность создания системы была продиктована не только научно-методическими соображениями, но и возможной коммерческой эффективностью.

Степень разработанности проблемы Проведенный в течение 2005 – 2007 гг. анализ показал, что вопросами сбора и систематизации данных о проводимых научных мероприятиях занимается достаточно большое количество организаций, причем большинство из них предоставляет через Интернет бесплатный доступ к созданным ресурсам. Примером таких агрегаторов в России являются Министерство образования и науки Российской Федерации (Федеральное Агентство по Науке и Инновациям) http://www.fasi.gov.ru и Информационная система “Наука и Инновации” http://www.rsci.ru. Среди зарубежных источников можно упомянуть сайты http://www.allconferences.com, http://www.eventseye.com/, http://atlas conferences.com/, сайты крупнейших информационных центров (ВИНИТИ РАН, ИНИОН РАН, British Library, The Library of Congress, Chemical Abstracts Service, INIST - Institute for Scientific and Technical Information France).

Многие поисковые машины имеют разделы, связанные с информацией по конференциям. Например, самый крупный поисковик Google имеет специализированный раздел http://www.google.com/Top/Science/Conferences/.

Однако более детальный анализ web-сайтов (порталов) со списками планируемых мероприятий показал, что практически каждый из них охватывает сравнительно небольшой объем информации (в большинстве случаев случайной или очень узкой тематики), информация плохо структурирована, пользовательский интерфейс ориентирован на англоязычного пользователя.

К сожалению, в открытом доступе практически отсутствует информация о принципах наполнения и функционирования подобных ресурсов. Дальнейшее рассмотрение технологий использования информации о научных мероприятиях проводилось на примере ВИНИТИ РАН.

До 2005 года информация о научных мероприятиях, поступавшая в ВИНИТИ РАН, аккумулировалась в регистрационном массиве опубликованных материалов, т.к. информация о мероприятиях собиралась на основе выпущенных по их итогам сериальных изданий и (или) изданий книжного типа.



В то время было исследовано три варианта использования информации из регистрационного массива – наполнение электронного каталога НТЛ, создание указателя прошедших научных мероприятий, информация о которых находится в фондах ВИНИТИ РАН и наполнение «Бюллетеня научных съездов, конференций, конгрессов, выставок».

Однако информация в регистрационном массиве опубликованных материалов отличалась отсутствием формализации и отсутствием контроля на дублирующиеся записи, причем дублирование возможно как физическое (копии), так и смысловое (если на источниках указанно было разное наименование конференции), что затрудняло ее использование.

Поэтому в ВИНИТИ РАН началась работа по созданию массива данных по научным мероприятиям, информация о которых находится в сфере внимания Института - ведущего информационного центра страны в области научно-технической информации. Важным фактором необходимости создания такого продукта является формирование механизма для обеспечения наиболее полных и ценных поступлений во входной поток Института материалов прошедших конференций объемной и важной его составляющей. Следует отметить, что в большинстве случаев материалы конференций - бесплатный информационный продукт, часто становится решающим фактором при комплектовании входного потока научно-технической литературы (НТЛ).

Наличие оперативно поддерживаемого массива планируемых научных мероприятий позволит автоматизировать процессы взаимодействия с оргкомитетами для получения соответствующих материалов. В качестве примера важности научных мероприятий можно отметить то, что Банк данных ВИНИТИ РАН включает до 20% из статей, взятых из материалов научных мероприятий.

На пути к созданию подобного массива приходится сталкиваться с некоторыми трудностями, как то: отсутствие надежных каналов получения информации (зачастую, даже организаторы мероприятия до последнего момента не имеют точной информации о дате и месте проведения), разные стили оформления материалов разными организациями и объективные трудности, связанные с переводом не русскоязычной информации.

Дополнительную сложность создает разнообразие ситуаций, в которых может проходить научное мероприятие. Если еще 30 лет назад такие случаи можно было ограничить заочными конференциями, то уже 10 лет назад возникло понятие "мероприятие, проводимое в сети Internet".

В самом деле, развитие компьютерной техники и растущая глобализация позволяют проводить мероприятие, которое если не по содержанию, то, по крайней мере, по технологии проведения, отличается от традиционных мероприятий 20-го века.





Такие мероприятия, например, не имеют географического места проведения, они могут не иметь четких сроков проведения, материалы таких мероприятий могут не публиковаться в виде бумажных изданий.

Оргкомитет таких мероприятий тоже достаточно расплывчат, ведь для организации электронной конференции необходимы, по сути, только участники и кто-то, кто возьмет на себя роль "организатора" – предоставит серверные мощности и обеспечит связь между участниками и рассылку оповещений.

Учитывая тенденции развития современного общества в целом и науки в частности, такие мероприятия будут проводиться все чаще и будут постепенно вытеснять традиционные конференции, где участникам часто приходилось ехать в другую страну, а организаторам испытывать проблемы с размещением участников и регламентом мероприятия.

Цель работы Цель работы заключается в разработке модели информационного объекта "описание научного мероприятия" для обработки, нормализации и классификации информации о научных мероприятиях на примере ВИНИТИ РАН для расширения спектра информационных продуктов.

Задачи работы Задачами, решаемыми в данной работе, являлись:

• Создание единого и четко структурированного массива описаний научных мероприятий;

• Создание механизмов формирования существующих и новых информационных продуктов в автоматизированном режиме;

• Разработка технологического процесса обработки информации о научных мероприятиях, технологии обеспечения жизненного цикла информационных объектов «описание научного мероприятия» и интеграция новой технологии в существующие технологические процессы;

• Создание программного обеспечения, призванного обеспечить:

необходимые инструменты управления для администраторов массива мероприятий;

автоматизированные рабочие места для пользователей массива мероприятий;

механизмы формирования оригинал-макетов печатных информационных продуктов и взаимодействие с существующими программными продуктами;

• Разработка концепции раздела, посвященного научным мероприятиям на сайте ВИНИТИ РАН в рамках электронного каталога НТЛ с реализацией функций представления клиентам информации о научных мероприятиях, на примере ВИНИТИ РАН, предоставления подписчикам информации об анонсированных мероприятиях и сбора информации о предстоящих мероприятиях непосредственно от организаторов;

• Разработка и создание оффлайновой версии раздела электронного каталога НТЛ, посвященного научным мероприятиям, для распространения на электронных носителях.

Объект исследования В качестве объекта исследования рассматривались описания научных конференций, симпозиумов, семинаров, выставок и т.п., проводившихся или планирующихся к проведению по всему миру, по любой тематике и имеющих в качестве рабочего языка основные европейские языки.

Методы исследования Методологической основой данной работы является системный анализ. Для теоретических исследований применялись методы теории вероятностей, математической статистики, теории информации.

Научная новизна работы Впервые сформулирована концепция классификации описаний научных мероприятий по схеме «разовое/серийное», разделения описаний совместно проходящих мероприятий, создания «обобщенных монотематических» и «обобщенных политематических» описаний, объединяющих серии регулярных описаний, что позволяет обнаруживать «лакуны» - отсутствующие в базе данных описания мероприятий и сохранять цепочку мероприятий, даже в том случае, если мероприятие за свою историю неоднократно кардинально меняло название.

Доказана возможность формирования массива сведений, относящихся к определенной области человеческих знаний, путем обработки и использования в технологических процессах и в создании готовых продуктов мультимедийной информации на примере информации о научных мероприятиях.

Обоснованность и достоверность результатов работы Обоснованность и достоверность результатов диссертационной работы подтверждаются успешным практическим использованием созданной базы данных по научным мероприятиям в технологических процессах Всероссийского Института Научной и Технической Информации РАН, а также:

Результатами анализа существующих отечественных и зарубежных печатных сборников и электронных информационных ресурсов, содержащих анонсы научных мероприятий;

Применением в функциональных модулях технологии программных средств, основанных на международных стандартах;

Увеличением запрашиваемости одного из основных изданий ВИНИТИ РАН, посвященного анонсам научных мероприятий – «Бюллетеня международных научных съездов, конференций, конгрессов, выставок».

Практическая значимость работы Разработанная автоматизированная система обработки информации о российских и зарубежных научных мероприятиях имеет большое практическое значение в деятельности ВИНИТИ РАН крупнейшего информационного центра, обеспечивающего с 1952 г.

российское и мировое сообщество научно-технической информацией по проблемам точных, естественных и технических наук.

В процессе разработки технологии обработки информации и создания программного обеспечения были реализованы оригинальные алгоритмы обработки и нормализации произвольной информации, нашедшие применение и в других программных продуктах, разрабатываемых в ВИНИТИ РАН.

В результате создания единого массива описаний научных мероприятий сформирована база данных о прошедших научных мероприятиях, которая имеет важное значение для профильных специалистов, комплектования библиотек и информационных центров.

При создании автоматизированной системы были сформированы словари понятий и словари с переводами этих понятий на основные языки, что важно для мирового научного сообщества.

В результате перевода технологии формирования оригинал макета «Бюллетеня международных научных съездов, конференций, конгрессов, выставок» на использование автоматизированной технологии формирования оригинал-макета и увеличения количества регистрируемых анонсов, удалось вернуть интерес подписчиков к изданию и улучшить ситуацию с тиражами.

Создание раздела, посвященного научным мероприятиям, на сайте свидетельствует о внимании к современным тенденциям в области информации и обеспечивает оперативный доступ для посетителей сайта к интересующей их информации. Формируемый на основе той же информации CD-ROM с оффлайновой версией раздела сайта ВИНИТИ РАН, посвященного научным мероприятиям, является новым и перспективным информационным продуктом ВИНИТИ РАН.

Информационные листы, формируемые в автоматизированном режиме из анонсов мероприятий, относящихся к определенным тематикам, стали неотъемлемой частью одного из основных продуктов ВИНИТИ РАН – Реферативного журнала.

Реализация результатов работы Разработанная в рамках диссертационной работы технология наполнения базы данных по научным мероприятиям и формирования на ее основе информационных продуктов внедрена и успешно используется в ВИНИТИ РАН Области применения результатов Результаты работы могут быть использованы в самых разнообразных областях человеческой деятельности, связанных с обработкой информации и, в том числе, обработкой неструктурированной информации.

Также, результаты работы имеют практическую ценность с точки зрения реализации алгоритмов сбора, обработки, корректировки информации и формирования на ее основе различных информационных продуктов.

После адаптации, система может быть использована для создания указателя выставок, системы анализа информации, рассеянной в Интернете, на интересующую заказчика тему, подсистемы учета выступлений на конференциях молодых ученых и формировании индекса цитирования на основе материалов конференций.

Апробация работы Материалы диссертации докладывались на следующих конференциях:

13-я Международная конференция «Крым 2006. "Библиотеки и информационные ресурсы в современном мире науки, культуры, образования и бизнеса"» (Украина, г. Судак, 2006);

7-я Международная конференция «Научно-техническая информация – 2007» Информационное общество: инновации в информационном обслуживании (Россия, г. Москва, 2007);

10-я Юбилейная международная научно-практическая конференция "SCIENCE ONLINE: электронные информационные ресурсы для науки и образования" (Египет, г. Шарм эль-Шейх, 2007).

Положения, выносимые на защиту 1. Разработка структуры информационного объекта "описание научного мероприятия";

2. Методика создания и поддерживания единого массива описаний научных мероприятий с использованием методов обработки частично формализованной информации;

3. Технология обработки и использования информации об отечественных и зарубежных научных мероприятиях для создания различных информационных продуктов на основе единого массива.

Публикации Основные результаты изложены в 6 опубликованных работах, список которых приводится на стр. 23-24. В журналах включенных в перечень ВАК России – 1 публикация Структура и объем диссертации Диссертация состоит из введения, трех глав, заключения, списка цитируемой литературы, включающего 95 наименований, и приложения. Работа изложена на 131 странице машинописного текста, иллюстрированного 55 рисунками и 10 таблицами..

Содержание работы Во введении дана общая характеристика работы, обоснована актуальность выбранной темы, сформулированы цели и задачи исследования, показана научная новизна и практическая ценность работы.

Кратко изложено содержание диссертации по главам.

В первой главе (Информационный объект «научное мероприятие» как основа для функционирования базы данных) приведен анализ существующих сборников описаний научных мероприятий и форматов описаний. Анализируется разработанный формат информационного объекта «описание научного мероприятия».

Приводится структура массива, объединяющего описания научных мероприятий. Рассматриваются имеющиеся технологические потоки и их особенности. Большое внимание уделено аспекту обработки неформализованной информации о научных мероприятиях с применением алгоритмов нечеткого сравнения строк и созданных словарей основных терминов на различных языках. Исследуется существующая программно технологическая поддержка массива научных мероприятий.

Рассматриваются основные элементы описания научного мероприятия, приводится анализ структуры описаний научных мероприятий в различных печатных сборниках и электронных ресурсах, рассматривается структура описания в создаваемом информационном массиве и иерархия этих описаний.

Анализируется структура массива описаний научных мероприятий, ее реализация в СУБД MS SQL Server и программное обеспечение. На рисунке 1 приведены основные таблицы массива мероприятий.

Секции (EVENTS_UP_SECT) PK Идентификатор Номер секции Основная таблица (EVENTS_UP) Название секции PK Идентификатор Тип секции Наименование оригинальное Номер к наименованию Наименование русскоязычное Тематика (EVENTS_UP_RUB) Параллельное наименование мероприятия Тип мероприятия PK Идентификатор Форма проведения мероприятия Язык БО Код тематики (ГРНТИ) Параллельный язык БО Код тематики (РЖ) Характер мероприятия Географический охват мероприятия Состав участников Актуальность описания Организаторы (ORGMAIN2) День начала проведения мероприятия Месяц начала проведения мероприятия PK Идентификатор Год начала проведения мероприятия День окончания проведения мероприятия Статус организатора Месяц окончания проведения мероприятия Порядковый номер организатора Год окончания проведения мероприятия Код организатора Страна проведения Наименование организатора полное Место проведения мероприятия Наименование организатора краткое Адрес мероприятия Аббревиатура наименования организатора Рабочий язык Язык БО Ключевые слова Страна расположения организатора Краткое резюме Город официального расположения организатора Корреспондентский адрес Электронная почта Телефон организатора Факс организатора Электронный адрес организатора ФИО контактного лица организатора Ученая степень контактного лица Должность контактного лица Материалы мероприятия (EVENTS_UP_MATER) PK Идентификатор Связи между описаниями мероприятий (EVENTS_UP_SVZ) Порядковый номер материала Вид материала PK Идентификатор связи Наличие материалов в ВИНИТИ Вид носителя материала Идентификатор мероприятия Сведения об опубликованных материалах Тип связи Рис. 1 Основные таблицы массива мероприятий Исследуются имеющиеся информационные потоки, технология наполнения массива научных мероприятий, приводятся данные по подразделениям, участвующим в наполнении массива. Рассматриваются особенности, присущие внутренним и внешним потребителям информации о научных мероприятиях. На рисунке 2 приведена общая схема получения, обработки и использования информации.

Нормализация Перевод Внешний Информационные мир продукты и услуги Электронные Электронные источники продукты Создание Регистрация Хранение Информационных продуктов Печатные Печатные источники продукты Прочие Корреспонденция источники Прочие продукты Контактные лица Сбор Протоколирование оргкомитетов статистики Администраторы системы Рис. 2 Общая схема получения, обработки и использования информации Приведена статистика по наполнению массива научных мероприятий, а также различные срезы массива (по типу, по месту проведения мероприятий, по тематике и т.д.) Рассмотрены основные аспекты обработки неформализованной или частично формализованной информации о научных мероприятиях на примере обработки данных из регистрационного массива опубликованных материалов, где хранится информация о научных мероприятиях. Приведены данные сравнительного анализа структур описаний в массиве научных мероприятий и регистрационном массиве.

Рассмотрен алгоритм обработки описаний из регистрационного массива.

Приводится обоснование использования нечеткого сравнения строк при поиске дублирующихся описаний мероприятий. Исследуются различные алгоритмы сравнения, приводятся сравнительные тесты этих алгоритмов.

Обосновывается применение в итоговой обработке алгоритма, основанного на сравнении по q-граммам (использовался модифицированный алгоритм, использующий поиск по хеш-ключам, представляющим собой сложную структуру, в основание которой положены частотные сигнатуры строк по биграммам для ускорения времени работы и снижения объема служебной работы). Временная сложность (T) алгоритма составляет:

( ) T = O B + A B q где А, В – длины сравниваемых строк, E – размер алфавита q – величина q-граммы;

Также, описывается алгоритм, использующий коэффициент совпадения подстрок, который показал неплохие результаты и может быть рекомендован к применению в тех случаях, где время работы не является критичным, а возможности создания служебных таблиц с q граммами и (или) хеш-ключами отсутствуют. Временная сложность (T) алгоритма составляет:

j ( ( m k + 1) ( n k + 1) ), T= k= где m,n – длины сравниваемых строк, k – значение длины подстроки, j - максимальное значение длины подстроки;

Рассматривается программно-технологическая поддержка массива научных мероприятий, основные технологические процессы, связанные с массивом, и приводятся соответствующие функции программного обеспечения.

Во второй главе (Разработка технологии формирования традиционных информационных продуктов) обосновывается и предлагается новая технология формирования оригинал-макетов в программе MS Word на основе сведений, поступающих из базы данных.

Рассмотрена технология, внедренная в ВИНИТИ РАН.

Рассмотрены особенности технологии формирования оригинал макетов печатных изданий объемом до 300 страниц в программе MS Word, входящей в состав пакета MS Office и являющегося, де-факто, стандартной комплектацией современного компьютера. Рассмотрена технология формирования оригинал-макета «Бюллетеня международных научных съездов, конференций, конгрессов, выставок» - сборника анонсов научных мероприятий (выпускается ВИНИТИ РАН с 1960 года).

Обоснованы преимущества формирования «Бюллетеня международных научных съездов, конференций, конгрессов, выставок» по новой технологии, выразившиеся в упрощении технологии создания оригинал-макета, добавлении новых классификаторов, изменении внутреннего оформления, увеличении объема и, как следствие, повышении качества и стабилизации тиража. Иллюстрация этого приведена далее на рисунке 3.

Приведены результаты разработки технологии формирования оригинал-макетов Информационных листов для включения последних в Реферативный журнал ВИНИТИ РАН. Рассмотрены ее отличия от технологии формирования оригинал-макета «Бюллетеня международных научных съездов, конференций, конгрессов, выставок».

Продемонстрирована универсальность разработанных подходов и приведены предложения по дальнейшему расширению области применения этого аспекта настоящей работы.

Рис. 3 Сравнительный анализ тенденций в Бюллетене научных съездов, конференций, конгрессов, выставок Третья глава (Разработка технологии формирования электронных информационных продуктов) посвящена разработке подходов к созданию электронных информационных продуктов.

Рассмотрен опыт применения современных технологий в ВИНИТИ РАН, выразившийся в создании электронного каталога НТЛ, расположенного на сайте ВИНИТИ РАН (http://www.viniti.ru). Обоснована структура и особенности электронного каталога НТЛ. Приведено описание концепции подраздела «Научные мероприятия», обеспечивающего взаимодействие с массивом мероприятий интернет пользователей. Разработана структура базы данных, являющейся посредником между массивом мероприятий, предназначенным для внутреннего пользования, и его отображением на публичном веб-сайте, и интерфейсные решения с подробным описанием функционала. На рисунке 4 приведена концепция иерархии раздела, посвященного научным мероприятиям.

Веб-сервер ВИНИТИ Http://www.viniti.ru Электронный каталог поступлений ВИНИТИ Http://catalog.viniti.ru Раздел «Научные мероприятия» Http://catalog.viniti.ru/ conf.asp Массив научных мероприятий Http://catalog.viniti.ru/ conf_mas.asp Рассылка информации с анонсами Http://catalog.viniti.ru/ conf_mail.asp Добавление сведений о мероприятии Http://catalog.viniti.ru/ conf_add.asp Рис. 4 Иерархия раздела, посвященного научным мероприятиям Рассмотрены аспекты взаимодействия администраторов массива мероприятий с интернет-пользователями. Приведено описание технологии рассылки сообщений об анонсированных мероприятиях пользователям посредством электронной почты, а также, технология получения анонсов мероприятий непосредственно от организаторов.

Использован опыт ведущего зарубежного информационного портала – ConferenceAlerts.com (http://www.conferencealerts.com).

Исследованы особенности создания оффлайновых электронных продуктов. Сформирована экспериментальная база данных «Научные мероприятия», предназначенная для распространения на электронных носителях. Приведены особенности технологии формирования подобных продуктов и описаны возможности использования имеющегося продукта и возможности создания новых с минимальными затратами.

В заключении изложены основные результаты диссертационной работы.

Основные результаты работы 1. В ходе выполнения работы был создан единый и четко структурированный массив описаний научных мероприятий. При этом была решена основополагающая задача – разработка структуры информационного объекта – «описание научного мероприятия».

2. Разработан технологический процесс обработки информации о научных мероприятиях. Освоена технология обеспечения жизненного цикла информационных объектов «описание научного мероприятия». Произведена интеграция новой технологии в существующие в ВИНИТИ РАН технологические процессы, в том числе, в процессы формирования информационных продуктов. В процессе разработки технологических процессов была спроектирована и реализована в реляционной СУБД структура массива научных мероприятий.

Одним из аспектов технологического процесса обработки информации о научных мероприятиях стала обработка регистрационного массива опубликованных материалов, который содержал в 5 раз больше описаний, чем имелось в тот момент в массиве описаний научных мероприятий. Несовпадение форматов описаний в этих массивах, а также отсутствие формализации в регистрационном массиве потребовало применения алгоритмов нечеткого сравнения строк, специально созданных словарей и оригинальных программных решений. В результате сократился объем работы для пользователей и администраторов системы по обработке данных из регистрационного массива опубликованных материалов.

3. Спроектировано и реализовано программное обеспечение, включающее все инструменты управления для администраторов массива мероприятий, а также автоматизированные рабочие места для пользователей массива мероприятий. Разработаны и введены в эксплуатацию механизмы формирования оригинал макетов печатных информационных продуктов и взаимодействия с существующими программными продуктами. Созданное программное обеспечение удовлетворяет запросам пользователей и отвечает всем требованиям, предъявляемым к современным интерфейсам в плане эргономики и стиля.

4. Разработаны механизмы формирования существующих и новых информационных печатных продуктов в автоматизированном режиме. Использование автоматизированной технологии формирования оригинал-макетов печатных продуктов позволило улучшить качественное и количественное наполнение «Бюллетеня международных конференций, конгрессов, съездов, выставок», что положительным образом сказалось на запросах, а также продемонстрировало, что предоставляемая информация и форма ее подачи востребованы подписчиками ВИНИТИ РАН.

Созданные с применением новой технологии печатные информационные продукты в форме информационных листов, стали неотъемлемой частью Реферативного журнала ВИНИТИ РАН.

5. Разработана концепция обновленного и усовершенствованного раздела, посвященного научным мероприятиям на сайте ВИНИТИ РАН в рамках электронного каталога НТЛ с реализацией функций представления клиентам информации о научных мероприятиях, материалы которых имеются в ВИНИТИ РАН, предоставления подписчикам информации об анонсированных мероприятиях и сбора информации о предстоящих мероприятиях непосредственно от организаторов.

6. Разработана и создана оффлайновая (off-line) версия раздела электронного каталога НТЛ посвященного научным мероприятиям для распространения на электронных носителях.

Исследована возможность создания других информационных продуктов, в том числе, предназначенных для конкретных пользователей.

Список работ, опубликованных по теме диссертации 1. Егоров В. С., Пожидаев А. В., Чернобровская Т. Н. Систематизация и использование сведений о научных мероприятиях в автоматизированной технологии ВИНИТИ. // НТИ. Сер. 1. – 2006. – №4.– С.17-23.

2. Новые информационные продукты и услуги на основе обработки входного потока НТЛ / Батюшко А. А., Егоров В. С., Кириллова О. В., Пожидаев А. В., Федорец О. В., Фишер А. М., Чернобровская Т. Н., Шапкин А. В.;

ВИНИТИ РАН – Москва, 2006. – 114 с. – Библиогр.: назв. – Рус. – Деп. в ВИНИТИ 13.04.06 № 474-В2006.

3. Пожидаев А. В. Обработка сведений о научных мероприятиях:

инструментальные и технологические средства. Труды 13-й международной конференции Крым 2006. "Библиотеки и информационные ресурсы в современном мире науки, культуры, образования и бизнеса", 10-18 июня 2006 г., г. Судак, Автономная Республика Крым, Украина.

4. Пожидаев А. В. Особенности построения массива сведений о научных мероприятиях. // НТИ. Сер. 2. – 2007. – No10. – С. 25-31.

5. Пожидаев А.В. Задача обработки неформализованных данных для дальнейшего формирования на их основе информационных продуктов на примере массива сведений о научных мероприятиях.

Материалы 7-ой международной конференции НТИ-2007.

"Информационное общество, интеллектуальная обработка информации, информационные технологии".

6. Пожидаев А.В. Модель формирования тематической базы данных на примере информации о научных мероприятиях и исследование быстродействия этой модели. // Нелинейный мир. – 2008. – No2. – Т. – С. 129-

 

Похожие работы:





 
2013 www.netess.ru - «Бесплатная библиотека авторефератов кандидатских и докторских диссертаций»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.