ЭЛЕКТРОННЫЕ БИБЛИОТЕКИ: ПЕРЕСПЕКТИВНЫЕ МЕТОДЫ И ТЕХНОЛОГИИ,
ЭЛЕКТРОННЫЕ КОЛЛЕКЦИИ. Девятая всероссийская научная конференция г.
Переславль-Залесский, 15-18 октября 2007 года. Российский фонд
фундаментальных исследований, Московская секция ACM SIGMOD, Российская
академия наук, Институт программных систем РАН, Институт проблем
информатики РАН

Российский фонд фундаментальных
исследований

Обзор Программа RCDL 2007 Детали

15 октября

9.00 (Зал С ) Выезд из Москвы и регистрация в гостинице

14.00 (Зал А ) Открытие конференции

14.00 – 14.30. С.М. Абрамов, И.С. Некрестьянов, С.В. Знаменский. Приветствие (30 мин.).

Приветствие директора ИПС РАН и сопредседателей программного комитета RCDL участникам конференции.

14.30 – 15.00. П. Мехра, И. Белоусов. HP Labs в России: обзор исследований и возможности кооперации (30 мин.).

HP Labs в России: обзор исследований и возможности кооперации

15.00 (Зал С ) Кофейный перерыв

15.15 (Зал А ) Тьюториалы RCDL.

15.15 – 17.15. Th. Risse. Approaches for large scale digital library infrastructures (2 часа // Том 1, c. ).

Abstract. Current plans for next generation DL architectures are aiming for a transition from the DL as an integrated, centrally controlled system to a large scale federation of DL services and information collections. The transition is driven by DL "market" needs and inspired by new technology trends that promise to solve at least part of these market needs. With the uptake of DLs in a wider community there is a need for better and adaptive tailoring of the content and service offer of a DL to the needs of the respective community as well as to the current service and content offer. Furthermore, there is a need for more systematic exploitation of existing resources like information collections, metadata collections, and services for making DLs more cost-effective as well as a need for opening up of DL technology to a wider. New technologies and paradigms like Peer-to-Peer networking and Service-oriented Architectures (SOA) suggest digital libraries that operate on more demand-oriented and flexible distributed or decentralized infrastructures. The tutorial aims to introduce to the audience various central aspects of bringing digital libraries to large scale infrastructures by discussing core ideas and related architectural options. Furthermore, it introduces the underlying technologies as a foundation for the understanding of the concrete solutions. The main part of the tutorial revolves around the following selected DL topics:

Content and Metadata Management
Navigation through the information space

For each of the topics the key challenges are discussed together with possible solutions for the challenges and the lessons learned in implementing these solutions. The solutions are illustrated with concrete examples and small system demos from the BRICKS project.

17.15 (Зал С ) Кофейный перерыв

17.30 (Зал А ) Тьюториалы RCDL.

17.30 – 19.30. G. Amato, P. Bolettieri, F. Debole, F. Falchi, C. Gennaro, F. Rabitti, P. Savino. A Tutorial on the MILOS Multimedia Content Management System (2 часа // Том 1, c. 16-34).

Abstract. In this paper we present the MILOS Multimedia Content Management System. MILOS supports the storage and content based retrieval of any multimedia documents whose descriptions are provided by using arbitrary metadata models represented in XML. It provides developers of digital library applications with functionalities for dealing with heterogeneous digital documents, heterogeneous metadata, and metadata schema mapping. This paper shows how to configure and use all MILOS components.

16 октября

9.30 (Зал А ) Научные электронные библиотеки.
Наукометрия и оценка инновационного потенциала

9.30 – 10.00. И.М. Зацман, С.К. Шубников. Принципы обработки информационных ресурсов для оценки инновационного потенциала направлений научных исследований (30 мин. // Том 1, c. 35-44).

Аннотация. Доклад посвящен проблеме оценки инновационного потенциала направлений научных исследований с использованием информационных полнотекстовых ресурсов патентных электронных библиотек, доступ к которым предоставляется Роспатентом. Анализируется структура и наполнение информационных полнотекстовых ресурсов Роспатента. Показано, что современные исследования взаимосвязей технологических разработок с результатами научных исследований и вычисление индикаторов для количественной оценки этих взаимосвязей, включая оценку инновационного потенциала научных результатов, основаны на анализе и обработке массивов описаний изобретений к патентам, содержащих ссылки на научные публикации. Однако задача вычисления индикаторов предъявляет ряд требований к методологии обработки информационных ресурсов, а также к степени детализации схем ресурсов патентных электронных библиотек. Одно из этих требований заключается в дополнительной структуризации ссылок на цитируемые документы в полнотекстовых информационных ресурсах патентных электронных библиотек и баз данных.

10.00 – 10.30. М.Р. Когаловский, С.И. Паринов. Информационные ресурсы, наукометрические показатели и показатели качества метаданных системы Соционет (30 мин. // Том 1, c. 45-54).

Аннотация. Система Соционет является первой и в настоящее время единственной в нашей стране глобальной информационной научно-образовательной социальной сетью в области общественных наук. Система предоставляет свободный доступ пользователей к ее информационным ресурсам, интегрирована в международную научную информационную сетевую инфраструктуру, является одним из источников информационных ресурсов для разрабатываемого Единого научного информационного пространства РАН. Соционет разрабатывалась и развивается в рамках международных инициатив RePEc (Research Papers in Economics) и OAI (Open Archives Initiative), поддерживает их соглашения и стандарты. Наряду с этим в системе поддерживается сложная структура связей между информационными ресурсами. Благодаря более развитой архитектуре информационных ресурсов система обеспечивает новые функциональные возможности для доступа пользователей, появляются возможности для расширенных наукометрических измерений и оценки показателей качества поддерживаемых метаданных. В предлагаемой работе приводятся общие характеристики Соционет, рассматриваются организация и методы интеграции ее информационных ресурсов, обсуждаются возможности наукометрических измерений в системе, а также показатели качества системных метаданных.

10.30 – 11.00. B. Cruz, P. Blesa, T. Krichel, J. Osca-Lluch, E. Velasco. Evaluation of INCISO: A system for automatic elaboration of a Citation Index in Social Science Spanish Journal (30 мин. // Том 1, c. 55-58).

Abstract. We have developed a system that can elaborate a citation index in an automated way. It has been tested with Spanish journals. We need evaluate our system, mainly in effectiveness of the retrieval of citations. Criteria for evaluation of the system is presented and discussed, and the results of the application to our system are showed and analyzed.

11.00 (Зал С ) Стендовые доклады c кофе

С.Д. Тарасов. Подход к реализации автоматизированной системы построения тезауруса (постер // Том 2, c. 63-66).

Аннотация. В статье рассматриваются практические аспекты создания автоматизированной системы построения тезауруса. Определяются основные проблемы организации современных тезаурусов и методы их построения. Рассматривается проблема автоматической генерации тезаурусов на основе лингвистических источников разного типа: результатов анализа корпусов текстов, дефиниций толковых словарей, данных ассоциативных словарей и т.д. Описывается предлагаемая архитектура автоматизированной системы генерации тезаурусов для любой предметной области на основе лингвистических источников и при помощи участия независимых асессоров.

Е. Рабчевский. Автоматическое построение онтологий (постер // Том 2, c. 37-40).

Аннотация. Рассмотрена проблема автоматизации процесса построения онтологий с помощью анализа знаний, представленных в Веб ресурсах. Предложен метод автоматического построения формальных семантических моделей, обозначен подход к решению задачи привязки формальных моделей к предметной области.

Ю.И. Молородов, А.М. Федотов. Электронные библиотеки и базы данных для задач экологии (постер // Том 2, c. 14-17).

Аннотация. Технологии разработки электронных библиотек позволяют создавать информационные структуры, предназначенные для интеграции распределенных баз данных наблюдений, мониторинга, анализа и моделирования состояния экосистем. Они обеспечат возможность для изучения и прогнозирования природных, социальных и экономических последствий, вызванных как естественными, так и антропогенными изменениями в экосистемах. Это позволит разработать рекомендации и подходы к оптимальному управлению функционированием экосистем.

Д.Е. Куликов, Л.Б. Сукина, С.С. Николаев. Электронный каталог библиотеки Университета города Переславля им. А.К. Айламазяна (постер // Том 2, c. 20-22).

Аннотация. В статье даётся информация о библиотеке Университета города Переславля, рассматриваются цели и идеи в необходимости создания электронного каталога библиотеки. Описываются требования к структуре, функциональности, интерфейсу каталога. В статье указываются особенности, преимущества и назначение системы в рамках библиотеки университета.

11.25 (Зал А ) Научные электронные библиотеки.
Электронные библиотеки в науках о Земле

11.25 (3-й этаж ) Информационный поиск.
Автоматическое реферирование

11.25 – 11.45. В.Ю. Сафрошкин, А.В. Иванов. Проблемы создания и функционирования тематического информационно-коммуникативного ресурса по геомагнетизму (20 мин. // Том 1, c. 59-61).

Аннотация. Рассмотрены проблемы создания тематического ресурса с информативно-коммуникационной направленностью - специфика целевого контингента; разработка и используемое программное обеспечение; выбор набора сервисов; активность пользователей; рейтинг и востребованность размещаемых материалов.

11.45 – 12.15. К.М. Фирсов, А.З. Фазлиев, С.М. Сакерин, Т.Б. Журавлева, Б.А. Фомин, В.И. Захаров. Информационно-вычислительная система "Атмосферная радиация". Современное состояние, перспективы развития. (30 мин. // Том 1, c. 62-66).

Аннотация. Представлено описание информационно-вычислительной системы "Атмосферная радиация". Доступ к данным и программам организован с помощью веб-интерфейса. Данная информационно-вычислительная система не только обеспечивает доступ к данным, но и позволяет проводить расчеты радиационных характеристик атмосферы Земли. Ближайшая перспектива - создание доступной по сети Интернет распределенной информационно-вычислительной системы по атмосферной радиации.

12.15 – 12.35. A. Osin, E. Trushkina, V. Kuznetsov. Virtual Archive as a prototype distributed data system for scientific knowledge base (20 мин. // Том 1, c. 67-71).

Abstract. This document outlines an attempt to develop guidelines for a low-barrier unified distributed data system (``Virtual Archive'') based on modern standards. A prototype data system uses approach close to IVOA [1] but aims at a more general application area. Existing trends and standards in building distributed data systems are briefly discussed and Virtual Archive approach to specific issues laid out.

11.25 – 11.55. Н.Н. Абрамова, В.Е. Абрамов. Автоматическое составление обзорных рефератов новостных сюжетов (30 мин. // Том 1, c. 131-141).

Аннотация. Работа посвящена одной из актуальных проблем автоматического реферирования - составлению обзорных рефератов по набору документов применительно к новостным сюжетам. За рубежом данному направлению исследований придается очень большое значение, однако в России не уделяется достаточного внимания программе исследований по данной тематике. Авторами предложен метод составления обзоров новостных сюжетов, на основе которого разработана система реферирования. Приводятся результаты работы системы, описаны эксперименты по оценке качества реферирования. Эксперименты показали, что в среднем (с покрытием 80% по всем трем коллекциям предоставленных для исследования документов) обзорные рефераты отражают содержание оригинальных текстов кластера.

11.55 – 12.25. П.И. Браславский, В. Густелев. Система автоматического реферирования новостных сообщений на основе машинного обучения (30 мин. // Том 1, c. 142-147).

Аннотация. В статье описана макетная система автоматического реферирования новостных сообщений на основе машинного обучения. В качестве основного набора данных использует корпус из 1183 документов новостного ресурса "Газета.Ру", в которых выделены информативные предложения. Для построения классификатора используется библиотека LibSVM - реализация метода опорных векторов. Классификация производится на основе набора легко вычислимых признаков. Дополнительно проведена оценка на небольшом корпусе статей из газеты "Коммерсант", которые были размечены вручную. Оценка метода дала удовлетворительные результаты.

12.35 (Зал А ) Научные электронные библиотеки.
Технологии социально-экономического мониторинга

12.35 (3-й этаж ) Информационный поиск.
Анализ документальных потоков

12.35 – 12.55. А.В. Богомолова, О.И. Карасев, Р. Сеннов, Т.Н. Юдина. Университетская информационная система РОССИЯ: ресурсы и сервисы для мониторинга, анализа и прогноза социально-экономического развития регионов и муниципальных образований. Приложения для задач образования и государственного управления (20 мин. // Том 1, c. 72-76).

Аннотация. Статья описывает разрабатываемый в составе Университетской информационной системы РОССИЯ (uisrussia.msu.ru) новый продукт -- реляционную базу, в которой интегрирована государственная социально-экономическая статистика и бюджетная статистика. База создается для системных исследований социальных процессов в регионах и учебных программ в университетах и вузах страны. Может использоваться для задач государственного управления.

12.55 – 13.15. М.С. Агеев, Б.В. Добров, А.В. Сидоров. Программные решения при разработке геоинформационной системы мониторинга сильно взаимосвязанных данных (20 мин. // Том 1, c. 77-83).

Аннотация. В статье описываются технологические решения, реализованные коллективом разработчиков программного обеспечения автоматизированной системы мониторинга реализации градостроительных планов. Система включает единое хранилище данных, систему расчета вычисляемых показателей, а также моделирование требований нормативно-правовых актов. Реализованная система допускает расширение для поддержки решения задач мониторинга в других предметных областях.

12.35 – 12.55. Д.В. Ландэ, А.Н. Григорьев, С.М. Брайчевский, А.Т. Дармохвал, А.А. Снарский. Объектная визуализация тематических информационных массивов (20 мин. // Том 1, c. 148-150).

Аннотация. Описан подход к визуализации тематических информационных массивов электронных публикаций. Предлагается использование так называемых Wordlet-диаграмм, которые формируются путем учета распределения объемов публикаций, соответствующих выбранным информационным объектам.

12.55 – 13.15. А.А. Снарский, Д.В. Ландэ, С.М. Брайчевский, А.Т. Дармохвал. Свойства распределения релевантности в документальных массивах (20 мин. // Том 1, c. 151-155).

Аннотация. Исследуются распределения двух видов меры релевантности документов в документальных потоках. Выявлены устойчивые корреляции в их взаимных зависимостях. Определен показатель Херста соответствующих рядов и показано, что они обладают фрактальной природой.

13.15 (Зал В ) ОБЕД

14.15 (Зал А ) Научные электронные библиотеки.
Исторические электронные библиотеки

14.15 (3-й этаж ) Информационный поиск.
Классификация и нечеткие дубликаты

14.15 – 14.45. В.Б. Барахнин, А.М. Федотов. Методологические подходы к построению информационно-справочных систем по истории науки (30 мин. // Том 1, c. 84-88).

Аннотация. В работе описана методика построения информационно-справочных систем по истории науки. Основные принципы построения таких систем состоят в следующем. Информация группируется вокруг персон, при этом подробно структурируются биографические данные в плане хронологии, географии и т.п. Библиографический список в описании персоны включает в себя, наряду с публикациями данного ученого, и публикации о нем самом. Четко отражена связь научной деятельности исследователя с формализованным описанием предметной области, в которой этот исследователь работал.

Приведенное описание включает в себя информационную модель справочника, особенности реализации подсистем создаваемой информационной системы, а также основные виды информационных запросов пользователя, необходимых для полноценной работы с системой.

14.45 – 15.15. А.Г. Марчук, П.А. Марчук. Платформа интеграции электронных архивов (30 мин. // Том 1, c. 89-94).

Аннотация. В статье рассмотрена задача интеграции информационных систем фактографической направленности. Интеграция рассматривается и как информационное объединение ресурсов и как переход отдельных информационных систем на унифицированное решение при сохранении функциональности и интерфейсов каждой в отдельности. Важным элементом предложенного подхода является ориентация на распределенную систему с сохранением контроля владельца информационного ресурса над "своими" данными.

Обсуждаемый подход реализован в системе "Электронный фотоархив СО РАН".

15.15 – 15.35. Ю.В. Леонова, А.М. Федотов. Информационная модель учета временного фактора в информационно-справочных системах (20 мин. // Том 1, c. 95-102).

Аннотация. Основным предметом рассмотрения данной статьи является информационная модель учета временного фактора в информационно-справочных системах (ИСС). ИСС должна обеспечивать выполнение запросов на какой-нибудь момент времени в прошлом, то есть создание среза истинности фактов на произвольную дату. Учет временного фактора предлагается реализовать на основе двух зависимостей:

версии документов, связанные с изменениями атрибутов документов на выбранных интервалах времени;
отношения родитель-потомок между новыми и старыми объектами.

14.15 – 14.45. А.В. Сычев, М. Баженов. О проблеме выбора зерновых ресурсов в задаче автоматического пополнения каталога веб-ресурсов на основе выявления компонент сильной связности с последующей контентной фильтрацией (30 мин. // Том 1, c. 156-165).

Аннотация. В статье представлены результаты исследования задачи автоматического пополнения каталога веб-ресурсов на основе нахождения компонент сильной связности в веб-графе, построенном исходя из зерновых ресурсов, взятых из уже существующих рубрик каталога.

Исследование основано на результатах экспериментов, проводившихся с веб-графами, реконструируемыми из реальной сети WWW. В качестве зерновых были использованы ресурсы из веб-каталога Яндекс.

14.45 – 15.15. Ю.Г. Зеленков, И.В. Сегалович. Сравнительный анализ методов определения нечетких дубликатов для Web-документов (30 мин. // Том 1, c. 166-174).

Аннотация. В работе дается сравнительное экспериментальное исследование наиболее популярных современных методов обнаружения нечетких дубликатов для текстовых документов. Приводится количественная оценка показателей полноты, точности и F-меры. Тестовый набор, использованный в экспериментах, представляет собой веб-коллекцию РОМИП. Предложены два новых алгоритма, имеющих высокие показатели качества.

15.15 – 15.35. Н.В. Виноградова, О.А. Митрофанова, П.В. Паничева. Автоматическая классификация терминов в русскоязычном корпусе текстов по корпусной лингвистике (20 мин. // Том 2, c. 23-28).

Аннотация. В статье рассматриваются результаты компьютерной обработки неразмеченных русскоязычных научных текстов. Основное содержание эксперимента - автоматическая классификация терминов-дескрипторов в текстах из корпуса по корпусной лингвистике, осуществляемая с помощью специализированного инструмента АКЛ.

15.35 (Зал С ) Стендовые доклады c кофе

Н.В. Лунева. Многоязычная лингвистическая база знаний: архитектура и метаданные (постер // Том 2, c. 67-70).

Аннотация. Данная работа содержит описание основных архитектурных решений и типов метаданных в многоязычной лингвистической базе знаний, создаваемой для построения и отладки синтактико-семантических моделей в лингвистических процессорах систем обработки текстовых знаний и машинного перевода. Новая база знаний предназначена для широкого круга специалистов в области компьютерной лингвистики и информационных технологий. В рамках комплекса предусмотрено создание рабочего места переводчика и компоненты "переводческой памяти".

С.Св. Волков. От электронной библиотеки к информационной системе "Весь Ломоносов" (постер // Том 2, c. 18-19).

Аннотация. Доклад посвящен созданию электронной научной библиотеки "М.В. Ломоносов", обосновывается актуальность ее создания, описываются принципы формирования, требования к подготовке текстового материала и система его организации. Предлагается краткое описание модели информационной системы "М.В. Ломоносов".

Т.В. Качаева, В.С. Южиков. Автоматизированная система распознавания и классификации резюме (постер // Том 2, c. 33-36).

Аннотация. В статье описывается система для автоматического анализа, классификации и ранжирования резюме кандидатов. Рассмотрены методы и алгоритмы формирования базы кандидатов на основе автоматического анализа поступающих резюме.

Н.А. Маркова, О.Л. Обухова, И.В. Соловьев, А.П. Чочиа. Web технология динамической классификации квази-однородной электронной коллекции (постер // Том 2, c. 29-32).

Аннотация. В докладе рассматриваются виртуальные коллекции, состоящие из независимых объектов, определяемых своими атрибутами. Предлагается формальная модель, определяющая динамическую классификацию объектов и задаваемый ею процесс навигации в коллекции как интерактивную последовательность шагов, уточняющих запрос в терминах атрибутного поиска. Наглядное визуальное представление содержимого коллекции, отвечающего текущему шагу, а также ряд специальных решений позволяет существенно повысить эффективность нахождения элементов коллекции.

16.00 (Зал А ) Научные электронные библиотеки.
Виртуальные обсерватории

16.00 (3-й этаж ) Информационный поиск.
Словари и тезаурусы в электронных библиотеках

16.00 – 16.30. А.Е. Авраменко. К согласованному виртуальному и реальному времени в коллекции астрометрических пульсарных данных (30 мин. // Том 1, c. 103-111).

Аннотация. Рассматривается задача согласования отношений наблюдаемых величин и их параметрических отображений в коллекции астрометрических пульсарных данных. Определены структура и компоненты коллекции, удовлетворяющие условиям согласования. На основе интеграции наблюдательных данных и их численных моделей долговременные ряды хронометрирования приводятся к формализованному виду, определяемому наблюдательными параметрами вращения пульсара. Установлены инвариантные отношения численной модели и наблюдательных признаков рядов хронометрирования в пределах многолетней протяженности наблюдений. Определены методы сопоставления виртуальных и реальных характеристик рядов во временной области переменных. Приведены примеры приложений коллекции.

16.30 – 17.00. Н.А. Мамардашвили, А.Е. Вовченко, Л.А. Калиниченко, О.Ю. Малков, М.Е. Патракова. Встраивание средств Data Mining в инфраструктуру виртуальной обсерватории (30 мин. // Том 1, c. 112-122).

Аннотация. Методы извлечения знаний из данных (Data Mining) применяются в различных областях науки, в том числе в астрономии, как средства, помогающие получать новые знания, делать научные открытия. В данной работе обсуждается важность встраивания в состав виртуальных обсерваторий средств для решения астрономических задач методами Data Mining, рассматриваются существующие подходы, отдается предпочтение использованию ансамблей алгоритмов и предлагается соответствующая архитектура (Ensembled Weka) встраивания системы Weka в инфраструктуру виртуальной обсерватории.

17.00 – 17.30. О.П. Желенкова, А.И. Копылов, В.Н. Черненков. Применение программных средств IVOA для исследования радиоисточников (30 мин. // Том 1, c. 123-130).

Аннотация. Установление соответствия между объектами астрономических каталогов в разных диапазонах электромагнитного спектра и объединения их в реальный астрофизический источник имеет очевидный научный интерес. Сбор информации даже об одном небесном объекте, несмотря на возможности, предоставляемые Интернетом, является трудоемкой работой из-за большого количества ресурсов, способов доступа к данным, форматов получаемых результатов, а также входных форматов программных приложений, используемых для дальнейшего анализа. Разработки астрономического сообщества по созданию на основе существующих WWW стандартов спецификаций, форматов и сервисов, повышающих эффективность работы с данными, координируются Международным альянсом "Виртуальная Обсерватория" (International Virtual Observatory Alliance). В рамках этой деятельности созданы системы, позволяющие реализовывать распределенные вычисления и доступ к данным. Анализируется применимость имеющихся программных средств IVOA для исследования списка радиоисточников.

16.00 – 16.30. А. Васильев, Д. Козлов, С. Самусев, О. Шамина. Извлечение метаинформации и библиографических ссылок из текстов русскоязычных научных статей (30 мин. // Том 1, c. 175-184).

Аннотация. В данной работе рассмотрены существующие методы автоматического извлечения метаданных и библиографических ссылок из текстов научных статей, описаны адаптация методов для работы с русскоязычными научными статьями и сравнение эффективности работы этих методов на русскоязычных и англоязычных научных статьях.

16.30 – 16.50. Н. Бузикашвили. ``Искалка'' Д. В. Самойлова (20 мин. // Том 2, c. 41-48).

Аннотация. Статья посвящена Искалке - двухкомпонентной системе поддержки перевода научной литературы, Одна компонента Искалки предназначена для автоматической и полуавтоматической синхронизации параллельных текстов, а вторая обеспечивает синхронизованный многоязыковой поиск в корпусе параллельных текстов, подготовленном с помощью первой. Поисковая компонента Искалки является основным элементом рабочего места редактора переводной научной литературы и обеспечивает терминологическое единство переводов. Построенная от начала и до конца Д.В. Самойловым, Искалка представляет собой редкий и яркий пример того, как изящная и адекватная формулировка задачи позволяет простыми средствами достичь наивысшей эффективности работы.

16.50 – 17.10. А.М. Андреев, Д.В. Березкин, А.С. Нечкин, К.В. Симаков, Ю.Л. Шаров. Автоматизация обнаружения и исправления опечаток в названиях географических объектов для системы семантического контроля документов электронной библиотеки (20 мин. // Том 2, c. 49-56).

Аннотация. В статье изложен метод обнаружения и исправления опечаток в названиях географических объектов. Приведена классификация орфографических ошибок, подробно описан метод проверки и алгоритм, реализующий его. Выполнена экспериментальная оценка и даны направления по дальнейшему усовершенствованию предложенного подхода.

17.10 – 17.30. О.А. Лаврёнова. Многоязычный доступ к данным на основе тезауруса географических названий (20 мин. // Том 2, c. 57-62).

Аннотация. Доклад представляет собой описание проекта тезауруса географических названий, формируемого в виде национального нормативного файла как формы представления данных, принятой в автоматизированных библиотечных системах.

19.00 (Кафе "Навигатор" ) Банкет

17 октября

9.30 (Зал А ) Онтологии, представление данных.
Организация доступа к электронным коллекциям

9.30 – 10.00. Е.В. Мясников. Разработка метода навигации по коллекциям цифровых изображений (30 мин. // Том 1, c. 185-194).

Аннотация. Центральным вопросом при построении систем навигации является способ отображения коллекции в двумерное навигационное пространство. Суть предлагаемого в работе метода состоит в реализации отображения в два этапа. На первом этапе по коллекции изображений строится система иерархически вложенных кластеров. На втором этапе производится отображение исходного пространства описания изображений в пространство навигации.

В работе дан обзор методов, используемых при построении систем навигации, приведены результаты исследований предложенного метода и сравнения его с известными методами. Полученные результаты позволяют сделать вывод о возможности успешного применения разработанного метода.

10.00 – 10.20. М.Е. Прохоров, О.С. Бартунов. Средства навигации в полнотекстовых базах данных и порталах (20 мин. // Том 2, c. 71-80).

Аннотация. Объемы информации в современных информационных порталах и родственных им системах становятся все больше и для успешной работы с ними необходимы эффективные средства навигации. Даже в таких "классических" источниках информации, как книги и газеты эти средства присутствуют (тоже в самой "классической" форме): оглавления, различные индексы, нумерация страниц. Однако, средства навигации в электронных системах информации гораздо более разнообразны.

10.20 – 10.50. И. Марков, Н. Васильева, А. Яремчук. Поиск изображений. Выбор оптимальных весов для слияния метрик по цвету и текстуре в зависимости от запроса-образца (30 мин. // Том 1, c. 195-200).

Аннотация. В информационном поиске изображений по содержанию с использованием низкоуровневых характеристик общепринятой практикой является независимая оценка изображений по цвету и текстуре с дальнейшим смешиванием этих оценок без учета особенностей изображения-запроса. В данной работе выдвигается и проверяется гипотеза о том, что можно определить оптимальные коэффициенты для смешивания оценок по цвету и текстуре в зависимости от характеристик запроса, использование которых улучшит качество поиска.

10.50 (Зал С ) Кофейный перерыв

11.05 (Зал А ) Онтологии, представление данных.
Использование онтологий в ЭБ

11.05 (3-й этаж ) Российский семинар
"Интернет-математика 2007".

11.05 – 11.35. А.И. Привезенцев, А.З. Фазлиев. Прикладная онтология задач для систематизации информационных ресурсов молекулярной спектроскопии (30 мин. // Том 1, c. 201-210).

Аннотация. В работе описана прикладная онтология задач, используемая для систематизации информационных ресурсов по молекулярной спектроскопии. Описаны некоторые возможности формирования фактов об уровнях энергии молекулы воды, их машинное отнесения к классам и задача поиска источников данных в рамках концептов, на основе созданной прикладной онтологии.

11.35 – 12.05. Е.В. Биряльцев, А.М. Гусенков, А.М. Елизаров. О доступе к электронным коллекциям в виде реляционных баз данных на основе онтологий (30 мин. // Том 1, c. 211-216).

Аннотация. Работа посвящена применению онтологических описаний разных уровней - логической модели предметной области, модели представления данных и лексико-семантического тезауруса - для обеспечения доступа к электронным коллекциям в виде реляционных баз данных. Предлагаемые подходы апробированы на информационных ресурсах нефтегазовой индустрии.

12.05 – 12.35. Ю.А. Загорулько, О.И. Боровикова, Г.Б. Загорулько. Организация содержательного доступа к гуманитарным информационным ресурсам на основе онтологий (30 мин. // Том 1, c. 217-224).

Аннотация. В докладе представлен подход к организации содержательного доступа к гуманитарным информационным ресурсам на основе онтологий. Онтология составляет информационную основу Интернет-портала знаний, который должен обеспечить интеграцию и систематизацию научных знаний и информационных ресурсов определенной тематики, а также содержательный доступ к ним из любой "точки" Интернет-пространства. По онтологии автоматически строятся схема внутренней базы данных портала и формы для ее заполнения, организуется навигация по информационному пространству портала и обеспечивается формулирование поисковых запросов в терминах предметной области портала знаний. Разделение онтологии портала на предметно-независимые и предметные онтологии делает портал настраиваемым практически на любую область научных знаний.

12.35 (Зал В ) ОБЕД

13.35 (Зал А ) Онтологии, представление данных.
Описания и уточнения понятий в онтологиях

13.35 (3-й этаж ) Российский семинар
"Интернет-математика 2007".

13.35 – 14.05. Н.А. Скворцов. Применение уточнения понятий в решении задач манипулирования онтологиями (30 мин. // Том 1, c. 225-229).

Аннотация. Эта статья продолжает ряд в исследовании, посвящённом применению отношения уточнения спецификаций типов к неоднородным онтологическим описаниям предметных областей. Рассматриваются наиболее типичные задачи манипулирования онтологическими спецификациями, в частности, проверка внутренней непротиворечивости онтологического определения, обработка запросов к онтологиям, обмен сообщениями в терминах онтологии, контекстуализация и персонализация информации, отображение и интеграция онтологических контекстов, развитие онтологий, разработка концептуальных моделей на основе онтологий. Цель статьи -- показать возможность применения отношения уточнения в решении конкретных задач, возникающих при работе с онтологическими спецификациями.

14.05 – 14.25. Н.В. Лукашевич. Описание понятий-ролей в лингвистических и онтологических ресурсах (20 мин. // Том 2, c. 81-89).

Аннотация. В статье рассматриваются онтологические характеристики таких понятий как понятия-роли, показывается их отличие от понятий-типов. Мы покажем, что различие между онтологическими характеристиками понятий-типов и понятий-ролей обязательно нужно учитывать при разработке онтологических и лингвистических ресурсов для автоматической обработки текстов, если предполагается использовать логический вывод по иерархическим отношениям. На примере описаний Тезауруса русского языка РуТез рассматриваются способы описания понятий-ролей в лингвистических онтологиях.

14.25 (Зал А ) Онтологии, представление данных.
Электронные библиотеки рукописей

14.25 (3-й этаж ) Российский семинар
"Интернет-математика 2007".

14.25 – 14.55. А.Г. Варфоломеев, И.В. Кравцов, В.О. Филатов. SVG-визуализация в цифровых библиотеках рукописных документов (30 мин. // Том 1, c. 230-235).

Аннотация. Данная статья посвящена применению формата векторной графики SVG в качестве технологической основы для визуализации информации в цифровых библиотеках рукописных исторических документов. Основное внимание уделено четырем вариантам использования SVG: для связи XML-разметки текстов с изображением исходных документов, для определения шрифтов, адекватных оригиналу, для визуализации аналитических запросов к коллекции документов, и для создания визуальных инструментов исследования текстов.

Рассмотренный подход используется авторами на практике в разработке информационной системы "Источник", предназначенной для организации работы сетевых сообществ исследователей текстовых исторических источников.

14.55 – 15.15. В.С. Южиков. Сегментация изображений страниц древних рукописей (20 мин. // Том 1, c. 236-240).

Аннотация. В статье описывается алгоритм для сегментации изображения страницы с текстом. Задача сегментации состоит в соотнесении каждого элемента страницы к одному из двух классов - текст или рисунок. Работа алгоритма начинается с разбиения всего изображения на небольшие области. Для классификации каждой области используются следующие критерии:

Доля черных пикселей во всей области.
Величина разброса толщины отдельных элементов области.
Наличие чередующихся строк и междустрочий.

15.15 (Зал С ) Кофейный перерыв

15.30 (Зал А ) Онтологии, представление данных.
Инструментарий для ЭБ

15.30 (3-й этаж ) Российский семинар
"Интернет-математика 2007".

15.30 – 16.00. К.А. Кудим, Г.Ю. Проскудина, В.А. Резниченко. Сравнение систем электронных библиотек EPrints 3.0 и DSpace 1.4.1 (30 мин. // Том 1, c. 241-252).

Аннотация. Рассматриваются основные возможности и особенности DSpace и EPrints как наиболее популярных свободно распространяемых систем построения электронных библиотек. Описан опыт построения многоязычных электронных библиотек на их основе. Приводится сравнительный анализ систем DSpace 1.4.1 и EPrints 3.1. Особое внимание уделено проблемам локализации, совместимости внешних форматов и удобству использования данных систем.

16.00 – 16.20. О.С. Бартунов, Ф.Г. Сигаев. Специализированные типы данных для цифровых библиотек (20 мин. // Том 2, c. 90-96).

Аннотация. При построении сложных информационных систем зачастую приходится решать разнообразные технологические задачи, связанные с хранением, доступом и поиском информации. Учитывая современные требования к производительности, надежности и шкалированию таких систем, такие задачи требуют использования достаточно сложных алгоритмов и специализированных структур данных. В статье рассматривается необходимость расширяемости базы данных и описываются несколько типов данных, разработанные авторами для свободно-распространяемой базы данных PostgreSQL, облегчающие работу со множествами, иерархическими данными, слабоструктурированными данными и полнотекстовым поиском.

16.20 – 16.40. C. Becker, S. Strodl, R. Neumayer, A. Rauber, E. Nicchiarelli, M. Kaiser. Long-Term Preservation of Electronic Theses and Dissertations: A Case Study in Preservation (20 мин. // Том 2, c. 97-103).

Abstract. An increasing number of institutions throughout the world face legal obligations to collect and preserve digital objects over years. A range of tools exist today to support the variety of preservation strategies such as migration or emulation. Yet, different preservation requirements across institutions and settings make the decision on which solution to implement very difficult. The Austrian National Library will have to preserve electronic theses and dissertations provided in PDF. It is thus investigating potential preservation solutions. The preservation planning approach taken in the PLANETS project is used to evaluate various alternatives with respect to specific requirements. It provides an approach to make informed and accountable decisions on which solution to implement in order to preserve digital objects for a given purpose. We analyse the performance of various preservation strategies with respect to the specified requirements for the preservation of master's theses and dissertations and present the results.

16.40 – 17.00. М.Ю. Богатырев, В.Е. Латов, И.А. Столбовская. Применение концептуальных графов в системах поддержки электронных библиотек (20 мин. // Том 2, c. 104-110).

Аннотация. Работа содержит некоторые результаты исследований возможностей применения семантических моделей текста в виде концептуальных графов в качестве объектов хранения электронных библиотек. Рассматриваются постановки и решения задач кластеризации концептуальных графов.

17.00 (Зал С ) Экскурсия по городу

17.00 (Зал В ) Заседание РК

18 октября

9.30 (Зал А ) Проблемы интеграции.
Технологии интеграции информационных ресурсов

9.30 (3-й этаж ) Российский семинар
по оценке методов информационного поиска.

9.30 – 10.00. D. Briukhov, Л.А. Калиниченко, D. Martynov. Source Registration and Query Rewriting Applying LAV/GLAV Techniques in a Typed Subject Mediator (30 мин. // Том 1, c. 253-262).

Abstract. New methods and tools for application development in collaborative scientific enterprises (like Virtual Observatories (VO)) over multiple distributed sources of data and programs are required. In this paper we focus on results of research and experimental work oriented on problem-driven subject mediation emphasizing aspects of LAV/GLAV information sources integration in the mediator. The approach considered has the following distinguishing features: typed, object canonical model is used instead of usually applied relational one; a technique of refining mapping of source information models into extensible canonical one is provided; registration in a mediator of a relevant source is done so that a mediator type should be provably refined by a relevant source type or by a composition of such types (the conflict resolving functions are to be specified, if required); rewriting of non-recursive logical programs containing strongly typed rules is applied. These features provide methodological context for the current paper that is focused on description of the role the LAV/GLAV approach plays in the mediator. Using astronomical example taken from the Russian VO context, we show the technique of information source registration at the mediator and query rewriting technique in a typed specification environment applying LAV/GLAV approach.

10.00 – 10.30. А.В. Жучков, А.В. Кравченко, Н.В. Твердохлебов. Сервис-ориентированный Грид-подход к информационным задачам в пространствах данных виртуальных организаций (30 мин. // Том 1, c. 263-272).

Аннотация. В статье рассматриваются возможности применения Грид-технологии для построения платформы поддержки пространств данных. Приводится пример построения высокоуровневого сервиса, работающего на пространстве данных медицинской виртуальной организации.

10.30 – 11.00. Е.Б. Кудашев, А.Н. Филонов. Технологии и стандарты интеграции сервисов, каталогов и баз данных дистанционного исследования Земли из космоса (30 мин. // Том 1, c. 273-279).

Аннотация. Статья посвящена вопросам интеграции в мировые системы спутниковых исследований Земли и, в первую очередь, интеграции информационных ресурсов ДЗЗ в систему EoPortal Европейского космического агентства (ESA) на основе современных стандартов OpenGIS и международных технологий обмена метаданными глобальных поисковых систем. Исследуются технологии интеграции, обеспечивающие возможность объединения информационных ресурсов космического экологического мониторинга в единую информационную среду.

11.00 (Зал С ) Кофейный перерыв

11.15 (Зал А ) Проблемы интеграции.
Интеграция разнородных коллекций

11.15 (3-й этаж ) Российский семинар
по оценке методов информационного поиска.

11.15 – 11.35. А.М. Федотов, В.Б. Барахнин, А.Е. Гуськов, Ю.В. Леонова. Построение информационной системы научного сообщества на основе интеграции разнородных коллекций ресурсов (20 мин. // Том 2, c. 111-117).

Аннотация. В работе описана технология создания информационной системы "База данных организаций и сотрудников СО РАН". В основе представленной технологии лежит принцип децентрализованного хранения информации при наличии единого каталога ресурсов. Такой подход обеспечивает интероперабельность, т.е. возможность интеграции разнородных ресурсов как внутри системы, так и с внешними системами, а также позволяет оперативно, с использованием средств автоматизации, осуществлять актуализацию информации.

11.35 – 11.55. О.А. Клименко, В.Э. Филиппов, М.Я. Филиппова. Электронная библиотека математических ресурсов MathTree (20 мин. // Том 2, c. 118-121).

Аннотация. Библиотека MathTree представляет собой систематизированную коллекцию ссылок на Интернет-ресурсы. Ссылки вместе с некоторым набором метаданных содержатся в древовидном каталоге, ветви которого соответствуют различным разделам математики. Двигаясь по ветвям, можно получать информацию, связанную с конкретным математическим направлением: лаборатории, кафедры, научные школы и специалисты, занимающиеся данной проблематикой, диссертации и другие электронные ресурсы, ссылки на журналы, в которых публикуются статьи по этому направлению, и конференции с близкой тематикой.

11.55 – 12.15. И.С. Смирнов, О.Н. Пугачев, А.Л. Лобанов, А.Ф. Алимов, Е.П. Воронина. Электронные коллекции Зоологического института по морским животным и метаданные (20 мин. // Том 2, c. 122-127).

Аннотация. Одной из важных проблем, стоящих перед современным обществом является сохранение биологического разнообразия. ИПС способствуют решению фундаментальных проблем зоологии.

Зоологический институт РАН разрабатывает различные проекты по биологическому разнообразию России, сопредельных территорий и полярных регионов.

Одним из условий создания современных информационно-поисковых систем, упрощения и ускорения поиска необходимой информации по биоразнообразию в Интернете является интеграция и стандартизация баз данных и метаданных. В настоящее время в зоологических ИПС используются следующие стандарты для ввода, описания и представления данных: Darwin Core, RDF, Dublin Core Metadata Elements и др.

12.15 – 12.35. S. Chernov, E. Minack, P. Serdyukov. Converting Desktop into a Personal Activity Dataset (20 мин. // Том 1, c. 280-283).

Abstract. The current experiments on personalization in information retrieval are limited to the available collections of the real world data. While a number of publications exploited user interaction with Desktop, often these experiments are neither repeatable nor comparable. In this paper we elaborate on the need for logging the Desktop activity data and creating a common collection for Desktop search evaluation. We describe the design of such a dataset and necessary logging tools. We also outline the current state of our Personal Activity Track initiative towards creation of the Desktop search dataset. While this effort is currently targeting English-speaking users, it is also applicable to Russian and other languages.

12.35 (Зал В ) ОБЕД

13.35 (Зал А ) Проблемы интеграции.
Управление доступом и исключительные ситуации

13.35 (3-й этаж ) Российский семинар
по оценке методов информационного поиска.

13.35 – 14.05. A. Berztiss, B. Thalheim. Exceptions in Information Systems (30 мин. // Том 1, c. 284-295).

Abstract. The concept of exception has been defined in diverse ways. We relate exceptions to computational transactions and to control constructs. Our view of a transaction is very broad, and we consider transactional exceptions to be instances of undefined function values. By giving different interpretations to ``undefined'' we arrive at a classification of transactional exceptions. Our primary interest is in information systems, i.e., in database transactions, and in processes that consist of such transactions. In the database context we show that liberal treatment of exceptions is simpler than total quality management for consistency based on a set of constraints. We refer to control operations that link transactions into processes as actions. Actions tend to be time-related, and time Petri nets provide actions with semantics. The time Petri net representation indicates where exceptions can arise. We also consider high-level monitors for the detection of exceptions. Although our emphasis is on detection of exceptions, their handling is also discussed.

14.05 – 14.35. О.Л. Жижимов, А.М. Федотов. Модели управления доступом к распределенным информационным ресурсам (30 мин. // Том 1, c. 296-299).

Аннотация. На основе анализа типовых сценариев работы информационных серверов (WWW, FTP, Z39.50 и т.п.) сформулированы задачи, которые должны решаться при организации системы контроля доступа к распределенным информационным ресурсам. Рассмотрены возможности технологии LDAP как наиболее подходящей для построения подобной системы. В рамках этой технологии обсуждаются три модели управления доступом, отличающиеся степенью интеграции функций информационных серверов с технологией LDAP.

Создание и поддержка распределенных информационных систем и электронных библиотек, интегрирующих разнородные информационные ресурсы и функционирующих в различных программно-аппаратных средах, требует специальных подходов к управлению этими системами [1-2]. Если управление собственно самими ресурсами или данными может осуществляться в локальном режиме даже для распределенных информационных систем [2], то задача управления доступом к распределенным ресурсам не может быть решена в рамках локального администрирования. Обоснование последнего тезиса можно увидеть при рассмотрении типичных сценариев работы информационного сервера.

14.35 – 14.55. Е.Е. Ивашко. Построение системы защиты электронных библиотек от несанкционированного копирования документов (20 мин. // Том 1, c. 300-306).

Аннотация. В работе рассматриваются вопросы применения аномального (статистического) подхода к обнаружению вторжений для построения системы защиты электронных библиотек от несанкционированного копирования документов. Предлагается метод создания классификаторов поведения и формирования шаблонов "нормального" поведения пользователя, основанный на построении Марковской цепи.

14.55 (Зал С ) Закрытие конференции RCDL2007

15.10 (Гостиница "Переславль" ) Вывоз участников в Москву

Обзор Программа RCDL 2007 Детали

Обзор Программа RCDL 2007 Детали

15 октября

9.00 (Зал С ) Выезд из Москвы и регистрация в гостинице

14.00 (Зал А ) Открытие конференции

15.00 (Зал С ) Кофейный перерыв

15.15 (Зал А ) Тьюториалы RCDL.

17.15 (Зал С ) Кофейный перерыв

17.30 (Зал А ) Тьюториалы RCDL.

16 октября

9.30 (Зал А ) Научные электронные библиотеки.Наукометрия и оценка инновационного потенциала

11.00 (Зал С ) Стендовые доклады c кофе

11.25 (Зал А ) Научные электронные библиотеки.Электронные библиотеки в науках о Земле

11.25 (3-й этаж ) Информационный поиск.Автоматическое реферирование

12.35 (Зал А ) Научные электронные библиотеки.Технологии социально-экономического мониторинга

12.35 (3-й этаж ) Информационный поиск.Анализ документальных потоков

13.15 (Зал В ) ОБЕД

14.15 (Зал А ) Научные электронные библиотеки.Исторические электронные библиотеки

14.15 (3-й этаж ) Информационный поиск.Классификация и нечеткие дубликаты

15.35 (Зал С ) Стендовые доклады c кофе

16.00 (Зал А ) Научные электронные библиотеки.Виртуальные обсерватории

16.00 (3-й этаж ) Информационный поиск.Словари и тезаурусы в электронных библиотеках

19.00 (Кафе "Навигатор" ) Банкет

17 октября

9.30 (Зал А ) Онтологии, представление данных.Организация доступа к электронным коллекциям

10.50 (Зал С ) Кофейный перерыв

11.05 (Зал А ) Онтологии, представление данных.Использование онтологий в ЭБ

11.05 (3-й этаж ) Российский семинар"Интернет-математика 2007".

12.35 (Зал В ) ОБЕД

13.35 (Зал А ) Онтологии, представление данных.Описания и уточнения понятий в онтологиях

13.35 (3-й этаж ) Российский семинар"Интернет-математика 2007".

14.25 (Зал А ) Онтологии, представление данных.Электронные библиотеки рукописей

14.25 (3-й этаж ) Российский семинар"Интернет-математика 2007".

15.15 (Зал С ) Кофейный перерыв

15.30 (Зал А ) Онтологии, представление данных.Инструментарий для ЭБ

15.30 (3-й этаж ) Российский семинар"Интернет-математика 2007".

17.00 (Зал С ) Экскурсия по городу

17.00 (Зал В ) Заседание РК

18 октября

9.30 (Зал А ) Проблемы интеграции.Технологии интеграции информационных ресурсов

9.30 (3-й этаж ) Российский семинарпо оценке методов информационного поиска.

11.00 (Зал С ) Кофейный перерыв

11.15 (Зал А ) Проблемы интеграции.Интеграция разнородных коллекций

11.15 (3-й этаж ) Российский семинарпо оценке методов информационного поиска.

12.35 (Зал В ) ОБЕД

13.35 (Зал А ) Проблемы интеграции.Управление доступом и исключительные ситуации

13.35 (3-й этаж ) Российский семинарпо оценке методов информационного поиска.

14.55 (Зал С ) Закрытие конференции RCDL2007

15.10 (Гостиница "Переславль" ) Вывоз участников в Москву

Обзор Программа RCDL 2007 Детали

9.30 (Зал А ) Научные электронные библиотеки.
Наукометрия и оценка инновационного потенциала

11.25 (Зал А ) Научные электронные библиотеки.
Электронные библиотеки в науках о Земле

11.25 (3-й этаж ) Информационный поиск.
Автоматическое реферирование

12.35 (Зал А ) Научные электронные библиотеки.
Технологии социально-экономического мониторинга

12.35 (3-й этаж ) Информационный поиск.
Анализ документальных потоков

14.15 (Зал А ) Научные электронные библиотеки.
Исторические электронные библиотеки

14.15 (3-й этаж ) Информационный поиск.
Классификация и нечеткие дубликаты

16.00 (Зал А ) Научные электронные библиотеки.
Виртуальные обсерватории

16.00 (3-й этаж ) Информационный поиск.
Словари и тезаурусы в электронных библиотеках

9.30 (Зал А ) Онтологии, представление данных.
Организация доступа к электронным коллекциям

11.05 (Зал А ) Онтологии, представление данных.
Использование онтологий в ЭБ

11.05 (3-й этаж ) Российский семинар
"Интернет-математика 2007".

13.35 (Зал А ) Онтологии, представление данных.
Описания и уточнения понятий в онтологиях

13.35 (3-й этаж ) Российский семинар
"Интернет-математика 2007".

14.25 (Зал А ) Онтологии, представление данных.
Электронные библиотеки рукописей

14.25 (3-й этаж ) Российский семинар
"Интернет-математика 2007".

15.30 (Зал А ) Онтологии, представление данных.
Инструментарий для ЭБ

15.30 (3-й этаж ) Российский семинар
"Интернет-математика 2007".

9.30 (Зал А ) Проблемы интеграции.
Технологии интеграции информационных ресурсов

9.30 (3-й этаж ) Российский семинар
по оценке методов информационного поиска.

11.15 (Зал А ) Проблемы интеграции.
Интеграция разнородных коллекций

11.15 (3-й этаж ) Российский семинар
по оценке методов информационного поиска.

13.35 (Зал А ) Проблемы интеграции.
Управление доступом и исключительные ситуации

13.35 (3-й этаж ) Российский семинар
по оценке методов информационного поиска.