Sei sulla pagina 1di 202
1 - 6 июня 2013
1 - 6 июня 2013
1 - 6 июня 2013
1 - 6 июня 2013
ОРГАНИЗАТОРЫ КОНФЕРЕНЦИИ Региональный Сетевой Информационный

ОРГАНИЗАТОРЫ КОНФЕРЕНЦИИ

Региональный Сетевой Информационный Центр(RU-CENTER) Ассоциация научных и учебных организаций - пользователей сетей передач данных «РЕЛАРН» Российский научно-исследовательский институт развития общественных сетей (РосНИИРОС)

ПРОГРАММНЫЙ КОМИТЕТ

Платонов А.П. Панов А.В. Плуготаренко С.А. Шарова А.Л. Ястребцева Е.Н. Витковский В.В. Воробьев А.А.

АНО «РосНИИРОС» Группа компаний Hosting Community Российская Ассоциация электронных коммуникаций Институт прикладной физики РАН ООО «КМ-Образование», Школьный сектор Ассоциации «РЕЛАРН» Специальная астрофизическая обсерватория РАН RU-CENTER

ОРГАНИЗАЦИОННЫЙ КОМИТЕТ

Платонов А.П.

Директор АНО «РосНИИРОС»

Шарова А.Л.

Заведующая сектором информационных технологий Института прикладной

Самойлова О.Ю. Ястребцева Е.Н.

физики РАН Директор Ассоциации «РЕЛАРН» Генеральный директор ООО «КМ-Образование», Школьный сектор

Мордовина А.А. Новикова Т.И.

Ассоциации «РЕЛАРН» Ответственный секретарь Ассоциации «РЕЛАРН» Заместитель директора по связям с общественностью и взаимодействию с

Борисова А.И.

органами государственной власти RU-CENTER Руководитель специальных проектов RU-CENTER

Воробьёва Е.Н.

Руководитель пресс-службы РАЭК

Тел.: +7 (495)737-9296 Факс: +7 (495)737-0684 E-mail: relarn@relarn.ru

Доклады, вошедшие в сборник, получены по электронной почте и публикуются в виде, предоставленном авторами.

Ассоциация РЕЛАРН благодарит всех спонсоров, при поддержке которых проведение конференции стало возможным.

при поддержке которых проведение конференции стало возможным.

Relarn 2013

Содержание

Секция 1. Интернет в науке и высшей школе

Статистика скачиваний русской и английской версий научных статей и корреляции с их цитируемостью в мировых базах данных, используемых для оценки научной деятельности отдельных ученых и научных коллективов

М.С. Аксентьева, Е.В. Захарова

12

Особенности представления российских публикаций в международных базах данных, используемых для оценки эффективности научной деятельности

М.С. Аксентьева, Е.В. Захарова

18

GlusterFS как основа архива научных данных

М.Н. Боярский, Р.Р. Назиров, М.И. Шевченко

24

Открытая виртуальная среда дополнительного высшего образования

Витковский В.В., Шхагошева З.У.

28

Развитие когнитивных технологий анализа многомерных данных распределённых информационных систем ундаментальной науки

Витковский В.В., Горохов В.Л., Желенкова О.П. Величко А.М., Комаринский С.Л.

30

Информационные системы подготовки и издания электронных научных

журналовЕ.Н. Бабин, А.М. Елизаров, Р.У. Елизарова, Е.К. Липачев

39

Сетевая инфраструктура и технологии Тольяттинского государственного университета для образования и науки

В.В. Ефросинин, А.Л. Лопырина

43

Об опыте создания системы доступа к ресурсам интернет с фильтрацией контента

Жданович П.Б., Жданович С.Ф.

45

Защита персональной образовательной мобильной среды

Зуев Владимир Иванович

51

Relarn 2013

Триадная сущность, определяющая создание электронного образовательного контента вуза на основе электронных информотек

В.И. Котиков, М.В. Котикова

53

Методология построения территориальной киберинфраструктуры

А.Г. Масич, Г.Ф. Масич

58

Удостоверяющие федерации научно-образовательных сетей

Овсянников Алексей Павлович, Овчаренко Сергей Александрович, Овсянникова Татьяна Владимировна, Биктимиров Марат Рамилевич

68

Построение высокопроизводительных беспроводных сетей с использованием двухкоординатных мотоподвесов.

И.И. Карташев, А.П. Петров

71

Электронное научное издание:

нормативная база и организационные регламенты

Т.А. Полилова, А.В. Ермаков

73

Направления сотрудничества компании D-Link с высшими учебными заведениями

Ромасевич П.В., Смирнова Е.В.

78

Современные технологии построения цифрового дома с использованием облачного сервиса MyDlink

Ромасевич П.В., Гиль А.

84

Комплексные решения D-Link по организации безопасных корпоративных сетей

Ромасевич П.В.

86

Коммутационные платформы D-Link для построения современных мультисервисных сетей науки и образования

Ромасевич П.В.

90

Электронный университет ОмГТУ

М.С. Князева, С.П. Шамец

95

Relarn 2013

Секция 2. Особенности теории и практики неформального дистанционного обучения

Использование дистанционных технологий в подготовке специалистов (преподавателей физики) в условиях второго высшего образования

Африна Е.И.

102

Опыт разработки учебных материалов для дистанционной поддержки естественнонаучного образования в начальной школе

Африна Е.И., Крылов А.И.

103

«Доступ к цифровому гражданству»: Неформальное образование:

Профессиональная подготовка на рабочем месте

Е.А.Белан

106

Использование возможностей «е-КМ-Школы» в дистанционном обучении детей с ОВЗ

М.Ю.Бовт

108

Неформальное образование: от образовательной робототехники до электронного гражданина»

Брусницына Г.Г.

111

Формальное, неформальное и информальное дистанционное обучение:

сущность, соотношение, перспективы

К.Л. Бугайчук

114

Семантические вики для систем управления знаниями: опыт применения (совместная разработка профстандартов)

Я.С.Быховский, Ю.В.Катков

121

Дистанционное обучение школьников с КМ – Школой в условиях введения ФГОС.

Галина Васильева

124

Дистанционное обучение в процессе интеграции формального и неформального образования

Л.П Владимирова

125

Relarn 2013

Проблемная ситуация для организации проектно-исследовательской деятельности в дистанционном режиме (на материалах «е-КМ-Школы»)

Е.А.Яковлева и Н.К.Жесткова

128

Организация внеурочной деятельности детей-инвалидов с использованием дистанционных технологий

О.Н. Кирсанова

131

Мобильный “органайзер” учителя и библиотекаря

В.П.Короповская

132

Организация дистанционной методической поддержки учителей

в

системе повышения квалификации

Крылов А.И.

134

Эффективное библиотечное образование с помощью открытых дистанционных курсов

Кубрак Наталья Владимировна

136

Послекурсовое сопровождение учителей-предметников по теме «Сервисы Интернет в проекте»

Кувакина Елена Валентиновна

140

Методические подходы к разработке электронных пособий как части предметно-информационной среды для изучения литературы

Кудина Ирина Юрьевна

142

Педагогико-эргономические требования к компьютерным программам игрового типа для учащихся начальных классов

И.В. Мерзликина

148

Возможности построения индивидуальной образовательной траектории (дистанционные конкурсы и проекты Центра «снейл»)

Нацкевич Ю.А.

152

Описание специфики дистанционной деятельности преподавателя: предложения

в новый профессиональный стандарт

Н.В.Никуличева

155

Иерархическая модель интерактивного дистанционного обучения

Овсянникова Татьяна Владимировна

160

Relarn 2013

Как по-новому нарисовать презентацию: скрайбинг

Орешко Марина Анатольевна

161

Элементы дополненной реальности как инструмент геймификации обучения и формирования информационной культуры его участников

Подъяпольская О.И., Сиркиз Е.В.

165

Профессиональный и личностный рост педагога-участника Фестиваля «Дистанционная волна» Центра «Снейл»

С. Л. Попова

170

Дистанционное обучение школьников на примере дистанционного курса «Беседы по истории России»

Пулина С.Е.

172

Информационные технологии в подготовке учителя

Д.Т. Рудакова

174

Использование ИКТ в обучающих играх на местности

Рыженко Т.А., Березюк Е.Г.

176

Сайт неформального обучения и саморазвития подростков:

первые итоги апробации

Л.А. Серых

178

Построение открытого образовательного пространства как условие

формирования

коммуникативной и межкультурной компетенций в

преподавании иностранных языков

 

В.Г.Филатова, Н.К.Клёсова

180

Дистанционные технологии в учебной коммуникации

Хасаншина Аниса Закиевна

183

Дистанционное обучение в свете нового закона «Об бразовании в РФ»

Е.П.Чирко

186

Опыт реализации проекта «ИКТ среда обучения. Создаем и используем вместе»

О.Н. Шилова

188

ИКТ как элемент современного урока

Шорин Павел Михайлович 193

Relarn 2013

Информационное неравенство

Т.В.Щечилина

196

Как библиотекарю стать «мобильным»: Результаты и перспективы дистанционного неформального обучения

Е.Н.Ястребцева

200

Секция 1

Интернет в науке и высшей школе

Relarn 2013

Содержание

Секция1.

Интернет в науке и высшей школе

Статистика скачиваний русской и английской версий научных статей и корреляции с их цитируемостью в мировых базах данных, используемых для оценки научной деятельности отдельных ученых и научных коллективов

М.С. Аксентьева, Е.В. Захарова

12

Особенности представления российских публикаций в международных базах данных, используемых для оценки эффективности научной деятельности

М.С. Аксентьева, Е.В. Захарова

18

GlusterFS как основа архива научных данных

М.Н. Боярский, Р.Р. Назиров, М.И. Шевченко

24

Открытая виртуальная среда дополнительного высшего образования

Витковский В.В., Шхагошева З.У.

28

Развитие когнитивных технологий анализа многомерных данных распределённых информационных систем ундаментальной науки

Витковский В.В., Горохов В.Л., Желенкова О.П. Величко А.М., Комаринский С.Л.

30

Информационные системы подготовки и издания электронных научных

журналовЕ.Н. Бабин, А.М. Елизаров, Р.У. Елизарова, Е.К. Липачев

39

Сетевая инфраструктура и технологии Тольяттинского государственного университета для образования и науки

В.В. Ефросинин, А.Л. Лопырина

43

Об опыте создания системы доступа к ресурсам интернет с фильтрацией контента

Жданович П.Б., Жданович С.Ф.

45

Защита персональной образовательной мобильной среды

Зуев Владимир Иванович

51

Relarn 2013

Триадная сущность, определяющая создание электронного образовательного контента вуза на основе электронных информотек

В.И. Котиков, М.В. Котикова

53

Методология построения территориальной киберинфраструктуры

А.Г. Масич, Г.Ф. Масич

58

Удостоверяющие федерации научно-образовательных сетей

Овсянников Алексей Павлович, Овчаренко Сергей Александрович, Овсянникова Татьяна Владимировна, Биктимиров Марат Рамилевич

68

Построение высокопроизводительных беспроводных сетей с использованием двухкоординатных мотоподвесов.

И.И. Карташев, А.П. Петров

71

Электронное научное издание:

нормативная база и организационные регламенты

Т.А. Полилова, А.В. Ермаков

73

Направления сотрудничества компании D-Link с высшими учебными заведениями

Ромасевич П.В., Смирнова Е.В.

78

Современные технологии построения цифрового дома с использованием облачного сервиса MyDlink

Ромасевич П.В., Гиль А.

84

Комплексные решения D-Link по организации безопасных корпоративных сетей

Ромасевич П.В.

86

Коммутационные платформы D-Link для построения современных мультисервисных сетей науки и образования

Ромасевич П.В.

90

Электронный университет ОмГТУ

М.С. Князева, С.П. Шамец

95

Relarn 2013

Статистика скачиваний русской и английской версий научных статей и корреляции с их цитируемостью в мировых базах данных, используемых для оценки научной деятельности отдельных ученых и научных коллективов

М.С. Аксентьева, Е.В. Захарова

Редакция журнала «Успехи физических наук» Москва ms@ufn.ru, zaharova@ufn.ru

Анализ цитирования научных публикаций уже полвека используется для определения научной значимости публикации. Переход на электронные технологии позволил учитывать ряд других метрических показателей, например, статистику скачивания научных статей. Цель данной работы – анализ статистики скачиваний и цитирований научных статей журнала «Успехи физических наук» (УФН) и его английской версии “ Physics-Uspekhi” (Phys. Usp .), а также возможна ли корреляция статистики скачиваний научных статей с их цитируемостью в международных базах данных, используемых для оценки научной деятельности ученых и научных коллективов. Журнал «Успехи физических наук» основан в 1918 году и является одним из ведущих научных журналов по физике России. В журнале публикуются, прежде всего, обзоры современного состояния наиболее актуальных проблем физики и смежных с нею наук. Журнал рассчитан на широкую физическую аудиторию – научных работников, преподавателей, аспирантов и студентов-физиков старших курсов. “ Physics- Uspekhi” – англоязычная версия ежемесячного журнала «Успехи физических наук» – издается с 1958 года (до 1993 года выходила под названием “Soviet Physics-Uspekhi”). Журнал индексируется в Science Citation Index, Current Contents, Physics Abstracts, Chemical Abstracts, Scopus и др.

Статистика скачиваний статей в журнале «Успехи физических наук» ведется с момента запуска сервера журнала – с декабря 1994 года. Статистика скачиваний “ Physics-Uspekhi” за последние 5 лет предоставлена распространителем английской версии журнала издательством IOP Publishing. В статистике скачиваний статей (как УФН, так и Phys. Usp.) учитывались только успешное копирование полных текстов статей, копирование аннотаций не включалось в данное рассмотрение. Кроме того, учитывались только те запросы, которые предоставили пользователю полный текст статьи, неудачные обращения пользователя не учитывались. Цитирование научных публикаций учитывалось по данным Web of Science, Crossref и Mathnet. В Таблице 1 показан топ-лист наиболее скачиваемых в 2010 году статей русской и английской версий. Бóльшие числовые показатели по скачиванию статей русской версии обусловлены её доступностью для читателей. Статьи русской версии УФН читатели могут скачать бесплатно при условии принятия «Пользовательского соглашения» и это делает её более доступной для широкой читательской аудитории. Английская версия распространяется по подписке, что весьма сужает круг её читателей. Поэтому топ-листы скачиваний русской и английской версий в значительной мере не совпадают представленным в них статьям и количеству скачиваний полных текстов: в русской версии наиболее скачиваемыми являются статьи, интересные не только специалистам по данной тематике, но и широкой аудитории читателей. Читатели английской версии, в основном, скачивают прикладные статьи, которые они могут использовать в своих научных исследованиях, хотя, конечно, есть и пересечения.

Relarn 2013

№ Скач. Цит. Скач. Цит. п/п УФН УФН 2010- Phys.-Usp. IOP 2010- 2010 2013/ Publ.
Скач.
Цит.
Скач.
Цит.
п/п
УФН
УФН
2010-
Phys.-Usp.
IOP
2010-
2010
2013/
Publ.
2013/
total
2010
total
1
Иваницкий Г Р "XXI век: что такое
5578
8/8
Savvatimskii A I "Melting point
of graphite and liquid carbon…” (2003)
2227
3/9
жизнь с точки зрения физики" (2010)
2
Окунь Л Б "Понятие массы (Масса,
энергия, относительность)" (1989)
5050
5/22
Morozov S V, Novoselov K S,
Geim A K "Electronic transport
in graphene" (2008)
2003
27/29
3
Окунь Л Б "Формула Эйнштейна:
3813
5/7
Ivanitskii G R "21st century: what
1603
8/8
2
is life from the perspective of physics?"
E
= mc
. "Не смеётся ли
0
(2010)
Господь Бог"?" (2008)
4
Егоров А И, Степанов С И,
Шабанов Г Д "Демонстрация
шаровой молнии в лаборатории"
3928
2/14
Rozhkov S S "Dynamics of the order
parameter of superfluid phases
of helium-3" (1986)
1180
0/4
(2004)
5
Царев В А "Низкотемпературный
ядерный синтез" (1990)
3945
2/6
Lyubutin I S, Gavriliuk A G "Research
on phase transformations in 3d-metal
oxides at high and ultrahigh pressure:
938
11/11
state of the art" (2009)
6
Шноль С Э и др. "О реализации
дискретных состояний в ходе
флуктуаций в макроскопических
процессах" (1998)
3249
6/19
Reutov V P, Schechter A N "How
in the 20th century physicists, chemists
and biologists answered the question:
876
6/6
what is life?" (2010)
7
Хёрд К М "Многообразие видов
магнитного упорядочения в твердых
телах" (1984)
3040
1/3
Rabinovich M I, Muezzinoglu M K
844
5/5
"Nonlinear dynamics of the brain:
emotion and cognition" (2010)
8
Мангано М Л "Квантовая
хромодинамика и физика адронных
столкновений" (2010)
2565
2/2
Vainshtein A I, Zakharov V I,
Novikov V A, Shifman M A "ABC
of instantons" (1982)
766
17/
143
9
Гантмахер В Ф, Долгополов В Т
"Квантовый фазовый переход
сверхпроводник-изолятор" (2010)
2432
49/49
Veselago V G "The electrodynamics
of substances with simultaneously
negative values of ε and μ" (1968)
643
1146/
4848
10
Рабинович М И, Мюезинолу М К
2256
5/5
Datsko V N, Kopylov A A "On surface
electromagnetic waves" (2008)
580
9/13
"Нелинейная динамика мозга: эмоции
и интеллектуальная деятельность"
(2010)

Таблица 1. Сравнение топ-листов русской и английской версий по динамикам скачивания в 2010 и цитирования в 2010 г. и полное цитирование статей, опубликованных с янв. 1959 по апр. 2013 гг. Желтым и голубым цветом выделены русские и английские версии одних и тех же статей.

В Таблице 1 приведена также статистика по цитированию статей за 2010 – 2013 гг. и полное цитирование работ (с момента их публикации). Цитирование дано по Web of Science (WoS). Из представленных данных видно, что корреляционной зависимости между скачиванием статей и их цитированием не наблюдается как в русской, так и в английской версиях. Кроме того, статьи из топ-листа русской версии цитировались реже, чем английской, т.к. многие из этих работ освещают общефизические философские и методологические вопросы и почти не цитируются в специализированных журналах по физике. В Таблице 2 мы приводим статистику по скачиванию часто цитируемых статей русской и английской версий по данным за 2009 – 2013 гг. и цитирование этих работ в указанные годы. Корреляция между скачиванием и цитированием наблюдается только для статьи В.Г. Веселаго 1967 г. и это показывает, что для корректной интерпретации статистики скачиваний и цитирований нам необходимо анализировать каждую конкретную статью, ее научную значимость для научного сообщества. Научное сообщество оценило научную значимость статьи В.Г. Веселаго, опубликованную почти полвека назад, только в начале этого века, когда началось массовое цитирование этой работы. За последние 7 лет эта статья была процитирована более 3000 раз (общее количество ссылок на эту работу – около 5000 по WoS и более 8000 по Google Scholar при использовании программы Publish or Perish и при корректном суммировании цитирований русской и английской версий статьи).

Relarn 2013

Работа А.И. Савватимского, статистика по которой приведена в Таблице 2, является критикой обзора Э.И. Асиновского и соавт. и опубликована в рубрике «Письма в редакцию». Небольшая заметка Савватимского вызвала огромный интерес читателей русской версии УФН – менее чем за 5 лет ее скачали около 7000 раз. Читатели английской версии скачали эту статью более 1000 раз за тот же период. Однако за 4 года эта работа была процитирована всего в 4 статьях. Интересно, что сама критикуемая работа Асиновского не вызвала интереса широкой физической общественности (за указанный период статья Асиновского и соавт. была скачана чуть более 1000 раз читателями русской версии, в английской версии данная статья почти не скачивалась). Статьи академика В.Е. Фортова и соавторов вызывают неизменный интерес научной общественности во все мире. В Таблице 2 приведена статистика скачиваний его обзора по пылевой плазме. Сравнительно низкое скачивание его работы читателями русской версии УФН вероятно вызван тем, что Владимир Евгеньевич публикует много работ в специализированных журналах и русскоязычные читатели хорошо знакомы с его работами в других журналах. Читатели английской версии скачивали эту статью достаточно активно. В.Е. Фортов является признанным в мире авторитетом в области пылевой плазмы и экстремальных состояний вещества, поэтому его работы очень активно цитируются. Интерес читателей, как русской, так и английской версий УФН, к небольшой статье (тексту доклада С.В. Морозова С.В., Новоселова К.С. и Гейма А.К. «Электронный транспорт в графене» закономерен: в 2010 году Константину Новоселову и Андрею Гейму была присуждена Нобелевская премия «за новаторские эксперименты по исследованию двумерного материала графена». В 2009 г. эта работа была скачана 716 раз в русской версии УФН и 313 раз в английской версии, тогда как в 2010 году − 2044 раза в русской и 2003 раза в английской версиях. Большое количество скачиваний этой работы не слишком повлияло на ее цитируемость: она цитировалась всего в 27 раз. Таким образом, анализируя скачивания и цитирования статей, приведенных в Таблице 2, мы можем сделать следующие выводы: интерес читателей к конкретной статье (т.е. количество скачиваний) зависит от популярности тематики статьи и востребованности контента статьи для прикладных исследований (особенно для англоязычных читателей), тогда как цитируемость статьи зависит от многих факторов. В таблицах 3 и 4 мы приводим статистику скачиваний и цитирований статей по различным рубрикам. Наиболее интересны данные по рубрикам «Обзоры актуальных проблем и «Методические заметки». Основной вид публикации в УФН – обзоры актуальных проблем физики и смежных с нею наук. Одно из основных требований редколлегии к авторам обзоров – доступность содержания для широкой научной общественности, а не только для специалистов по данной тематике. Поэтому статьи из этой рубрики востребованы, как правило, всеми категориями читателей УФН. Интерес к обзорам ученых, занимающихся прикладными исследованиями, обеспечивает их высокое цитирование. Например, обзоры Дремина и соавт. и Астафьевой по вейвлетам, которые находят применение в различных областях науки, много скачивают и часто цитируют. Но не все обзоры, активно скачиваемые читателями, цитируются так же активно. Методические заметки также вызывают неизменный интерес читателей УФН (иногда даже больше, чем обзоры), однако цитируются редко (см., например п. 1 Таблицы 4 – методическая заметка Степанова, Шишарина об измерении гравитационной постоянной в лаборатории, которая была скачана почти 76500 раз, а процитирована всего лишь в одной статье). Большая часть читателей статей из этой рубрики – преподаватели, аспиранты и студенты. Эти группы читателей обеспечивают высокое скачивание статей, но не имеют достаточного количества публикаций, во всяком случае, в журналах, индексируемых Web of Science.

Relarn 2013

Papers in English

Downloads

Papers in Russian

Downloads

Cited

п/п

2009 – 2013

2009 – 2013

2009 –

2013

1.

Veselago V G "The electrodynamics of substances …"

 

Веселаго В Г "Электродинамика веществ …"

   

Sov. Phys. Usp. 10 509–514 (1968)

6845

УФН 92 517–526

7879

>1500

(1967)

(Reviews of topical problems)

(Обзоры

актуальных

 

проблем)

2.

Savvatimskii A I "Melting point of graphite and liquid carbon …"

 

Савватимский А И "Плавление графита и жидкий

   

6763

углерод …"

1298

4

Phys. Usp. 46 1295– 1303 (2003)

УФН 173 1371– 1379 (2003)

(Letters to the editors)

(Письма в

редакцию)

3.

Fortov V E et al. "Dusty plasmas"

 

Фортов В Е и соавт. "Пылевая плазма"

   

Phys. Usp. 47 447–

797

3064

153

492

(2004)

УФН 174 495–544

   

(2004)

   

(Reviews of topical problems)

(Обзоры

актуальных

проблем)

4.

Morozov S V, Novoselov K S, Geim A K "Electronic transport in graphene"

3870

Морозов С В, Новоселов К С, Гейм А К "Электронный транспорт в графене"

4866

29

Phys. Usp. 51 744–

748

(2008)

 
 

УФН 178 776–780

(Conferences and symposia)

(2008)

(Конференции и симпозиумы)

Таблица 2. Статистика скачиваний и цитирования некоторых наиболее скачиваемых статей журнала УФН за 2009 – 2013 гг. (данные 2013 г. представлены за январь – март)

Relarn 2013

     

п/п

Обзоры актуальных проблем

Скачивание

Цитирование

1

Дремин И М, Иванов О В, Нечитайло В А "Вейвлеты и их использование" (2001)

32

172

98

2

Брандт Н Б, Гинзбург Н И "Влияние высокого давления на сверхпроводящие свойства металлов" (1965)

32

597

18

3

Астафьева Н М "Вейвлет-анализ: основы теории и примеры применения" (1996)

30

319

224

4

Бойко В И, Валяев А Н, Погребняк А Д "Модификация металлических материалов импульсными мощными пучками частиц" (1999)

26

883

31

5

Чернавский Д С "Проблема происхождения жизни и мышления с точки зрения современной физики" (2000)

20

049

18

6

Менский М Б "Квантовая механика: новые эксперименты, новые приложения и новые формулировки старых вопросов" (2000)

20

132

30

7

Кирсанов В В, Орлов А Н "Моделирование на ЭВМ атомных конфигураций дефектов в металлах" (1984)

18

732

5

8

Елецкий А В "Углеродные нанотрубки" (1997)

17

720

146

9

Чернин А Д "Космический вакуум" (2001)

16

072

84

10

Рубаков В А "Большие и бесконечные дополнительные измерения" (2001)

15

821

378

Таблица 3. Топ-лист наиболее скачиваемых (с 1995 по 2013 гг.) обзоров актуальных проблем русской версии УФН 1918 – 2013 гг.

В

Relarn 2013

     

п/п

 

Методические заметки

Скачивание

Цитирование

1

Степанов Н С, Шишарин А В "Измерение гравитационной постоянной в учебной лаборатории"

76432

1

 

(2002)

2

Окунь Л Б "Понятие массы (Масса, энергия, относительность)" (1989)

32522

22

3

Егоров А И и др. "Демонстрация шаровой молнии

16727

27

в

лаборатории" (2004)

4

Малыкин Г Б "Эффект Саньяка. Корректные

12757

36

и

некорректные объяснения" (2000)

5

Гинзбург И Ф "Нерешённые проблемы фундаментальной физики" (2009)

11912

0

6

Гуцол А Ф "Эффект Ранка" (1997)

11326

25

7

Лахно В Д "Трансляционная инвариантность

10443

2

и

проблема биполярона" (1998)

8

Брагинский В Б "Отрочество экспериментальной физики" (2003)

8475

9

9

Окунь Л Б и др. "Гравитация, фотоны, часы" (1999)

8273

11

10

Болотовский Б М, Серов А В "Об особенностях движения заряженных нерелятивистских частиц

7208

4

в

переменном поле" (1994)

Таблица 4. Топ-лист наиболее скачиваемых (с 1995 по 2013 гг.) методических заметок русской версии 1918 – 2013 гг.

С момента выхода первого номера УФН в 1918 году в журнале печатаются работы выдающихся ученых с мировым именем, научные публикации которых вызывают большой интерес, как всего научного сообщества физиков, так и специалистов из других областей. В Таблице 5 приведена статистика скачиваний и цитирований статей авторов, работы которых в УФН часто цитируются. Дается статистика не только по общему количеству скачиваний и цитирований их статей в УФН, но и скачивание и цитирование самой цитируемой работы, а также скачивание и цитирование самой цитируемой работы, в которой автор – единственный автор статьи. В этих данных мы также не наблюдаем зависимости цитирования статей (по WoS) от их скачивания, например, самая цитируемая работа Э.Л. Нагаева, на которую имеется 390 ссылок, скачивалась 5494 раза, а статья Б.М. Смирнова, которая скачивалась 12111 раз, процитирована всего в 125 статьях.

Relarn 2013

1P

Author

Papers

D total

D C

D C1

C total

C C

C1

1967

Веселаго В.Г.

8

32

747

11

057

11

057

4

932

4 848

4 848

1983

Рубаков В.А.

14

90

722

10

099

15

825

967

422

378

1975

Нагаев Э.Л.

8

24

043

5

494

5

494

715

390

390

1982

Фортов В.Е.

20

70

529

7

571

2

326

686

329

30

1966

Цытович В.Н.

16

40

318

7

868

7

868

464

296

296

1972

Елецкий А.В.

24

98

069

2

279

17

720

925

162

146

1967

Смирнов Б.М.

74

213 624

12

111

8

379

1

314

125

58

1999 Желтиков А.М. 10 41 605 5 321 5 321 465 121 121
1999
Желтиков А.М.
10
41 605
5 321
5 321
465
121
121

Таблица 5. Часто цитируемые авторы УФН.

1P – год первой публикации в УФН; Papers – количество статей автора, опубликованных в УФН; D total – суммарное число скачиваний по всем статьям автора в УФН; D C – количество скачиваний самой цитируемой статьи автора в УФН; D C1 – количество скачиваний самой цитируемой статьи автора в УФН, в которой он является единственным автором; C total – суммарное цитирование всех статей автора в УФН; C C – цитирование самой цитируемой статьи автора в УФН; C1 – самой цитируемой статьи автора в УФН, в которой он является единственным автором.

Таким образом, повышенный интерес читателей к отдельным статьям не означает, что эти статьи в дальнейшем будут часто цитироваться в научных реферируемых изданиях. Например, статья Гончаров Г А, Рябев Л Д «О создании первой отечественной атомной бомбы» (УФН том 171, стр. 79–104 (2001)), которую читатели русской версии скачали около 460000 раз, процитирована всего в 7 статьях, причем 5 из них – статьи в журнале УФН. Кроме того, интересы читателей русской и английской версий журнала часто не совпадают – статьи, активно скачиваемые читателями русской версии, не всегда вызывают такой же интерес у читателей английской версии.

Работа поддержана грантом РФФИ 13-07-00672 А.

Особенности представления российских публикаций в международных базах данных, используемых для оценки эффективности научной деятельности

М.С. Аксентьева, Е.В. Захарова

Редакция журнала «Успехи физических наук» Москва ms@ufn.ru, zaharova@ufn.ru

В настоящее время для различных целей всё чаще используются библиомертические показатели (то есть различные метрики, основанные на использовании показателей цитируемости научных трудов конкретных учёных, научных учреждений, высших учебных заведений и др.). Подобные показателя

Relarn 2013

используются даже для оценки и сравнения научного и технологического потенциала различных стран. В настоящий момент, например, в Минобрнауке РФ разрабатывается проект «Карта российской науки», в рамках которого предполагается составить представление о научном потенциале России по различным областям знания в различных регионах, научных и исследовательских учреждениях, а также в высших учебных заведениях. При обсуждении этого проекта обнаружилось, что даже в рамках экспертного сообщества нет единого мнения, что считать научным трудом (ясно, что оценивать можно только опубликованный учёным материал, то есть речь, разумеется, идёт только о научных публикациях), и что считать научной ссылкой (далее НС) на научную публикацию (далее НП). Поясним, почему в рамках любого статистического исследования, основанного на библиометрических показателях, без согласованных определений НС и НП обсуждение показателей носит весьма условный характер. Допустим, что мы хотим сравнить учёных по числу публикаций за какой-то конкретный период (по определённой области науки). Все эксперты, участвующие в обсуждении библиометрических показателей согласны с тем, что число публикаций --- это важный показатель научной активности и продуктивности как учёного, так и научных коллективов. Однако, статья, опубликованная в Nature, (например) или статья, опубликованная в N-ском сборнике, ― это весьма разные публикации. Таким образом, первый вопрос, который необходимо решить при попытке составить экспертное заключение о публикационной активности и/или публикационной успешности учёного или научного коллектива, --- это какой круг публикаций (публикации из каких изданий) будут учитываться для данных конкретных целей.

Согласно Указу №599 Президента Российской Федерации от 7 мая 2012 г. одной из целей научной политики РФ является: «увеличение к 2015 году доли публикаций российских исследователей в общем количестве публикаций в мировых научных журналах, индексируемых в базе данных «Сеть науки» (WEB of Science), до 2,44 процента». Из Указа ясно следует, что в ближайшие три года «официально» российскую науку будут считать по «Web of Science» (WoS). Таким образом, на ближайшие три года (не вдаваясь в целесообразность и релевантность подобного определения) можно было бы остановиться на определении, что научной публикацией (НП) является статья в журнале или сборнике, индексируемом в Web of Science (WoS). База данных WoS является старейшей и авторитетнейшей базой данных, созданной основателем наукометрии Юджином Гарфилдом в начале 1960-х годов. В настоящий момент в этой базе индексируется более 12000 изданий. Каковы же особенности отражения научных публикаций российских учёных в этой базе данных? Первое, что следует отметить, так это то, что в настоящее время из российских изданий в WoS входит всего 148 журналов, из которых по нашим подсчётам 106 журналов имеют русскую и английскую версии. Таким образом, российские издания составляют в этой базе порядка одного процента от наименований. Возможно, что решение вопроса об увеличении числа публикаций российских учёных в WoS до 2,44% (согласно Указу №599) может быть исполнено просто механическим включением в эту базу дополнительного числа российских изданий (к чему активно призывают российские издания, пока не индексируемые в WoS), однако таковое включение требует прохождения весьма строгой экспертизы WoS.

Кроме того, должен быть учтён тип публикации, так как в российских журналах, индексируемых в WoS, имеются как научные статьи, так и рецензии на книги, общее освещение конференций, поздравительные статьи, юбилейные, некрологи, биографии, исторические эссе и т.п. Тип публикации может быть формально выделен в WoS опцией “Document Type”, где представляется целесообразным выделить подразделы: “Articles”, “Reviews”, “Notes” и, может быть, “Proceedings” (сохранив возможность включать или не включать этот тип публикаций для разных исследовательских целей при использовании КРН). Однако, даже при учёте наукометрических показателей только из такой авторитетной базы как WoS, для рассмотрения и оценки российских научных публикаций обязательно нужна ещё какая-то независимая база данных для проверки данных WoS, так как последние 12-15 лет WoS является весьма «недружественной базой» по отношению к российским публикациям (поясним

Relarn 2013

позднее примерами). Очевидно, что при любом обсуждении любой статистики, основанной на цитировании статей, имеется главный вопрос: какова полнота учёта научных ссылок на данную статью в используемых базах данных? То есть каковы качество и релевантность исходных данных? Однако для корректного использования данных по публикациям российских авторов в WoS совершенно необходимо знать и понимать особенности учёта цитирований в этой базе наших переводных журналов. Первое, что следует учесть, так этот тот факт, что при создании WoS Юджином Гарфилдом при индексировании российских изданий, разумеется, учитывались ссылки как на русскоязычную версию статьи, так и на её англоязычную версию из переводной версии российского журнала и такие ссылки суммировались. “Следы” (см. рис. 1) от такого (единственно правильного!) подсчёта ссылок видны по старым публикациям, учтённым в WoS, но только при использовании версии WoS максимальной “глубины”. Под “глубиной” версии WoS понимается год, до которого в данной версии явно учитываются индексируемые в WoS публикации. В настоящее время, например, в институтах РАН, а также в Минобрнауке, используются редуцированные версии WoS, в которых явно видны только публикации после 1980 г. Для сравнения отметим, что, например, в Германии в институтах Общества им. Макса Планка используются только полные версии WoS (до 1864 г.), так как в противном случае по базе WoS можно и не увидеть наиболее актуальных в настоящий момент публикаций. (Вспомним, например, публикацию в УФН В.Г. Веселаго 1967 г. (английская версия 1968 г.), интерес к которой взрывообразно возник только уже только 2001-2013 годах).

только уже только 2001-2013 годах). Рис. 1. Фрагмент поиска по WoS

Рис. 1. Фрагмент поиска по WoS (полной “глубины”) публикаций Келдыша Л.В. (поиск проведён 20.03.2013 в Институте им. Макса Планка, Германия). Публикации отсортированы по числу ссылок на данную публикацию (начиная от максимального). На 2-м и 4-м месте (по числу ссылок на эту статью) расположены английская (на втором месте: 1527 ссылок) и русская (на четвертом месте: 716 ссылок) версии одной и той же статьи, опубликованной в “Журнале экспериментальной и теоретической физики”. Число ссылок на русскую версию статьи составляет примерно половину числа ссылок на её английскую версию.

Такой полный учёт ссылок (ссылок и на русскую, и на английскую версии одной и той же статьи), к сожалению, проводился (ещё “вручную”) только Institute of Scientific Information (ISI) под руководством Юджина Гарфилда (пока это был научный институт, а не коммерческая организация).

Relarn 2013

Однако, как видно из рис. 1, при переводе старых данных в компьютерную базу данных каждая версия (русская и английская) были учтены как разные статьи, что приводит к удвоению числа статей у русскоязычных авторов, публиковавшихся в переводных русскоязычных журналах, (что снижает такие, учитываемые, например, в “Показателях результативности научной деятельности” (ПРНД) данные, как среднее число ссылок на статью и, разумеется, индекс Хирша). В 1990-х года эта база ISI была передана коммерческой организации Thomson, к которой впоследствии (в 2008 году) присоединилась также коммерческая организация Reuter. Политика учёта ссылок в WoS на российские издания была при этом существенно изменена. В частности, в настоящий момент в базе данных WoS учитывается ссылка только на английское издание, а ссылки на русское издание не учитывается вообще (явно), но некоторые, “следы” таких ссылок можно обнаружить по опции “Cited Reference Search”.

по опции “Cited Reference Search”. Рис. 2. Цитировние обзора

Рис. 2. Цитировние обзора Цытовича В.Н. УФН 167 (1) 57 (1997) --- 107 цитирований и [ Phys. Usp . 40 53 (1997)] --- 185 цитирований (поиск по Cited References Search на 14.01.2013)

На рис. 2 приведён пример учёта цитирования в WoS статьи Цытовича В.Н., опубликованной в журнале “Успехи физических наук” в 1997 году. Если коротко описать этот пример, то мы видим, что в WoS при поиске «в лоб» на эту статью мы получаем (на 16.01.2013) 107 ссылок (на русскую версию этой статьи, которая только и учитывается в WoS до 2001 года). Если мы проведём поиск по «скрытым ссылкам» (Cited References Search --- CRS, см. рис. 2), то мы получим ещё точных 185 ссылок на эту же статью, но на её английскую версию. Таким образом, казалось бы, что всего ссылок в базе WoS на эту статью должно быть 292. Но это не совсем так. Дело в том, что в некоторых цитирующих статьях для удобства читателей могут быть приведены и ссылка на русское издание этой статьи, и ссылка на английское издание (то есть одна цитирующая статья может быть учтена дважды). Завершение поиска CRS в WoS по этим двум строкам даёт 287 ссылок (что совершенно справедливо, так как в базе WoS каждая цитирующая статья учтена один раз, даже если в этой статье дана и русская, и английская ссылка на эту статью). Однако при прямом поиске в WoS наиболее цитируемых статьей Цытовича мы видим, что учтены только ссылки на английскую версию этой статьи (всего 107 ссылок). Соответственно, и для самого Цытовича (как учёного), и для Института общей физики РАН, в котором работает В.Н. Цытович, и для

Relarn 2013

Московского физико-технического института (МФТИ), в котором более 40 лет преподаёт Цытович, эти 180 ссылок на эту одну статью “потеряны” в WoS и не учитываются при библиометрическом анализе (например, в таких, рекламируемых Thomson-Reuter их продуктах, как Essential Science Indicators, а также в различных рейтингах вузов, сделанных на основе данных, представляемых WoS). В 2001 году политика учёта ссылок на переводные издания была вновь изменена компанией Thomson и после 2001 г. учитывается уже только ссылка на английское издание соответствующей статьи. При этом в списке статей конкретного автора, охватывающем период более 20 лет, никак не указывается, что до 2001 года учитывается только ссылка на русское издание, а после 2001 года --- только на английское издание, что делает ранжирование статей (например по числу ссылок на статью)

в рамках такого списка весьма условным (если не сказать бессмысленным). Так в списке наиболее

цитируемых статей Цытовича «лидирует» (по данным WoS) статья, опубликованная в Phys. Rev. E в 1999 г. с числом ссылок 213 , тогда как из разобранного выше примера ясно, что наиболее цитируемая

в настоящий момент статья Цытовича имеет 287 ссылок и опубликована была в УФН. В результате такого своеобразного учёта цитирования в WoS многие достойные статьи, опубликованные в переводных российских журналах не попадают (по данным WoS) в наиболее цитируемые статьи за последнее 10-летие (такой список предоставляет Essential Science Indicators), что дискриминирует эти статьи в глазах международного научного сообщества, принижает реальную роль научных исследований в России и вклад российских учёных в мировую науку. Может сложиться впечатление, что такие проблемы имеют место только для старых статей (более, чем 10-летней давности), но это не так. Приведу пример описания цитирований достаточно недавней статьи из УФН (Лукаш В.Н., Рубаков В.А. УФН за 2008 г.). В WoS (на17.01.2013) было обнаружено только 9 ссылок на эту статью (на её английскую версию), тогда как поиск по Cited References Search дает ещё 5 точных ссылок на русскую версию (которые также имеются в WoS, но эта база, даже имея однозначные идентификаторы по этим обоим версиям --- DOI, не производит суммирование всех цитат даже из журналов, индексируемых в WoS). Поясним, что такое идентификатор DOI и как он может быть использован для правильного учёта всех ссылок на статью из переводных российских журналов. Существует международная организация Publisher International Linking Organization, поддерживающая систему CrossRef, содержащую digital object identifier (DOI) − уникальный идентификатор электронного документа, присваеваемый всем публикациям, внесённым в эту базу данных издателями − членами этой ассоциации. Если, например, переводной журнал (имеющий и русскую, и английскую версии журнала), вступил в эту ассоциацию, то автоматически на сайте этого журнала появляются ссылки из статей, опубликованных в журналах, также входящих в систему CrossRef. Журнал УФН вступил в эту организацию в 2007 г. и присвоил DOI русской версии. Таким образом, на нашем сайте мы видим как ссылки на английскую версию данной статьи, так и ссылки на русскую версию той же статьи. Поэтому на нашем сайте на сегодняшний день мы видим уже 15 ссылок на рассматриваемую статью Рубакова В.А. и В.Н. Лукаша из журнала УФН 2008 года (см., например, сайт УФН http://ufn.ru/ru/articles/2008/3/d/citedby.html#ref ), причём видно, что ссылки учтены корректно, то есть, если в цитирующей статье была ссылка и на русскую, и на английскую версии этой статьи, то такая ссылка была учтена только один раз. Можно проверить, что всё это «релевантные научные ссылки» из журналов, индексируемых в WoS. Таким образом, при наличии у переводного журнала DOI и к русской, и к английской версии, можно однозначно и корректно учесть все цитирования одной статьи из такого переводного журнала, однако в настоящее время руководство Thomson Reuter не считает необходимым провести такую дополнительную работу по своей базе WoS. Поэтому для корректного рассмотрения ситуации с российскими публикациями требуется специальная работа, выполняемая различными организациями для различных целей. Попытка выполнить корректный подсчёт российских публикаций и их цитирования был предпринят организацией, известной в интернете как www.elibrary.ru . В настоящей момент в этой базе анонсируется, что в ней проиндексированы более 36000 изданий, однако эти издания совершенно разного научного уровня (не было такого строгого экспертного отбора, какой имеет место в WOS, поэтому трудно сравнивать цитирование в WoS и E-library). Кроме того, та погрешность, которая

Relarn 2013

имеется в отношении публикаций в переводных российских журналах не была устранена и в e-library. Русская и английская версии переводных российских журналов учитывается раздельно в e-library и увеличивает вдвое число публикаций у авторов этих журналов при этом число ссылок на эти статьи, разумеется, не суммируются, что также дискриминирует представление этих статей в e-library. Попробуем оценить «потери» в базе WoS числа ссылок на статьи, опубликованные в российских переводных журналах в настоящее время.

В разделе Essential Science Indicators (ESI) представлены данные, учтённые в базе WoS с 1 января 2002 года по 31 декября 2012 г.

1 января 2002 года по 31 декября 2012 г. Рис. 3. «Моментальный снимок»

Рис. 3. «Моментальный снимок» данных из аналитической базы ESI WoS , выполненный в апреле 2013 г. По журналу «Успехи физических наук» учитывается только цитирование английской версии (под названием Physics - Uspekhi), причём учтено только 6167 цитат.

В настоящий момент единственной известной нам базой данных, осуществляющей корректный

подсчёт ссылок и на русские, и на английские версии статей, опубликованных в переводных российских журналах, является база Mathnet, разработку и поддержку которой осуществляет Математический институт им. В.А. Стеклова РАН (интернет-адрес базы www.mathnet.ru). К сожалению, в этой базе данных содержатся сведения практически только по математическим журналам и лишь по небольшому

числу российских журналов другой тематики, но зато представленные там данные тщательно выверены и корректны.

В базе Mathnet журнал УФН представлен архивом с 1994-го года по настоящий момент. В каждой

статье из журнала УФН, размещённой в базе Mathnet, можно увидеть список статей, цитирующих данную статью, причём при каждой цитирующей статьи указано: с помощью какой базы данных

найдена та или иная ссылка. Наибольшее число цитирований предоставляет (как и можно было ожидать) база CrossRef. Часть данных верифицируется дополнительно и по базе ADS, которую поддерживает National Aeronautics and Space Administration (NASA), а также для журналов, размещённых в базе Mathnet дополнительная проверка происходит и в самой базе данных Mathnet.

В этой базе данных Mathnet за период с 1 января 2002 года по 31 декабря 2012 года найдено 8341

ссылка к статьям, опубликованным в журнале УФН за тот же период. Если сравнить эти данные по журналу УФН с данными, предоставляемыми ESI (на базе WOS) − 6137 ссылок, то видно, что только по одному журналу УФН за это время «потеряно» более 2000 ссылок, что составляет примерно 35% от общего числа ссылок на УФН , найденных в WoS (за период с января 2002 г. по декабрь 2012 г.). Приведенные по журналу УФН данные позволяют предположить, что подобная картина имеет место и для всех остальных российских переводных журналов. То есть, данные предоставляемые WoS существенно занижены для российских переводных журналов, а следовательно, и все наукометрические данные по России, базирующиеся на информации, представленной WoS, также содержат эту «систематическую погрешность», связанную с учётом ссылок только на одну из опубликованных версий переводных журналов. Более детальное рассмотрение этой особенности базы WoS показало, что даже, если и имеется

Relarn 2013

ссылка на английскую версию статьи из переводного журнала, но эта ссылка стоит на втором месте (после цитирования русской версии), то такая ссылка также не учитывается в WoS при подсчёте числа цитирований данной статьи. На наш взгляд эта особенность WoS является просто уже технической ошибкой базы, которую было бы необходимо исправить «в рабочем порядке». Но, похоже, что у компании Thomson Reuter нет необходимых стимулов для устранения подобных погрешностей базы WoS в отношении российских изданий, имеющих русскоязычную и англоязычную версии. Так как все последующие обработки библиометрических данных (классификации и различные аналитические инструменты) будут иметь смысл тогда и только в том случае, если учёт ссылок будет полным и точным, то учёт особенностей WoS по отношению в российским изданиям представляется необходимым и весьма актуальным. Ряд организаций проводит эту работу (например «Корпус экспертов» http://expertcorps.ru/), используя данные WoS с учётом опции CRS. Однако предоставляемые проектом «Корпус экспертов» весьма представительные списки всё-таки являются статичными, то есть представляют данные, подсчитанные сотрудниками проекта на какой-то конкретный момент времени, но не предоставляют полные списки подсчитанных цитирующих статей, как это делается в базе Mathnet. Поэтому возможная работа с WoS, направленная на попытку устранения «погрешностей подсчёта цитирований» российских журналов, представляется весьма важной. С другой стороны появляется необходимость дополнительной проверки данных, представленных в WoS по цитированию. Такую возможность предоставляет достаточно молодая база Scopus (однако в этой базе также не учтены особенности переводных журналов), а также, как уже говорилось, можно использовать данные базы CrossRef. Можно также использовать небольшую программу Publish or Perish (PoP), которая позволяет произвести некоторый анализ данных по цитируемости статей, например, конкретного автора, полученный поиском по Google Scholar. Программа PoP даёт, разумеется, большие значения цитируемости статей (так как учитывает всё научные документы, индексируемые Google Scholar в интернете). Однако она предоставляет и списки цитирующих статей, пригодные для дальнейшей обработки (например, для исключения дубликатов цитирующих статей, расположенных на разных сайтах в интернете). Программа PoP, например, по журналу УФН за период 2002-2012 годы даёт 11582 ссылки на статьи из журнала УФН, опубликованные за тот же период, что ещё раз подчёркивает, что для любых библиометрических исследований необходим учёт и понимание особенностей используемых для анализа баз данных.

Работа поддержана грантом РФФИ 13-07-00672 А.

GlusterFS как основа архива научных данных

М.Н. Боярский, Р.Р. Назиров, М.И. Шевченко

Федеральное государственное бюджетное учреждение науки Институт космических исследований Российской академии наук (ИКИ РАН) Москва mb@rssi.ru

Работа выполняется в рамках Программы 22 президиума РАН «Фундаментальные проблемы исследований и освоения Солнечной системы», проект «Создание программно-аппаратного комплекса архива научных космических данных».

Нами были определены следующие основные требования к хранилищу файлов архива научных космических данных:

• Надежность хранения данных

Relarn 2013

• Масштабируемость архива

• Экономичность построения

• Простота развертывания

• Простота доступа к данным

• Поддержка со стороны разработчиков

При этом следует отметить, что время доступа к отдельным фалам и количество файловых операций типа stat, create, open, delete (unlink) за единицу времени в данном случае менее приоритетны. Исторически подобного рода архивы строились на базе библиотек магнитных лент и оптических

дисков, в лучшем случае роботизированных, где время доступа к отдельным файлам измерялось десятками секунд, а каталоги фалов хранились отдельно от самих файлов.

архива научных

Исходя из этих критериев, в качестве основы файлового хранилища для космических данных была выбрана распределенная файловая система GlusterFS [1].

Основные характеристики GlusterFS

• GlusterFS это POSIX- совместимая файловая система

• Распределенная файловая система без сервера метаданных

• GlusterFS может использоваться как сетевая система хранения данных (NAS)

• GlusterFS позволяет использовать неоднородное широкодоступное аппаратное обеспечение, что упрощает и удешевляет ее развертывание и поддержание

• GlusterFS предоставляет единое глобальное пространство имен

• GlusterFS основана на существующих стандартах сетевых протоколов и клиентов, что упрощает организацию доступа к данным

• Поддерживается репликация данных, как синхронная (зеркалирование), так и асинхронная (георепликация), что обеспечивает сохранность и доступность данных

• Гибкое и оперативное масштабирование виртуальной файловой системы

• Объем тома единой виртуальной файловой системы может составлять петабайты

• Показана возможность работы тысяч клиентов с одной файловой системой

• C 2011 г. разрабатывается и поддерживается компанией RedHat [2]

Архитектура GlusterFS

• Brick («кирпич»):

«Кирпич» - это единица хранения/строительный блок GlusterFS. Представляет собой точку монтирования локальной файловой системы на узле (сервере хранения - node). Для физического хранения файлов могут использоваться непосредственно подсоединенные диски (DAS/JBOD), для повышения надежности хранения данных рекомендуется использование аппаратных RAID6 или RAID10 для высокопроизводительных систем (HPC). Физические носители могут для повышения гибкости конфигурирования системы использоваться как

физические тома LVM. «Кирпичами» GlusterFS являются локальные файловые системы, от которых требуется поддержка расширенных атрибутов (extended attributes). К таким файловым системам относятся, например, XFS, EXT3/4, BTRFS. RedHat рекомендует использовать файловую систему XFS.

• Translator (транслятор):

Реализация логики отношения битов хранения и глобального пространства имен. Многоуровневая реализация функциональности GlusterFS.

• Volume (том):

Объединенные и обработанные трансляторами «кирпичи».

• Node (узел):

Сервер, на котором выполняется демон gluster, хранятся «кирпичи» и который предоставляет свою часть GlusterFS-томов.

Relarn 2013

Программные компоненты GlusterFS

• glusterd:

Демон гибкого управления томами. Процесс, выполняемый на всех серверах хранения. Интерфейс управления: командная строка команды gluster.

• glusterfsd:

Демон, управляющий «кирпичами» GlusterFS. На серверах выполняется по одному процесс на «кирпич», локальный для этого сервера. Управляется демоном glusterd.

• glusterfs:

Демон-сервер NFS

Демон-клиент FUSE

• mount.glusterfs:

Обеспечивает монтирование FUSE

• glusterfshd:

Демон «самолечения» (self-healing) – процесс, отслеживающий состояние реплик файлов и обеспечивающий автоматическое восстановление поврежденных/не записавшихся копий файлов.

• gluster:

Консоль Gluster - программа, реализующая интерфейс командной строки управления GlusterFS.

Доступ к данным

Доступ клиентов к данным, хранящимся в GlusterFS, может осуществляться разными способами, в зависимости от возможностей и потребностей клиента-потребителя данных:

• Собственный («native») FUSE-клиент Файловая система в пользовательском пространстве (FUSE). Клиент считывает информацию по томам с основного или запасного сервера и далее непосредственно взаимодействует с каждым сервером кластера. Этот клиент обеспечивает лучшую производительность при записи файлов и при массовом одновременном доступе к файловой системе. Он также предоставляет встроенную устойчивость к отказу одного из серверов в случае конфигурации GlusterFS с репликацией файлов. Пример (фрагмент /etc/fstab):

x2:/gv2 /gv2.fuse glusterfs defaults,backupvolfile-server=x3.c1.cosmos.ru,log-file=/var/log/ gluster.log 0 0

• NFS Встроенная в GlusterFS служба для стандартных клиентов NFS v3. Обеспечивает лучшую производительность при чтении большого числа мелких файлов. Пример:

x1:/gv1 /gv1 nfs defaults,proto=tcp,vers=3 0 0

• SMB/CIFS Требуется установка сервера Samba. Сервер монтирует GlusterFS и экспортирует ее

клиентам, обычно работающим под управлением операционных систем семейства Microsoft Windows.

• Unified File and Object (UFO) Storage унифицированное хранилище файлов и объектов. Предоставляет возможность размещения и извлечения файлов из архива как объектов через интерфейс веб-службы REST (Representational State Transfer). Gluster UFO Storage совместим с хранилищем объектов OpenStack Swift [3]. Также для доступа к данным могут использоваться и другие распространенные протоколы, такие, как rsync, FTP, SFTP, HTTP и scp.

Relarn 2013

Масштабируемость и отказоустойчивость

В основе GlusterFS лежит принцип гибкого хеширования: расположение данных определяется

хешем имени файла и путем файловой системы [4]. Тем самым в GlusterFS удалось обойтись без центрального сервера метаданных. Как следствие, в GlusterFS:

• Нет узкого места производительности файловой системы

• Уменьшаются риски потери доступа к данным

• Повышается гибкость конфигурирования

При работе GlusterFS файлы записываются на динамически конфигурируемые виртуальные тома. С использованием гибкого хеширования файлы, записываемые на виртуальный том распределяются по «кирпичам», образующим этот том. «Кирпичи» могут назначаться томам «на лету», при этом, при необходимости, выполняется миграция файлов между «кирпичами». Миграция файлов производится

при замене «кирпича» другим (например, при необходимости замены диска на новый), а также при расширении файловой системы с помощью добавления дополнительных дисков или серверов. В последнем случае выполняется операция «ребалансировки» - миграции файлов между «кирпичами» для равномерного заполнения прежних и добавленных «кирпичей». РассмотримосновныевариантыреализациивGlusterFSмасштабируемостииотказоустойчивости файлового хранилища:

• Распределенный том:

Файлы равномерно распределяются между серверами, каждый файл хранится на одном и только одном «кирпиче». Таким образом, мы получаем аналог RAID0 файлового уровня, характеризующийся достаточно высокой производительностью при использовании большого числа дисков (возможны одновременные чтение/запись на разные диски) и максимально возможным объемом хранимых данных, но при аппаратном сбое вероятна потеря данных, так как каждый файл хранится в единственном

экземпляре. Объем, доступный для хранения файлов, равен сумме объемов «кирпичей» всех серверов.

• Реплицируемый том:

При записи файлов производится копирование файлов на несколько «кирпичей». Тем самым, получаем аналог RAID1 файлового уровня с соответствующим ростом надежности и доступности

хранения данных. Число реплик задается при создании тома. Недостатком является отсутствие «горизонтальной» масштабируемости – возможности наращивания объема файлового хранилища с помощью добавления новых серверов. Объем, доступный для хранения файлов, равен сумме объемов «кирпичей» одного сервера.

• Распределенно-реплицируемый том:

При записи файлов производится распределение файлов по группам реплицируемых «кирпичей». Тем самым достигается сочетание надежности RAID1, с возможностью наращивания объема файлового хранилища с помощью добавления новых серверов («горизонтальная» масштабируемость). Одновременно повышается производительность чтения файлов. Объем, доступный для хранения файлов, равен сумме объемов реплицируемых групп «кирпичей» по всем серверам.

Георепликация

Для синхронизации данных между удаленными центрами данных, а также для обеспечения гарантированной сохранности данных при аварийных ситуациях в самих центрах данных, в GlusterFS реализована служба георепликации файлов, основанная на инкрементальном протоколе rsync. Эта служба предоставляет асинхронную репликацию фалов через ЛВС или Интернет, при этом используется модель «ведущий-ведомый» (master-slave) с возможным каскадированием [5].

GlusterFS в Институте Космических Исследований РАН

Как уже отмечалось, работы по GlusterFS в ИКИ РАН были инициированы в рамках решения задач Программы 22 президиума РАН «Фундаментальные проблемы исследований и освоения Солнечной системы». В данное время в ИКИ функционируют 2 кластера, реализующих функции серверов

Relarn 2013

GlusterFS. Один из них является экспериментальным и на нем проверяются варианты конфигурации GlusterFS , включая динамическую реконфигурацию томов, тестируется производительность различных конфигураций и отрабатываются варианты действий при возникновении нештатных ситуаций. Основной кластер, выполняющий задачи Программы 22, на данный момент состоит из 3 серверов, на двух из которых сконфигурирован распределено-реплицируемый том GlusterFS суммарной емкостью 18ТБ. Третий сервер выполняет функцию slave-узла в системе георепликации данных c первых двух серверов. Доступ к данным предоставляется как по локальной сети РАН с использованием FUSE- клиента, по протоколам NFS, SMB/CIFS, rsync, так и через сеть Интернет по протоколам FTP, SFTP и scp.

В целом, опыт эксплуатации GlusterFS в ИКИ РАН показал перспективность использования GlusterFS как основы расширяемого и обеспечивающего надежность хранения данных хранилища файлов. При чтении больших файлов достигаются скорости, близкие к ограничениям скорости передачи данных по сети. Работа с большим количеством небольших файлов приводит к существенному снижению производительности и для таких сценариев предпочтительно использование NFS с его встроенными механизмами кэширования. Хочется также отметить, что работа разработчиков GlusterFS активно продолжается, и в новых версиях устранены некоторые проблемы, которые проявлялись на раннем этапе нашей работы с GlusterFS.

Литература:

1. http://www.gluster.org/

2. http://www.redhat.com/promo/storage/press-release.html

3. https://confluence.oceanobservatories.org/download/attachments/30998760/An_Introduction_To_

Gluster_ArchitectureV7_110708.pdf

4. https://access.redhat.com/site/documentation/en-US/Red_Hat_Storage/2.0/html/Administration_

Guide/chap-User_Guide-UFO.html

5. http://gluster.org/community/documentation/index.php/Gluster_3.2:_Exploring_Geo-replication_

Deployment_Scenarios

Открытая виртуальная среда дополнительного высшего образования

Витковский В.В., Шхагошева З.У.

Специальная астрофизическая обсерватория РАН п. Нижний Архыз vvv@sao.ru, zush@sao.ru

Оглядываясь на историю возникновения и становления сети Интернет, как социального феномена, можно утверждать, что она появилась и стала развиваться самостоятельно в неконтролируемом, вообще говоря, порядке, согласуясь только с развитием компьютерных и связных технологий и соответствующим удешевлением технических средств. Сеть Интернет быстро распространилась за пределы академического мира. Она предлагала обществу одновременно и доступ к информации, и быстрое недорогое глобальное средство связи. Самоорганизация сети и ее основной принцип - децентрализованная коммутация пакетов обусловили быстрый рост с одной стороны, и безуспешность попыток централизованного глобального или регионального контроля с другой. В настоящее время любые государственные или иные организации в состоянии лишь использовать Интернет, но, в отличие от централизованных сетей, не в состоянии управлять ею. Попытки экономического управления со

Relarn 2013

стороны коммерческих структур, опирающиеся на право собственности, оказываются неудачными вследствие пиратского доступа к данным и невозможности эффективного контроля. Здесь проявляется одна из тенденций самоорганизации Интернет, воздействующей на владельцев сайтов в направлении замены платы за содержание данных платой за их объем. Можно даже утверждать, что Интернет, как система, активно противодействует попыткам отдельных индивидуумов или их объединений взять себя под административный контроль. Тенденция к неограниченному расширению каналов Интернет наглядно демонстрирует ее самообусловленность, поскольку возможности человека воспринимать информацию через самый быстрый канал – зрение ограничена примерно 8 Мб/сек (30 кадров/сек.). Очевидно, что уже существующие и разрабатываемые каналы с гигабитными и более скоростями иррационально избыточны для человека и, следовательно, нужны для других целей. Необратимое проникновение во все географические регионы и стремление к охвату всех источников информации приводит к накоплению запредельного для человека объема информации, пренебрежимо малая часть которого может быть востребована и использована индивидуумом. Принципиальное требование многосвязности указывает еще на одну цель самоорганизации Интернет – обеспечение собственной жизнеспособности независимо от глобальных и региональных экономических, политических и прочих условий. В конечном счете, можно утверждать, что уже сейчас существование и развитие Интернет не зависит от воли человека, своего создателя. Более того, человек, в настоящие время, не в состоянии не только управлять этими процессами, но и детерминировать их. Только сочетание фактографического и бихевиористического подхода может приблизить к пониманию сути происходящего. Особой областью применения Интернет является сфера образования. Создание систем дистанционного обучения, мультимедийных и гипертекстовыхучебных пособий, проведение телеконференций и проч. получает все большеераспространение во всем мире. Однако при создании таких систем подразумевается использование Интернет только, как чисто технологического средства коммуникации и представления информации. Традиционное образование просто дополняется новыми техническими средствами с сохранением общей линейной детерминированной структуры обучения. Однако происходящие качественные изменения информационной среды обитания человека требуют качественных перемен в постановке и решении задач образования. Это прежде всего отказ от линейного и переход к многомерному процессу обучения с возможностью входа в процесс ученика в произвольной «точке возникновения интереса» и произвольного расширения коллектива учителей. В качестве одной из реализаций нового подхода к Интернет-образованию, может быть предложена Открытая Виртуальная Среда (ОВС) образования. Основной идеей создания ОВС является преобразование традиционной системы образования с учетом новых реалий информационного взаимодействия в мире. Переход от отдельных научно-образовательных школ, существующих в университетах, к общему образовательному пространству, интегрирующему интеллектуальный потенциал, методические и исследовательские возможности образовательных и научных организаций составляет суть этого преобразования. Открытость виртуальной среды подразумевает возможность подключения к ней, как слушателей с произвольным начальным уровнем и конечной целью, так и преподавателей и методистов, желающих внести свой вклад в образование и просвещение. Коллективное пополнение базы знаний и дополнение ОВС, производимое отдельными специалистами и организациями, включая специалистов и организации других стран, позволит получить образовательную систему нового качества. Одновременно такая среда приобретет энциклопедические свойства, полезные для сложившихся преподавателей и исследователей. ОВС должна быть доступна для всех категорий пользователей, желающих получить образование, расширить свой кругозор или получить грамотную консультацию. Особую роль ОВС может сыграть в развитии дополнительного высшего образования, которое в настоящее время социального переустройства России оказывается весьма востребованным в научном и научно-образовательном сообществе. Так, например, желательно, а подчас и необходимо для успешной образовательной и научной деятельности в естественных науках приобретение юридического или экономического образования. Даже элементарное получение средств на исследования или образовательные инициативы, не говоря уже об инновационной или научно-предпринимателской деятельности, требует наличия профессиональной компетенции в указанных областях.

Relarn 2013

Традиционное заочное и дистанционное (оно же, фактически спроецированное на Интернет) дополнительное образование слишком формализовано затратно по времени, чтобы удовлетворить имеющиеся потребности. Можно привествовать новые предложения Минобрнауки по совершенствованию дистанционных образовательных технологий (проект «ПОРЯДОК применения организациями, осуществляющими образовательную деятельность, электронного обучения, дистанционных образовательных технологий при реализации образовательных программ»), но без смены существующей парадигмы образование в Интернет останется только искаженной проекцией существующей системы. Как давно известно: не следует наливать «новое вино в ветхие мехи» (Мф.9:17) и, следуя Евангелисту Луке (Лк.5:37—39), обратное тоже верно.

Развитие когнитивных технологий анализа многомерных данных распределённых информационных систем фундаментальной науки

Витковский В.В., Горохов В.Л., Желенкова О.П.

Специальная астрофизическая обсерватория РАН, Санкт-Петербургский Национальный исследовательский университет ИТМО vvv@sao.ru, vvv@unitel.spb.ru

Величко А.М., Комаринский С.Л.

Специальная астрофизическая обсерватория РАН п. Нижний Архыз, г. Санкт-Петербург id@sao.ru

Первые шаги к организации цифровых астрономических данных в распределенную инфраструктуру были сделаны в 90-х годах прошлого века, когда в США была создана сеть центров данных по поддержки информации, полученной космическими миссиями НАСА. Достижения в области инфокоммуникационных и компьютерных технологий обеспечили основу, на которой распределенные цифровые коллекции стали рассматриваться как интегрированная информационная система. В начале 21-го века появилась виртуальная обсерватория (VO), которая открыла новые направления научных исследований, опирающиеся на статистический анализ, поиск новых закономерностей и объединение данных разных диапазонов. Методы наблюдений в настоящее время все больше смещаются в сторону накопления больших объемов данных в разных диапазонах электромагнитного спектра, а подход к решению астрофизических задач – к статистическим методам. Такие исследования предъявляют определенные требования, как к постановке задачи, так и к способам их решения, которые все больше опираются на информационные технологии. Проблема анализа многомерных параметров, предоставляемых современными цифровыми средствами регистрации природных и техногенных процессов, наталкивается на серьезные трудности восприятия человеком тех огромных массивов данных, которые содержатся в электронных хранилищах (базах данных). Речь идет о большом числе объектов, описанных с помощью большого числа параметров или характеристик. Человеку в этом случае трудно выявить какие-либо закономерности или близость групп объектов по определенным параметрам при изучении таких данных в «сыром» (цифровом, табличном) виде. В то же время автоматическая обработка действительно больших объемов информации (миллионы и миллиарды объектов, сотни и тысячи параметров) требует разработки специальных (зачастую уникальных) алгоритмов и привлечения больших вычислительных мощностей для решения каждой узко поставленной задачи. Налицо трудноразрешимая задача: человек не в состоянии по огромному числу цифр выявить скрытые закономерности, определяющие критические объекты и параметры, а автоматическая обработка всего объема данных требует предварительного

Relarn 2013

знания закономерностей для построения алгоритмов выбора и анализа таких объектов и параметров. Применяемые в последнее время для решения этой задачи методы Data Mining (интеллектуальный анализ или обнаружение знаний в базах данных) требуют длительного времени и/или огромных вычислительных ресурсов и поэтому малопригодны для мониторинга и оперативного анализа. Как хорошо известно, если речь идет о сотнях, тысячах объектах с двумя-тремя параметрами, то для визуального восприятия и оценивания той или иной ситуации или закономерности достаточно эффективно использование обычных двумерных графиков, гистограмм или круговых диаграмм. Если речь идет о миллиардах объектах с сотнями параметров, логично сделать следующий шаг и обратиться к технологии когнитивной графики. Когнитивная графика – это совокупность приемов и методов

образного представления условий задачи, которое позволяет либо сразу увидеть решение, либо получить подсказку для его нахождения. Например, объекты с числом параметров два могут быть отображены на обычном двумерном графике в виде точек (величина одного параметра откладывается по оси абсцисс, а другого – по оси ординат), но если речь идет о десяти параметрах, то такое отображение выполнить нельзя. Объект с десятью параметрами будет расположен в десятимерном пространстве. Однако, такой десятимерный объект можно спроецировать на одну из двумерных плоскостей десятимерного пространства и отобразить графически. Если при этом выбор плоскости сделан обоснованно и удачно, то группировка точек на плоскости может подсказать какие части банка данных (какие именно объекты) следует подвергнуть дальнейшей детальной обработке.

В настоящее время для глубокого изучения многомерных данных бурно развиваются робастные

статистические и когнитивные методы представления этих данных в виде синтетических изображений интегрирующих максимальное количество сведений в графическом, образном виде мгновенно доступном сознанию человека [1-4]. Идейным толчком к развитию этих методов послужили достижения в области иконики и когнитивных наук [5-7].

По сути дела речь идет о формировании новых когнитивных информационных технологий. Суть когнитивной информационной технологии состоит в том, что человек воспринимает движущуюся проекцию, как псевдо-трехмерный объект, характеризующий многомерный образ в многомерном пространстве. Тем самым разрушается стена отчуждения между многомерными свойствами данных и человеком исследователем. Когнитивный образ начинает рассматриваться исследователем как доступный его человеческому восприятию объект из его предметной области. Предварительное масштабирование признаков по осям с помощью порядковых статистик обеспечивает усиление когнитивности, достоверности и робастности этого образа [4].

В настоящей работе продолжается развитие методик генерации, систематизации и манипуляции

когнитивными образами на основе конструирования новых алгоритмов динамического проецирования многомерных данных. Результаты экспериментов доложены авторами и поддержаны на международных конференциях в США, Англии, Японии и Индии [8-10].

1.Новые алгоритмы и методы манипулирования когнитивными образами

Обладая способностью управлять всеми параметрами проецирования и вращения многомерного образа, исследователь имеет возможность изучать многомерный когнитивный образ, выявляя его топологические и пространственные структуры. Рассмотрим следующие варианты развития алгоритмов [9-12], позволяющие усиливать когнитивные свойства генерируемых образов. Дополнительная динамика образа. Для этого в алгоритмы проецирования вводится возможность изменения направления плоскости проекций (изменение типа плоскости проекции), возможность непрерывного вращения плоскости проецирования и последовательного изменения оси вращения. Предлагается модифицированная динамическая процедура проецирования на заданную двумерную плоскость с последующей заменой этой плоскости на другую плоскость. Алгоритм позволяет осуществлять динамическое проецирование многомерных числовых данных, используя небольшое число управляющих параметров. Здесь для обеспечения динамики предполагается, что переменные обеспечивающие траектории движения плоскости проецирования, задание типа плоскости

Relarn 2013

(направления) проецирования, задание оси вращения являются функциями времени. Данный алгоритм будем использовать как базовый, проведя дальнейшие его обобщения. Пусть входные данные описываются матрицей D = {d ij } = {d i }, i = (1, n ), j = (1, p ), где d ij –действительные значения переменных (измеряемых параметров, признаков), n – число многомерных объектов наблюдения, p – число измеряемых параметров (признаков) объектов наблюдения. Изучая множество объектов, их можно представить в виде облака n точек в p -мерном пространстве параметров. Далее, будем полагать это p -мерное пространство параметров эвклидовым R P , что упрощает дальнейшие рассуждения (рассмотренные далее алгоритмы остаются рабочими в подходящих базисах аффинного пространства и ряда других базисов ). Построим отображения Φ как проекцию этого облака на двумерную плоскость Q 2 , проходящую через начало координат пространства R P . Пусть в Q 2 заданы единичные ортогональные вектора u и v, используя их несложно вычислить координаты (x,y) проекции данных на двумерную гиперплоскость Q:

, где исходная матрица данных D описывает облако точек T в многомерном пространстве R P . Предлагается алгоритм, который строит непрерывную последовательность положений Q 2 , образующих “траектории”, вдоль которых и отслеживается динамика образа. Для этого построим процедуру динамического вычисления последовательности пар векторов {u, v}. Каждая ортогональная пара векторов {u, v}| g будет определять двумерную плоскость Q| g и ее ортогональный базис, где g набор управляющих параметров небольшой размерности. Определим гиперплоскость W (размерности p – 1), проходящую через начало координат пространства R P нормальным уравнением:

x

i

=

pr

u

d

i

=

d

i

u

,

y = pr

i

v

d

i

=

d

i

v

(1)

x n = 0 ,

(2)

где

Запишем полученные выражения в развернутом виде:

{

n = n

j

}

- вектор нормали,

{

x = x

j

}

- независимые переменные p -мерного пространства.

P

j = 1

P

n

j

x

j

= 0

= 1

n 2 = 1

j

,

, где

(2.1)

величины n j имеют смысл направляющих косинусов вектора нормали n к гиперплоскости W .

j

Пусть двумерная плоскость Q 2 принадлежит W P-1 . Изменение ориентации плоскости Q осуществляется выбором нормали n и выбором ортогональных векторов u и v также удовлетворяющим (2). Очевидно, что в гиперплоскости W выбор двумерной плоскости Q 2 (p>3) неоднозначен. Такие

плоскости занимают (p - 3) - мерное пространство. Выберем пару ортов r k , r m неколлинеарных n. Назовем их ведущими осями, смысл названия будет понятен ниже. Построим ортогональные проекции векторов орт, используя соотношение

pr

W c

=

e

1

(

c

=

r

k

)

c

n

n

o

k

n

n

,

:

e

2 = r

m

n m

n

, m k

где

n

l

= r o n

l

направляющие косинусы вектора нормали n.

(3)

Таким образом, двумерная плоскость Q 2 в p -мерном пространстве R P определяется выбором двух ведущих осей и подходящей нормали n. Далее, вычислив единичные ортогональные вектора u и v и используя соотношение (1), мы получаем возможность проецировать на Q любую точку из пространства R P . Как уже было сказано выше, нам потребуется алгоритм, который строит непрерывную последовательность геометрических преобразований плоскости Q| g , образующих “траектории” в зависимости от некоторых управляющих параметров g . Из возможных геометрических преобразований особый интерес представляют вращения плоскости Q 2 в пространстве R P , позволяющие организовать информативный циклический обзор

p -мерных данных. Поскольку Q 2 принадлежит гиперплоскости W , а та в свою очередь определяется

Relarn 2013

нормалью n (2), задача сводится к вращению этой нормали вокруг начала координат R P . Из всех возможных траекторий годографа вектора нормали выберем наиболее информативные, те, которые совпадают с множеством окружностей максимального радиуса в (p-1)-мерном пространстве гиперсферы с центром в начале координат. Данное условие требует некоторых ограничений на выбор возможных направлений вращения. Зададим направление вращения вектором b, лежащим в Q 2 (по условию построения, ортогональным n). Вектор в ортогональном базисе {u, v} можно однозначно определить единственным параметром γ углом между ортом u и вектором:

b = u cosγ + v sin γ

(4)

Теперь, можно произвести поворот вектора нормали n относительно начала координат на произвольный угол φ в направлении b, новое значение нормали будет вычисляться по формуле:

n= n cos φ + b sin φ

(7)

Итак, двумерная плоскость Q 2 задается векторами u и v . Пару векторов {u, v} определим как

начальную в последовательности.

плоскость Q 2 0 , а определяющий вектор нормали n 0 . Таким образом, начальное положение плоскости Q| g определяется выбором нормали n 0 и двух ведущих осей (пары ортов r k , r m неколлинеарных n 0 ).

В набор g управляющих параметров в случае вращения плоскость Q войдут углы γ и φ . Используя приведенные формулы, построим новую проекцию данных D на двумерную плоскость. Например, выбрав ведущие оси, задав нормаль и направление вращения, изменяя с небольшим приращением угол

поворота φ , получим динамический циклический обзор данных.

Обозначим эти вектора u 0 и v 0 , соответствующую им двумерную

, соответствующую им двумерную Рис 1. Когнитивный образ при

Рис 1. Когнитивный образ при различных его положениях в многомерном пространстве

Робастность

и

категориальность.

переменных D используются:

Для

этого

в

D = {d ij } = {d i }, i = (1, n ), j = (1, p ),

алгоритмах

проецирования

(8)

в

качестве

Relarn 2013

репрезентативные, порядковые и инвариантные статистики, которые обеспечивают принципиально важные свойства формируемых образов: рядоположенность, выявление структурности (отношения части и целого). Разработан широкий набор таких статистик, позволяющий осуществлять своеобразную «нормировку» исходных данных, добиваясь искомых свойств. Хочется специально отметить, что используемые процедуры в более традиционных способах статистической обработки данных обладают свойствами непараметричности или робастности. По-видимому, эти статистические свойства также способствуют усилению когнитивных свойств образа. В свою очередь наличие этих фундаментальных свойств обеспечивает выявление сознанием человека категориальных отношений. А наличие категориальных отношений у объекта, наблюдаемого человеком (согласно Ф.Брентано) обеспечивает возможность человеческого сознания к образному и целенаправленному так называемому интенциональному мышлению. (Некоторые специалисты говорят об интенциональном переживании.) Здесь используются возможности человеческого сознания связанные с спецификой интенционального переживания открытые Э. Гуссерлем [13]. В настоящее время способность человека к категориальным переживаниям и к творческому воображению начинает использоваться в технике многоагентных систем [14] и интеллектуальных интерфейсов [15]. Существенным для усиления творческого воображения, возможностей интуиции является динамические свойства генерируемого когнитивного образа. Впервые это отметил лауреат Нобелевской премии Анри Бергсон. Эта идея воплощена в предлагаемое усовершенствование метода динамическогопроецированиязасчет:непрерывноговращениямногомерногообраза,последовательной смены осей вращения и перебора плоскостей проекций. Это способствует выявлению и зрелищной демонстрации широкого спектра свойств многомерных данных (Рис.1). Дополнительные геометрические атрибуты. Приведем обобщения алгоритмов нагружающих псевдотремерный когнитивный образ дополнительными геометрическими атрибутами. Эти обобщения позволяют выводить дополнительные количественные характеристики многомерных данных в виде геометрических особенностей наблюдаемого образа. Можно назвать такие когнитивные образы - 6D «псевдомногомерными». Отметим свойство двумерной проекции многомерных данных на экране дисплея вызывать в воображении человека оператора псевдо трёхмерный образ при динамическом изменении параметров отображения. Добавим “третье” измерение. Выше, каждому объекту наблюдения в пространстве параметров R P , мы поставили в соответствие его двумерную проекцию (1) - точку (x,y) на плоскости Q 2 . Введем параметр “глубины обзора” z, расширив отображение Φ до трех параметрического образа (x,y,z).

параметрического образа (x,y,z). Рис 2. Когнитивные образы с

Рис 2. Когнитивные образы с дополнительными атрибутами

Одним из способов такого обобщения могла бы быть трехмерная проекция, построенная согласно

Relarn 2013

описанному выше алгоритму. Для этого построим пространство Q 3 в ортогональном базисе {u, v, n} и вычислим проекцию данных на орт n, аналогично (1):

z = pr

i

n

d

i

=

d

i

o

n

(9)

Таким образом, рассмотренный алгоритм позволяет осуществлять динамическую проекцию многомерных числовых данных на произвольную двумерную плоскость в многомерном пространстве характеристик объектов наблюдения. Так на когнитивном образе каждая точка теперь имеет форму (которая задается еще одной количественно характеристикой) и каждая точка снабжается вектором, направление которого еще три несет еще три количественные характеристики (Рис.2). Полученный образ может использоваться для дальнейшей объективации и анализа (метод “ручной” классификации и

дискриминации), а так же быть образ позволяет более обоснованно выбирать методы подтверждающего многомерного статистического анализа. Алгоритм имеет небольшое число управляющих параметров, что позволяет его использовать в системах, имеющих дружественный человеко-машинный интерфейс.

2.Архитектура аналитической когнитивной системы

В настоящее время программные системы использующие и стимулирующие интуицию человека активно развиваются и используются в научных исследованиях математиками, психологами при создании нтеллектуальных интерфейсов [15]. Для фиксации этого направления развития техники удобно использовать термин техногностические системы. Главная задача таких систем состоит в том, чтобы манипуляция и наблюдение когнитивных образов генерированных на основе многомерных данных использовалось для выявления структуры, геометрических, топологических и статистических свойств многомерных данных. Это позволит пользователям выявлять скрытые зависимости и закономерности, которые не удается заметить другими способами. Кроме того, выявленные зависимости с помощью техногностических систем позволяют формировать и уточнять компьютерные онтология верхнего уровня, компьютерные онтологии представления и инфологические и концепутальные модели. Развитие техногностических систем и главных инструментов таких систем средств когнитивной визуализации многомерных данных привело к формированию и привлечению целого спектра новых

программных средств. Прежде всего, это - системы сетевого управления и загрузки многомерных данных из распределенных баз данных, затем это генераторы когнитивных метафор, компьютерных онтологий и концептуальных моделей объектов источников многомерных данных. Успешность подобных инструментов зависит от удобности наглядности работы с ними. В настоящее время для достижения этих целей интенсивно развиваются интеллектуальные интерфейсы. При этом сочетание когнитивных технологий и диалоговых, графических технологий обеспечивает увеличение комфортности и наглядность интеллектуальных интерфейсов. И наконец, последняя оболочка - интеллектуальная система поддержки отраслевых управленческих решений освобождает специалиста в конкретной предметной области от необходимости осваивать детали новой информационной технологии. Ему достаточно анализировать многомерные данные, используя терминологию своей предметной области. Таким образом, можно выделить следующие инструменты (Рис.3):

1. Интеллектуальная система поддержки отраслевых управленческих решений (на основе

когнитивной теории решения проблем).

2. Интеллектуальный интерфейс (на основе когнитивной теории решения проблем, теории

интеллектуальных организаций, теории категорий и транзакционного анализа).

3. Система когнитивной визуализации (на основе методов динамической визуализации

многомерных данных).

4. Когнитивная система сетевого управления и загрузки многомерных данных из распределенных

баз данных и знаний в OLAP и ERP технологиях.

5. Генератор когнитивных метафор, компьютерных онтологий и концептуальных

моделей объектов наблюдения (на основе теории семантических пространств, онтологий

и языков логики Лесневского).

Relarn 2013

Relarn 2013 Рис 3. Архитектура аналитической когнитивной системы

Рис 3. Архитектура аналитической когнитивной системы

3.Сочетание когнитивной машинной графики с другими информационными технологиями

Разработанная технология и методика когнитивно-визуального анализа больших объёмов гетерогенных и отягощённых ошибками данных, протестированная на данных различной природы показала свою применимость и перспективность не только для постериорного анализа данных, но и для задач оперативного контроля и управления сложными системами. Таким образом, возможно развитие методов когнитивной машинной графики в сочетании с другими информационными технологиями. Учитывая бурное развитие концепций интеллектуальных интерфейсов, концепций интеллектуальных систем поддержки управленческих решений, концепций эргономики формирования программных интерфейсов адаптированных к возможностям человеческого сознания (концепция юзебилити), концепций комплексной обработки набора цифровых изображений

Relarn 2013

кажется естественным и гармоничным срастание когнитивной машинной графики с этими информационными технологиями, включая технологии многомерного статистического анализа. Такое сочетание успешно развиваемых в настоящее время программных технологий, которые можно концентрировать на базе отраслевых систем поддержки управленческих решений (используя в качестве интегратора когнитивную машинную графику) обеспечивает принципиальный прорыв проблем принятия человеком решений в условиях глубокой априорной неопределенности в отношении объектов управления или наблюдения. В качестве иллюстрации тенденций сочетания и срастания современных информационных технологий ниже приведен вариант взаимодействия техногностической системы поддержки управленческих решений на основе аналитической когнитивной системы визуализации многомерных данных с уже ставших традиционными линейками программных средств (Рис 4).

программных средств (Рис 4). Рис 4. Схема взаимодействия

Рис 4. Схема взаимодействия аналитической когнитивной системы визуализации многомерных данных.

Заключение

Таким образом, развитие методов и методик когнитивной визуализации многомерных данных на основе введения динамичных процессов в алгоритмы проецирования, выбора оси вращения, направления проецирования обеспечило усиление когнитивного эффекта. Введение в алгоритмы проецирования новых геометрических элементов привело к новым когнитивным эффектам псевдо многомерности когнитивного образа (6D «псевдомногомерный» образ). Использование порядковых и

Relarn 2013

инвариантных статистик усилило когнитивность и робастность алгоритмов когнитивной визуализации. Внедрение этих модификаций привело к развитию методик манипуляций с когнитивными образами, что повлекло за собой развитие когнитивных программных систем нового типа: интеллектуальная система поддержки отраслевых управленческих решений, интеллектуальный интерфейс, система когнитивной визуализации, когнитивная система сетевого управления и загрузки многомерных данных из распределенных баз данных и знаний в OLAP и ERP технологиях, генератор когнитивных метафор. Работа алгоритмов протестирована на конкретных практических примерах использования когнитивных информационных технологий.

Литература:

2. Шапиро Л., Стокман Дж. Компьютерное зрение. М.Лаборатория знаний. 2006.

3. Cook D, Swaine D.E. Interactive and Dynamic Graphics For Data Anlysis. Spriger. 2009.

4. Горохов В.Л., Лукьянец А.А., Чернов А.Г. Современные методы когнитивной визуализации многомерных данных. Монография. Томск.:Некоммерческий фонд развития региональной энергетики. 2007.

5. Бузников А.А., Горохов В.Л., Логачев В.А., Андреев М.В. Робастно-когнитивные методы обработки изображений, полученных при дистанционном зондировании. / Оптический журнал, том 66, №8, август 1999.

6. Бузников А.А., Горохов В.Л. Систематизация сегментированных структур на многоспектральных изображениях, преобразованных методами динамических проекций. Оптический журнал том 71 № 3 март 2004 .

7. Buja D., Cook D., Swayne F. Interactive High-Dimensional Data Visualization // Journal of Computational and Graphical Statistics. 1996. № 5(1).

8. Gorohov V., Vitkovskiy V. The Cognitive Visualization System the Dynamic Projection of Multidimensional Data. Astronomical Data Analysis Software and Systems (ADASS) XVII / Editors: Argyle, Robert W.; Bunclark, Peter S.; Lewis, James R. London, UK 2008.p. 243-246.

9. Vitkovskiy V.; Gorohov V.; Komarinskiy S. 6-D Visualization of Multidimensional Data by Means of Cognitive Technology. Astronomical Data Analysis Software and Systems (ADASS) XIX / Editors:

Mizumoto Y., Morita K.-I., Ohishi M.; San Francisco, USA, 2010. p. 449-553

10. Evdocimov V, Gorokhov V., Vitkovskiy V. Cognitive imaginig in visual data / Abstract . Scientific programme. International conference “High Performanсе Computing in Observational Astronomy:

Requirements and Challenges”. Puna. India. 12-14 October. 2009. p.5.

11. Витковский В.В., Горохов В.Л., Комаринский С.Л. Разработка когнитивной технологии оперативного анализа данных, контроля и управления сложными системами. Материалы Международной молодежной научной конференции «МАТЕМАТИЧЕСКАЯ ФИЗИКА И ЕЕ ПРИЛОЖЕНИЯ» (МФП-2012) Пятигорск. СКФУ 2012, т.2. стр.81-88

12. Горохов В.Л., Витковский В.В., Жуковский А.Н. Когнитивные методы анализа многомерных данных для мониторинга экстремальных явлений в природе и техносфере. Концепции и принципы. Материалы Международной молодежной научной конференции «МАТЕМАТИЧЕСКАЯ ФИЗИКА И ЕЕ ПРИЛОЖЕНИЯ» (МФП-2012) Пятигорск. СКФУ 2012.Т2. стр 88-94

13. Гуссерль Э. Логические исследования. Картезианские разьышления. Мн.: АСТ, 2000

14. Тарасов В.Б. От многоагентных систем к интеллектуальным организациям М.: УРСС, 2002

15. Раскин Д. Интерфейс: новые направления в проектировании компьютерных систем. М.Корвин

2012.

Relarn 2013

Информационные системы подготовки и издания электронных научных журналов

Е.Н. Бабин, А.М. Елизаров, Р.У. Елизарова, Е.К. Липачев

Казанский (Приволжский) федеральный университет, Национальная библиотека Республики Татарстан, г. Казань, Evgenij.Babin@kpfu.ru, amelizarov@gmail.com, elizrim@gmail.com, elipachev@gmail.com

Изменения, связанные с проникновением информационно-коммуникационных технологий (ИКТ) практически во все сферы деятельности, в первую очередь затронули научно-исследовательскую рабо- ту, которую в настоящее время уже невозможно представить без компьютеров и интернета. ИКТ при- меняются на каждом шаге проведения научных исследований (см., например, [1]), а электронное пред- ставление научных материалов используется чаще бумажного, что связано как с наличием новых форм представления научных сообщений (например, презентаций), так и с преимуществами сетевого обме- на информацией. Повсеместное замещение печатных изданий электронной формой документов и, как следствие, возникновение многообразия различных форматов данных привели к коренному изменению технологий хранения, обработки и передачи информации. Появившиеся новые сервисы (в том числе поисковые), непосредственно связанные с электронной формой представления информации, делают электронные научные ресурсы более привлекательными по сравнению с печатными изданиями. С развитием глобальной телекоммуникационной инфраструктуры и появлением нового поколения мобильных устройств привычные книги и журналы стали менее востребованными в процессах научно- исследовательской деятельности. Это подтверждают, в частности, снижающиеся (и так небольшие) тиражи новых печатных научных изданий и увеличивающееся количество электронных научных ресурсов. Вместе с тем, научные электронные издания и ресурсы растворены в потоке электронной информации, объем которой удваивается каждые 18 месяцев. Согласно последним прогнозам (см. [2]), к 2020 году Цифровая Вселенная (Digital Universe) достигнет объема в 40 зеттабайт, при этом почти 50% данных будет относиться не к корпоративной информации, а к сфере развлечений. В связи с этим традиционный подход к организации хранения электронных публикаций и доступа к ним через интерфейс полнотекстовых поисковых систем (являющийся в наши дни наиболее распространенным и базирующийся на использовании стандартных сервисов и поисковых средств интернета) применительно к научной электронной информации становится все менее эффективным не только в силу растущих ее объемов и особенностей жизненного цикла электронных научных публикаций, но и по причине консьюмеризации информационных технологий (см., например, [3, 4]). Использование ИКТ в информационно-издательской деятельности позволило не только наладить опережающий выпуск электронных версий научных изданий (книг, журналов, трудов конференций, справочников и т. д.), но и предоставить авторам, читателям, редакционным коллегиям и редакциям множество новых сервисов в работе с информацией. Так, например, составной частью практически всех современных информационных систем, используемых производителями и распространителями научной и образовательной информации, являются сервисы получения наукометрических данных, а учет этих данных при анализе публикационной активности сотрудников университетов и НИИ и выявлении наиболее перспективных направлений развития научных исследований в этих организациях становится повсеместной практикой. Кроме того, использование информационных систем позволяет решить такие задачи, как распространение и продвижение исследований, увеличение количества запросов к их результатам, реформирование системы научной коммуникации университетов. Крупнейшие мировые издательства научной литературы одними из первых стали использовать ИКТ, внедрили и постоянно развивают собственные системы электронного книгоиздания. Примерами служат информационная система издательства Springer (www. springer.com), платформа Science

Relarn 2013

Direct (http://www.sciencedirect.com) издательства Elsevier (www.elsevier.com), система электронных публикаций научного архива arXiv.org (http://arxiv.org/), научная электронная библиотека eLIBRARY.ru (http://elibrary.ru) и математический портал Math-Net.Ru (www.mathnet.ru). Названные информационные системы являются коммерческими продуктами, массовое распространение и тиражирование которых не предусмотрены. Кроме того, эти системы нацелены на электронное книгоиздание значительного количества научных журналов, а их поддержка осуществляется крупными держателями научных информационных ресурсов. С другой стороны, издание научных журналов и сборников трудов, а также формирование электронных образовательных и научных коллекций являются неотъемлемой частью научно-исследовательской и образовательной деятельности любого ведущего университета и академического НИИ. Эта деятельность требует разработки и внедрения современных методов формирования новых ресурсов, а также интеграции в единое электронное хранилище всех электронных ресурсов, имеющихся у правообладателей. Препятствием формированию единого национального научно-информационного пространства являются также разобщенность издательских инфраструктур и отсутствие организаций, способных выполнить системную работу по интеграции отечественных информационных ресурсов в мировые научные базы данных. В этой связи определенный интерес вызывает подход к интеграции научных электронных ресурсов, реализованный в проекте «Научная периодика Украины» (см., например, [5]): в этом проекте вопросы развития научно-издательской отрасли рассмотрены как важный аспект государственной реформы научного сектора и предложена модель общегосударственной платформы научной периодики (см. [6]). С практической точки зрения для достижения весомого результата в направлении интеграции научно-образовательных ресурсов наибольший интерес вызывают свободно распространяемые («open source») информационные системы управления научными журналами и публикациями. Благодаря открытому коду появляется возможность доработки таких систем и придания им требуемой функциональности. Важным обстоятельством является также наличие у многих из этих систем групп разработчиков, выкладывающих на соответствующие сайты новые модули, часто выполненные инновационными методами с применением передовых информационных технологий. Современные информационные системы управления научными журналами не только предоставляют доступ к содержимому научных статей, но и обеспечивают расширенный поиск (по автору, названию статьи, ключевым словам и др.) в соответствующих электронных коллекциях, а также сервисы удаленного представления статей в научный журнал и их дальнейшей обработки для окончательной публикации. В функционале таких систем должны также присутствовать сервисы, регулирующие процесс рецензирования и обеспечивающие коллективное редактирование электронного документа. Кроме того, системы такого типа должны предоставлять такие редакционные сервисы, как классификация, аннотирование, выделение метаданных, публикация, долгосрочное хранение, конвертирование, распространение, синдикация, статистика использования, харвестинг, объединение в коллекцию, взаимодействие с институциональными репозиториями, контроль доступа, подписка, рассылка уведомлений, новые поступления. В Республике Татарстан (РТ), прежде всего, в Казанском (Приволжском) федеральном университете, Казанских национальных исследовательских техническом и технологическом университетах, институтах Казанского научного центра РАН, Национальной библиотеке РТ, имеется весьма значительное количество научных изданий, поэтому острыми являются проблемы как интеграции имеющихся электронных ресурсов, так и выбора платформы единого электронного хранилища научных журналов. При этом названные выше требования к информационным системам подготовки и издания электронных научных журналов должны быть дополнены возможностью локализации на русский и татарский языки, способностью системы управлять междисциплинарным контентом, наличием или возможностью подключения семантических инструментов обработки информации (см., например, [7], [8]). В частности, для математических журналов исследовались способы подключения скриптов поиска по фрагментам формул [9], а также методы формирования математических электронных коллекций (см. [10]). Стратегическими являются вопросы внедрения технологий Cloud Computing (например,

Relarn 2013

[11]). По оценкам [2], к 2020 году примерно 40% информации Цифровой Вселенной будет «затронуто» этими технологиями. Приведенным выше требованиям удовлетворяет ограниченное число информационных систем управления научными публикациями, а наиболее функционально развитыми являются лишь несколько систем:

• Open Journal Systems (OJS), разрабатывается с 2002 года в рамках проекта Public Knowledge Project (http://pkp.sfu.ca/ojs); систему можно развернуть как в операционных системах MS Windows, так и на UNIX-подобных системах и Mac; для работы OJS необходимы PHP (версии 5 и выше), MySQL (версии 3.23 и выше) или PostgreSQL (версии 7.1 и выше); любую версию системы, включая последнюю (OJS 2.4.2 от 4.03.2013), можно скачать по адресу http://pkp.sfu.ca/ojs/download/;

• HyperJournal – проект, инициированный в 2004 году Groupement de Recherche Europeen (GDREplus) и поддержанный Centre National de la Recherche Scientifique (CNRS); в настоящее время развивается также с помощью волонтеров при поддержке Dipartimento di Scienze della Politica, University of Pisa; система устанавливается в Linux, для работы требуется дополнительная установка PHP и MySQL; главная веб- страница проекта – http://www.hjournal.org/; дистрибутив системы доступен по адресу http://sourceforge.net/ projects/hyperjournal/;

• ePublishing Toolkit (ePubTk) – издательский набор инструментов, разрабатываемый с 2004 года Max Planck Society (https://dev.livingreviews.org/projects/epubtk/); систему можно установить в операционных системах MS Windows (win32) и Linux-системах (SuSE, Fedora Core, Ubuntu), для работы требуются установка Python (версии не ниже 2.3), а также ряд пакетов Python (см. https://dev.livingreviews.org/projects/epubtk/wiki/ Requirements);

• Digital Publishing System (DPubS) – система, разрабатываемая с 2004 года библиотекой Cornell University в сотрудничестве с Pennsylvania State University Libraries and Press; установить систему можно в Solaris 9 (sparc), Solaris 10 (sparc) или Linux (Red Hat FC4 for x86), требуется установка Perl 5.8+; Apache/mod_perl; Java 1.4.2+ (подробнее см. https://confluence. cornell.edu/display/dpubs/DPubSInstallGu ideSystemRequirements); стартовая страница проекта – http://dpubs.org/; дистрибутив можно скачать с сайта http://sourceforge.net/projects/dpubs/;

• Topaz (http://www.topazproject.org/trac/) – проект, начатый в 2005 году Public Library of Science (http://www.plos.org/); система написана на Java и может быть развернута в любой операционной системе, поддерживающей Java; пакеты инсталляции доступны для скачивания по адресу http://www.topazproject.org/trac/wiki/Download;

• Drupal E-Journal (http://drupal.org/project/ejournal) – система, созданная в рамках хорошо известного проекта Drupal; последняя версия (от 25.02.2011) доступна по адресу http://ftp.drupal.org/files/projects/ejournal-5.x-2.x-dev.zip. При анализе названных журнальных систем использовались результаты работ [12 – 14], в которых проведено их сравнение по основным параметрам, включая количество инсталляций, технические требования, поддерживаемые форматы данных и наличие документации. Системы OJS, DPubS и ePubTk по результатам анализа получили преимущество по совокупности параметров. В Казанском федеральном университете в 2013 году начата реализация пилотного проекта формирования электронного хранилища научных журналов. Базовой платформой выбрана система OJS. Возможности этой системы и приемы работы в ней представлены в большом количестве руководств и публикаций (например, [15]). Решающим обстоятельством выбора системы OJS как базовой платформы стал следующий набор факторов:

облачное программно-технологическое решение;

Relarn 2013

возможность реализации взаимодействия участников издательского процесса в online-режиме;

наличие программных средств организации долгосрочного хранения данных;

постоянно пополняющаяся галерея модулей (http://pkp.sfu.ca/support/forum/ viewforum. php?f=28);

менеджмент online-подписки;

отлаженная методика использования (благодаря которой система имеет более

15000 внедрений, список изданий, использующих OJS, приведен на сайте http://pkp.sfu. ca/ojs-journals), а также возможность гибкого конфигурирования системы; в ряде стран

OJS развертывается как национальная или транснациональная журнальная платформа (например, [5, 6]). В докладе изложены результаты, достигнутые в рамках названного проекта. Работа выполнена при финансовой поддержке РФФИ (проекты 12-07-00667, 12-07-

97018-р_поволжье).

Литература:

1. Щур Л.Н. Роль инфокоммуникационных технологий в развитии процесса глобализации научных исследований // Информационное общество. 2012. №5. С. 16-24.

2. Gantz J., Reinsel D. The Digital Universe in 2020: big data, bigger digital shadows, and biggest growth in the far east // IDC Digital Universe Study. December, 2012. URL: http://www.emc.com/ leadership/digital-universe/iview/index.htm/

3. D’Arcy P. CIO strategies for consumerization: the future of enterprise mobility // Dell Power Solutions Special Issue. Dell Inc., 2012. P. 22-25. URL: http://www.dell.com/Learn/us/en/ 555/

power-solutions-magazine-2012-special-issue

4. Гениев А. Консьюмеризация ИТ: новая проблема для ИТ-директора или новый ресурс для бизнеса? // IT-MANAGER. 2011. № 7. С. 58-59. URL: http://www.allcio.ru/ download/pdf/

itmanager/93/ITM_07.pdf.

5. Состояние и перспективы развития научной периодики Украины URL: Ошибка! Недопустимый объект гиперссылки.

6. Соловяненко Д.В. Модель общегосударственной платформы научной периодики на базе Open Journals System // Міжнар. наук. конф. MegaLing'2011 «Горизонти прикладної лінгвістики і лінгвістичних технологій», Київ, 26 – 30 верес. 2011 р.

7. Глухов В.А., Елизаров А.М., Липачев Е.К., Малахальцев М.А. Электронные научные издания:

переход на технологии семантического Веба // Электронные библиотеки. 2007. Т. 10, Вып. 1. URL: http://www.elbib.ru/index.phtml?page=elbib/rus/journal/2007/part1/ GELM.

8. Веселаго В.Г., Елизаров А.М., Липачев Е.К., Малахальцев М.А. Формирование и поддержка физико-математических электронных научных изданий: переход на технологии Семантического веба // В кн. Научно-исследовательский институт математики и механики им. Н.Г. Чеботарёва Казанского государственного университета. 2003 – 2007 гг. Казань: Изд- во Казан. ун-та, 2008. С. 456-476.

9. Елизаров А.М., Липачёв Е.К., Малахальцев М.А. Веб-технологии для математика: Основы MathML. Практическое руководство. М.: Физматлит, 2010. 200 с.

10. Технологии MathML поиска по формулам в электронных математических коллекциях // Материалы Межд. науч.-практ. конф. «Информационные технологии в образовании и науке – ИТОН-2012» (8 – 12 октября, Казань). Казань: Казанский ун-т, 2012. С. 85-86. URL: http://vuz. exponenta.ru/PDF/NAUKA/ Sbornik12ito.pdf.

11. Елизаров А.М., Липачёв Е.К. Технологии формирования и поддержки электронных научных математических коллекций: опыт Казанского университета // Система обеспечения российских организаций научно-технической информацией в электронном виде. Отчетная конференция

Relarn 2013

по проекту МОН. URL: http://conf.neicon.ru/index.php/ science/mon2012/paper/ view/31/28.

12. Елизаров А.М., Липачёв Е.К., Хохлов Ю.Е. Технологии облачных вычислений для поддержки функционирования электронного научного журнала // Материалы Межд. науч.-практ. конф. «Информационные технологии в образовании и науке – ИТОН-2012» (8 – 12 октября, Казань). Казань: Казанский ун-т, 2012. С. 82-85. URL: http://vuz.exponenta.ru/PDF/NAUKA/

Sbornik12ito.pdf.

13. Chýla Ch. What open source webpublishing software has the scientific community for e-journals?// In CASLIN 2007, Stupava (Slovak Republic). URL: http://eprints.rclis.org/ 10055/.

14. Cyzyk M., Choudhury S. A survey and evaluation of open-source electronic publishing systems. 2008. URL: http://jhir.library.jhu.edu/handle/1774.2/ 32737.

15. Tools and Platforms. URL: http://www.openoasis.org/index.php?option =com_content&view=artic

le&id=353&Itemid=379.

16. Willinsky J., Stranack K., Smecher A., MacGregor J. Open Journal Systems: a complete guide to online publishing. Simon Fraser University Library, 2010. 273 p. URL: http://pkp.sfu.ca/ojs/docs/

userguide/2.3.1/index.html.

Сетевая инфраструктура и технологии Тольяттинского государственного университета для образования и науки

В.В. Ефросинин, А.Л. Лопырина

Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «То- льяттинский государственный университет» Тольятти efrow @tltsu.ru

Начало строительства корпоративной компьютерной сети Тольяттинского государственного университета (ККС ТГУ) было положено в середине 90-х годов, когда в рамках программы обучения уволенных в запас офицеров было оборудован первый компьютерный класс, организован выход в Интернет. Общее количество персональных компьютеров в сети университета в то время насчитывалось порядка 50 шт. К концу 2003 года было закончено создание основных узлов ККС ТГУ. Ее основу представляет коммуникационное оборудование компании D-Link, а сетевые сервисы реализованы на базе программного обеспечения с открытым кодом. С этого момента и до настоящего времени сетевая инфраструктура постоянно развивается. На рисунках 1-4 представлена динамика роста скорости доступа к Интернету, загрузка Интернет-канала, доступность магистрального и сетевого оборудования, а также объем входящего и исходящего трафика.

60 50 40 30 20 10 0 2006 2008 2010 2012 Рис.1 Скорость доступа к
60
50
40
30
20
10
0
2006
2008
2010
2012
Рис.1 Скорость доступа к Интернету (Mbps)
72 70 68 66 64 62 60 2009 2010 2011 2012 Рис. 2 Загрузка Интернет-канала
72
70
68
66
64
62
60
2009
2010
2011
2012
Рис. 2 Загрузка Интернет-канала (%)

Relarn 2013

100

99,8

99,6

99,4

99,2

99

98,8

Relarn 2013 100 99,8 99,6 99,4 99,2 99 98,8 2010 2011 2012 2013 Магистральное оборудовани

2010 2011 2012 2013

Магистральное оборудовани Сетевое оборудование
Магистральное
оборудовани
Сетевое
оборудование

3000

2500

2000

1500

1000

500

0

2009 2010 2011 2012
2009
2010 2011
2012
Входящий Исходящий
Входящий
Исходящий

Рис.3 Доступность магистрального и сетевого оборудования (%)

Рис. 4 Входящий и исходящий Интернет-трафик (Gb)

Схема ККС ТГУ по состоянию на 2013 год представлена на рисунке 5

2013 год представлена на рисунке 5 Рис. 5 Схема корпоративной

Рис. 5 Схема корпоративной компьютерной сети ТГУ

Возможности ККС ТГУ обеспечивают ее пользователям предоставление и поддержку безлимитного канала выхода в Интернет, а также целого ряда базовых ИТ-сервисов, таких как веб- и прокси-серверы, электронная почта, серверы точного времени и резервного копирования, файловый сервер, серверы антивирусной защиты и поддержки пользователей, серверы доменов пользователей. В качестве примеров использования ИТ-инфраструктуры в области образования можно привести:

Участие ТГУ в ежегодном Интернет-тестировании студентов, проводимом Министерством науки и образовании РФ; Организованная видео-конференцсвязь с представительством ТГУ в городе Сызрань для проведения учебных занятий; Электронная приемная комиссия для работы с выпускниками задолго до их окончания школы; Образовательный портал; Образовательный Wiki-сервер для обучения магистров. Для науки помимо стандартных ИТ-сервисов: электронная почта, файловый сервер, сервер резервного копирования, безлимитный доступ к Интернет, также предоставляется Удаленный доступ к обработке данных в лаборатории «Физика прочности и интеллектуальные

Relarn 2013

диагностические системы»; Коммуникационная площадка объединенного НТС на базе gapps; Проект подключения к ТТС ПТ «Жигулевская долина». В перспективе развития ККС на ближайшие три года предусмотрено дальнейшее увеличение скорости доступа к Интернет (до 1Гб/сек), покрытие зоной WI-FI всей территории кампуса университета, подключение к центру обработки данных технопарка «Жигулевская долина», развитие сети видеоконференц-связи с представительствами университета в городах Самарской области.

Об опыте создания системы доступа к ресурсам интернет с фильтрацией контента

Жданович П.Б., Жданович С.Ф.

Волгоградский государственный медицинский университет pavel.b.zhdanovich@gmail.com, svetlana.f.zhdanovich@gmail.com

Контроль доступа детей к ресурсам Интернет всегда являлся одной из важнейших задач в информационных системах, используемых детьми и подростками. Поиск технических решений, позволяющих эффективно осуществлять такой контроль, ведется повсеместно в технологически развитых странах. Россия не является исключением, однако здесь законотворческая инициатива и судебная практика иногда опережают развитие информационных технологий и методических основ контроля доступа в Интернет.

В России регулирование вопросов доступа детей к интернет-ресурсам было активизировано в рамках национального проекта «Образование». Постановлением правительства № 1447 от 18.10.07 двум министерствам: Минобрнауки и Минкомсвязи было поручено, среди прочего, осуществить не позднее 2009 года «внедрение и актуализацию системы исключения доступа к интернет-ресурсам, несовместимым с задачами образования и воспитания учащихся». В мае 2011 года, министр образования и науки РФ утвердил «Правила подключения общеобразовательных учреждений к единой системе контент-фильтрации доступа к сети Интернет, реализованной Минобрнауки России». В правилах декларируется существование «единой системы контентной фильтрации», доступной на портале «Российское образование» по адресу http://skf.edu.ru.

После вступления в силу с 1 сентября 2012 года федерального закона №436 «О защите детей от информации, причиняющей вред их здоровью и развитию» (с поправками от 28 июля 2012 года) доступ в Интернет в местах, доступных для детей, должен предоставляться «при условии применения административных и организационных мер, технических, программно-аппаратных средств защиты детей от информации, причиняющей вред их здоровью и (или) развитию». На основании вышеупомянутых «правил подключения» и норм закона 436-ФЗ региональные органы образования издали собственные приказы о регулировании доступа детей к интернет-ресурсам.

Говоря о собственном опыте создания системы контентной фильтрации, авторы не ставят целью показать преимущества своей разработки перед имеющимися. По нашему мнению, полноценная система контроля доступа к Web-ресурсам не может быть создана с нуля силами одного коллектива или компании, даже при финансовой поддержке государства, которое, впрочем, уже неоднократно выделяло значительные ресурсы на разработку и централизованное внедрение подобных систем.

1.URI-фильтрация

Каждый ресурс в сети Internet, достижимый по HTTP и производным от него протоколам, имеет уникальный идентификатор (universal resource identifier, URI). Отождествление Web-ресурса

Relarn 2013

(HTML-документа или иного файла) и его URI позволяет разграничивать доступ к ресурсам на основе списков доступа, составленных из идентификаторов. Списки, как правило, составляются экспертами, которые во время премодерации непосредственно знакомятся с содержимым ресурсов, определяют их принадлежность к той или иной тематике и помещают их идентификаторы в соответствующий список. Обычно категоризации подвергаются и сами домены. Эксперты могут принадлежать к числу сотрудников одной организации (компании) или образовывать сообщество, внутри которого ведется обмен результатами работы и поддерживается общий каталог ресурсов или доменов. URI-фильтрация строится на основе «черных» и «белых» списков доменов и отдельных ресурсов. При запросе ресурса пользователем его идентификатор или домен, в котором он расположен, проверяется на принадлежность той или иной категории путем поиска в соответствующих списках, после чего система доступа принимает решение об отправке запроса в Сеть или его отклонении. Безоговорочное преимущество технологии URI-фильтрации состоит в том, что она производится быстро, с минимальными затратами для системы. Списки доступа можно легко пополнять и обеднять. Содержимое запрещенного ресурса не запрашивается в Сети, что в целом снижает нагрузку на канал. Не менее очевидны и недостатки URI-фильтрации.

1. URI не определяет содержание ресурса. Оно может измениться. Особенно это касается СМИ, социальных сетей, порталов и других сайтов с динамично меняющимся контентом. Кроме того, доменные имена являются товаром, и с развитием рынка доменов вероятность смены тематики ресурсов, размещенных в домене, в целом возрастает.

2. Оценка эксперта всегда субъективна и практически не проверяется другим экспертом.

3. URI-фильтрация не может охватить сколь нибудь существенную часть ресурсов Интернета.

4. В ряде случаев фильтрацию можно обойти использованием анонимизирующих прокси-серверов.

В соответствии с законом 436-ФЗ, категоризация интернет-ресурсов должна осуществляться путем их возрастной маркировки. По заключению экспертного сообщества, эта норма не может быть реализована технически [1][2]. Недавно создатели закона заявили, что он может не действовать в отношении интернет-СМИ [3]. Таким образом, премодерация интернет-ресурсов и ведение «белых»

и «черных» списков остается делом организаций и учреждений, предоставляющих детям доступ в

Интернет. Среди «белых» списков, рекомендованных для использования в образовательных учреждениях, необходимо отметить каталог ресурсов, составленный ФГАУ ГНИИ ИТТ «Информика» [4]. Также внимания заслуживает список, составленный Центром методической поддержки внедрения ПСПО Алтайского края [5]. Оба списка в настоящее время требуют верификации, так как содержат адреса сайтов, перешедших в категорию «18+». Если говорить о «черных» списках, то на федеральном уровне поддерживается так называемый

«Черный список Роскомнадзора» [6], который не имеет прямого отношения к возрастной категоризации

и недоступен для использования в индивидуальных и корпоративных системах контроля доступа к интернет-ресурсам.

2.Контентная фильтрация

Задача контентной фильтрации заключается в том, чтобы определить, относится ли тематика ресурса к некоторой категории, на основании анализа его содержимого непосредственно в момент, когда пользователь запросил ресурс. Наиболее эффективно эта задача решена для текстового контента, в частности, для HTML-документов. При анализе страницы используются отдельные методы семантического анализа. Подчеркнем, что задача состоит не в определении семантической структуры документа, а в обнаружении в нем признаков принадлежности к той или иной категории текстов. Один из алгоритмов отнесения текста T к категории K состоит в первоначальном составлении глоссария, т.е. перечня словосочетаний (маркеров), каждое из которых снабжается целым числом

Relarn 2013

(весом), причем вес определенным образом соответствует вероятности того, что текст, содержащий

данный маркер, принадлежит категории K. При чтении текста вычисляется рейтинг страницы как сумма весов найденных маркеров. Таким образом, каждый маркер (или каждое его вхождение) вносит свой вклад (положительный, а при некоторых модификациях алгоритма – и отрицательный) в итоговый рейтинг текста. Для того, чтобы текст был отнесен к данной категории, требуется, чтобы его рейтинг по данной категории превысил заданное число. При таком подходе текст может быть отнесен к нескольким категориям одновременно. Изложенный алгоритм используется в известном программном контент-фильтре DansGuardian [7]. Отметим также принципиальную возможность адаптации существующих алгоритмов фильтрации спама [8] к задачам контент-фильтрации текстовых Web-ресурсов. Вотношениидругихвидовконтента(мультимедиа,исполняемыебинарныефайлы,зашифрованные файлы) подобных алгоритмов еще не построено либо просто не существует. Тем не менее, несмотря на увеличение доли динамического контента, данный вид фильтрации продолжает оставаться чрезвычайно эффективным при блокировании доступа к определенным категориям ресурсов, таким, как порно-сайты, документы, содержащие обсценную лексику, социальные сети, даже если доступ осуществляется через анонимизирующие прокси-сервисы. Отметим и недостатки:

1. чувствительность к ошибкам или намеренным искажениям в тексте,

2. неполная релевантность,

3. прямая зависимость вероятности «ложного срабатывания» от величины текста,

4. сложность русского языка в сравнении с английским при составлении глоссариев

5. повышенные требования к аппаратным ресурсам.

Очень часто URI-фильтрацию ошибочно называют контентной. При этом, как правило, фильтрация по контенту реализуется в системах контроля доступа в лучшем случае как вспомогательная функция. Эта путаница не только приводит к ложным ожиданиям относительно ПО, которое представлено на рынке, но и препятствует развитию контент-фильтрации как самостоятельного направления. Еще одной важной проблемой является упрощенный подход к контентной дифференциации ресурсов без учета особенностей различных «запрещенных» категорий. При URI-фильтрации от эксперта-модератора требуется психолого-педагогическая и правовая подготовка, знание норм этики. Опытный практикующий педагог, как правило, обладает этими качествами. Совсем иные требования предъявляются к специалисту, занятому составлением глоссариев для контентной фильтрации. Он должен не отнести заданный ресурс к некоторой категории, а построить систему маркеров, при помощи которых будет выявлен наибольший процент ресурсов данной категории. Традиционно выделяются следующие, наиболее опасные с точки зрения здоровья и развития детей, категории Web-ресурсов: порнография, пропаганда и распространение наркотиков, экстремизм, пропаганда насилия и террора, а также ресурсы, содержащие обсценную лексику. Каждая категория ресурсов обладает рядом исключительных особенностей. Например, порнография, которую многие считают наименее поддающейся блокированию, на самом деле весьма эффективно обнаруживается контент-фильтрами. Это объясняется тем, что владельцы таких ресурсов не заботятся о том, чтобы обойти системы контроля. Их целевая аудитория – отнюдь не только (и не столько) дети, а их главная задача – быть первыми в списках выдачи поисковых машин. Поэтому тексты страниц обычно содержат нужные маркеры в достаточном количестве. Совсем иначе обстоит дело с другими перечисленными категориями. Например, нарко-ресурсы нацелены в основном именно на подростков, в текстах активно используется специфический жаргон, который стремительно изменяется в зависимости от распространенности тех или иных наркотических средств в нелегальном обороте. Ресурсы экстремистский направленности делятся на многочисленные подкатегории, у которых в языковом плане очень мало общего. Стилистика и сюжеты в каждой подкатегории обычно мимикрируют