Open knowledge exchange

Skip Navigation Links

Personal reference dashboard

Skip Navigation Links

Personal reference dashboard для ученого и научного коллектива


Содержание


Принцип работы системы

Personal reference dashboard - это программный комплекс, который состоит из одной серверной части и множества клиентский частей. Для удобства мы будем далее называть этот программный комплекс "система".

Наша система представляет ряд возможностей, которые позволяют повысить эффективность научной работы в интернете. Используя нашу систему, ученый делает процесс чтения научных статей в интернете более интерактивным. Он может получать дополнительную информацию, релевантную просматриваемой в данный момент статье, либо всей области его интересов, либо области его научных интересов за определенный период. Также наша система предоставляет пользователям ряд аналитических инструментов.

То, что наша система предоставляет пользователю, можно представить обобщенно в виде следующего перечня:

  • Результаты тривиального анализа данных
    • сохранение истории просмотров научных статей, выявление тенденций, характеристик, особых случаев
    • группировка результатов поисковых запросы к cистеме PubMed по ряду параметров (авторы, журналы, MESH-термины и т.д.)
  • Результаты нетривиального анализа данных
    • информация получанная на основе анализа журналов просмотров статей большим количеством пользователей
    • информация, основанная на экспертном знании различных групп ученых

Принцип работы системы можно описать в виде следующей последовательности действий:

  • Вы устанавливаете надстройку к Вашему браузеру и регистрируетесь в системе
  • По мере того, как Вы просматриваете web-страницы научных статей, надстройка фиксирует просмотры, и данные накапливаются в системе
  • Если в системе есть информация, связанная с просматриваемой статьей - надстройка информирует Вас об этом, Вы можете перейти к странице с дополнительной информацией
  • Накопленные данные можно просматривать, используя различные аналитические инструменты

Формирование журналов просмотров и наборов статей

Журналы просмотров

Клиентская часть нашей системы, надстройка к браузеру, содержит перечень сайтов, посещения которых фиксируются и анализируются. Каждый пользователь может исключить из этого перечня сайты по своему усмотрению.

Посещение любой страницы сайта, который входит в перечень, анализируется, и, если это страница научной публикации, фиксируется в системе с указанием времени и даты просмотра.

С течением времени данные накапливаются. Это делает возможным вести своего рода "журнал" прочитанных статей за определенный период. Таким образом, пользователь может освежить в памяти те статьи, которые он просматривал вчера или год назад, а также использовать эти журналы для более глубокого интеллектуального анализа.

Сохранение поисковых запросов

Наша система предоставляет возможность поиска статей в PubMed'е. Кроме собственно результатов поиска (списка статей с их резюме) пользователю предоставляется агрегированная информация о найденных статьях. Об этом читайте ниже.

Каждый поисковый запрос фиксируется в системе. Таким образом, у пользователя появляется возможность освежить в памяти историю поисковых запросов, а также использовать их результаты для более глубокого интеллектуального анализа.


Статическое описание наборов статей

Каждая научная статья характеризуется рядом показателей, например, автором или несколькими, годом публикации, журналом, в котором она опубликована. Если исследователь имеет дело с совокупностью статей, то ему может быть полезна информация, полученная путем агрегирования данных нескольких статей по различным характеристикам.

Ниже представлены различные способы агрегирования данных о наборе статей, доступные пользователям нашей системы. Приведенный ниже анализ применим ко всем совокупностям статей, которые фигурируют в нашей системе (это и история просмотров статей одного исследователя, и история просмотров статей группой исследователей, и результаты поискового зарпоса и т.д.)

Распределение по годам публикации

Совокупность статей может быть сгруппирована по годам публикации, с указанием количества публикаций в каждом году. Информация может быть представлена в виде гистограммы или таблицы. Сортировка может быть по возрастанию, по убыванию и по хронологии.

Распределение по авторам

Совокупность статей может быть сгруппирована по авторам публикаций. Информация может быть представлена в виде гистограммы или таблицы.

Распределение по научным журналам

Совокупность статей может быть сгруппирована по журналам, в которых они были опубликованы. Информация может быть представлена в виде гистограммы или таблицы. В случае, если нашей системе станут доступны данные, характиризующие научные журналы, возможна группировка данных также и по этим признакам.

Распределение по MESH-терминам

Совокупность статей может быть сгруппирована по MESH-терминам. Информация может быть представлена в виде гистограммы или таблицы. Также информацию о наборе статей можно представить в виде графа. Узлами этого графа являются MESH-термины, а ребрами - публикации, в которых MESH-термины, соединенные ребром, встречаются одновременно. Различный вид (толщина) ребер отражает количество публикаций, в которых MESH-термины встречались одновременно.

География публикаций

Совокупность статей может быть сгруппирована по городам и странам, в которых они были опубликованы. Информация может быть представлена в виде гистограммы, таблицы, карты мира с указанием количества публикаций в различных регионах.

Граф соавторства

Совокупность статей характеризуется набором авторов этих статей. В случае, если среди публикаций были такие, авторами которых были одновременно несколько человек, то информацию о наборе статей можно представить в виде графа соавторства. Узлами этого графа являются авторы, а ребрами - совместные публикации, различный вид (толщина) ребер отражает количество совместных публикаций в совокупности.


Сравнение двух наборов статей

Выявление общих и специфичных характеристик

Сравнивая две совокупности статей, наша система позволяет выявить меру их сходства и различия. Такую оценку можно провести по ряду характеристик (авторы, MESH-термины, журналы и т.д.).

Информация может быть представлена в виде количественной оценки (% сходства/различия) каждой характеристики, а также в виде перечня общих и специфичных значений каждой характеристики. Например, у двух наборов статей может быть два общих автора, и по одному автору, который встречается только в одном из наборов статей.

Сравнение наборов статей различных периодов

Сравнивая совокупности статей, полученных по одинаковой методике, но за разные периоды (например, история просмотров статей группой ученых за первый, второй и третий кварталы 2009 года) наша система позволяет увидеть динамику определенных характеристик. Информация может быть представлена в виде графиков, гистограмм и таблиц, как в абсолютных чистах, так и в показателях прироста/убыли.


Релевантная информация из внешних источников

Посещая отдельные статьи или анализируя наборы статей, пользователи нашей системы могут подключать к своим страницам "модули". Каждый модуль представляет собой интерфейс, предоставляющий пользователю информацию об определенной области знаний.

Например, если подключить модуль "Лекарственные растения", то при просмотре статей, которые имеют отношения к этой предметной области, пользователь будет получать уведомления от надстройки о наличии дополнительной информации. Также дополнительная информация по этой предметной области будет доступна при анализе наборов статей или при отображении результатов поиска в PubMed'е через интерфейс нашего сайта.


Несколько слайдов о технической реализации