next up previous


Система поиска астрофизической информации в базе данных CATS


Черненков В.Н., Верходанов О.В., Трушкин С.А.
Специальная астрофизическая обсерватория, Нижний Архыз

Коллекция ~ 150 каталогов астрономических объектов в БД CATS (Verkhodanov et al., 1997) имеет объем около 500 Мбайт табличных данных. Подробные описания к ним составляют около 4 Мбайт. Эффективная работа с таким объемом информации возможна только при организации автоматизированного доступа и развитой поисковой системы. Сейчас выборка из базы данных, например, поиск нужной информации по шаблону, включающему параметры источника, каталогов, ключевые слова, фамилии авторов и т.п., осуществляется несколькими способами, согласно видам доступа к базе. Для увеличения надежности и ускорения доступа база данных CATS размещена в виде "зеркальных" копий на двух серверах САО РАН, функционирующих в локальных субсетях РАТАН и ННП САО. В обоих случаях реализованы следующие виды работ:

  1. доступ к поисковой системе через telnet://cats@cats.sao.ru/, или
    telnet://cats@www.ratan.sao.ru/;
  2. доступ к файлам данных и описаниям через ftp://cats.sao.ru/, или
    ftp://www.ratan.sao.ru/;
  3. гипертекстовый доступ: http://cats.sao.ru/, или
    http://www.ratan.sao.ru/~cats/;
  4. доступ к поисковой системе через электронную почту по адресу: cats@sao.ru;
  5. доступ к CATS и другим общедоступным файлам через электронную почту (подробные правила работы с файловым сервером можно получить, послав письмо с единственным словом help по адресу: observ@ratan.sao.ru);
  6. работа на сервере РАТАН-600 или с любого компьютера (с ОС Linux) в локальной сети САО, к которому подмонтирована файловая система сервера с расположенными на ней утилитами и базой данных CATS.
Первый и последний виды работы построены с помощью системы последовательных меню. При гипертекстовом доступе ввод параметров для выборки источников в заданной области или для поиска координатных совпадений оформлен в виде форм. При этом удобнее использовать графические браузеры для X Window и Windows: Mosaic, Netscape, Internet Explorer, но можно пользоваться и текстовыми браузерами типа Lynx. Собственно поисковые программы, реализующие CGI, написаны для Unix на Shell и C. Поскольку обработка большого списка отождествляемых источников может занимать продолжительное время, для пользователя будет более удобна обработка его запросов через электронную почту (E-mail). Ниже приводится примеры задания команд поисковой системы при доступе к CATS через электронную почту (подробное описание можно получить, послав пустое письмо по адресу cats@sao.ru):
  1. Пример письма-запроса для получения выборки всех радиоисточников с плотностью потока свыше 0.5 Ян в заданной граничными координатами области неба и выводом результата в виде FITS файла размером не более 50 Кбайт:
    mail -s "" cats@sao.ru
    cats select
    ra min=12:30 max=12:40:15. dec > 0 < 5' 46"
    catalogs r epoch=1950 flux > 0.5
    out fits, size=50
    cats end
  2. Пример письма-запроса для получения результатов поиска координатных совпадений трех источников с заданными ошибками (x по RA; y по DEC):
    mail -s "" cats@sao.ru
    cats match catalogs a
    window box x=60" y=40'
    sources:
    s1 02:02:00 +31:23:16 1950
    s2 02:23:10 00:03:00 1950
    s3 21:26:33.9 -18:34:33.0 1950
    cats end
Существенным развитием поисковых средств стало подключение системы быстрого индексного поиска GLobal IMPlicit SEarch и ее гипертекстового расширения WebGlimpse (Manber et al., 1997) Средства этой свободно распространяемой системы способны в течение секунд производить поиск информации (в нашем случае: имена источников и каталогов, фамилии авторов и т.п. в различных комбинациях) среди множества файлов по заданному шаблону и формировать список ссылок в гипертекстовом виде, удобном для дальнейшей работы. WebGlimpse позволяет легко расширить систему поиска не только внутри локальной файловой системы CATS, но и среди документации, размещенной на аналогичных серверах в Internet. Доступ к сервису WebGlimpse находится на домашней странице CATS.

Авторы благодарны РФФИ за поддержку проекта CATS, грант No 96-07-89075.

Литература
Manber U., M. Smith and B. Gopal: 1997. WebGlimpse -- Combining Browsing and Searching; To appear in the ``USENIX Annual Technical Conference", Jan 6-10, 1997, Anaheim, California. http://glimpse.cs.arizona.edu/
Verkhodanov O.V., Trushkin S.A., Andernach H., Chernenkov V.N.: 1997. In Proc. of the ``Astronomical Data Analysis Software and Systems -- VI", ed. R.Simon; NRAO, Charlottesville.


next up previous




Vladimir Chernenkov
Sun Jun 8 21:17:44 MSD 1997