ГОСТ 7.52—85                                              SU

Коммуникативный формат для обмена библиографическими данными на магнитной ленте. Поисковый образ документа. — Утв. 1985. — (Система стандартов по информации, библиотечному и издательскому делу).

Устанавливает правила представления поисковых образов документов (ПОД) на магнитной ленте с записями в коммуникативном формате по ГОСТ 7.19—85. Стандарт распространяется на ПОД, выраженные средствами информационно-поисковых языков с лексическими единицами на естественном языке (средствами вербальных ИПЯ). Правила построения ПОД на ИПЯ классификационного типа установлены в ГОСТ 7.19—85. В стандарте имеется справочное терминологическое приложение.

ГОСУДАРСТВЕННЫЙ СТАНДАРТ

СОЮЗА ССР


Система стандартов по информации, библиотечному и издательскому делу

КОММУНИКАТИВНЫЙ ФОРМАТ ДЛЯ ОБМЕНА БИБЛИОГРАФИЧЕСКИМИ ДАННЫМИ НА МАГНИТНОЙ ЛЕНТЕ

Поисковый образ документа

ГОСТ 7.52—85

Издание официальное

ГОСУДАРСТВЕННЫЙ КОМИТЕТ СССР ПО СТАНДАРТАМ

Москва

1

УДК 655.255:006.354
Группа Т62
ГОСУДАРСТВЕННЫЙ СТАНДАРТ СОЮЗА ССР

Система стандартов по информации,
библиотечному и издательскому делу
КОММУНИКАТИВНЫЙ ФОРМАТ ДЛЯ ОБМЕНА
БИБЛИОГРАФИЧЕСКИМИ ДАННЫМИ НА
МАГНИТНОЙ ЛЕНТЕ

Поисковый образ документа


ГОСТ 7.52—85

System of standards on information, librarianship
and publishing, Communication format for
bibliographic data exchange on magnetic tape.
Search pattern of a document

ОКСТУ 0007

Постановлением Государственного комитета СССР по стандартам от 28 марта
1985 г. № 931 срок введения установлен
с 01.07.86

Настоящий стандарт устанавливает правила представления поисковых образов документов (ПОД) на магнитной ленте с записями в коммуникативном формате по ГОСТ 7.19-85.

Стандарт распространяется на ПОД, выраженные средствами информационно-поисковых языков (ИПЯ) с лексическими единицами на естественном языке (средствами вербальных ИПЯ). Правила построения ПОД на ИПЯ классификационного типа установлены в ГОСТ 7.19-85.

В настоящем стандарте используются термины по ГОСТ 7.14-84, ГОСТ 7.19-85, ГОСТ 7.25-80, ГОСТ 7.27-80 и ГОСТ 7.59-90, а также приведенные в справочном приложении.

1. ОБЩИЕ ПОЛОЖЕНИЯ

1.1. Каждая библиографическая запись в коммуникативном формате должна содержать ПОД, состоящий из лексических единиц одного из следующих типов: дескрипторы, ключевые слова, предметные рубрики. Допускается в пределах одной записи применять ПОД, включающие лексические единицы разных типов.

1.2. Лексические единицы (ЛЕ) в ПОД и их синтаксические конструкции снабжают специальными пометами, характеризующими их семантику и структуру.

1.3. Дескрипторы и предметные рубрики сопровождаются информацией о словаре, испольэованном при индексировании.

2

2. СТРУКТУРА ПОИСКОВОГО ОБРАЗА ДОКУМЕНТА

2.1. ПОД из ключевых слов или дескрипторов имеет структуру:

линейную (простой перечень ЛЕ с соблюдением или без соблюдения алфавитного порядка),

иерархическую (с синтаксическими конструкциями двух или более уровней иерархии).

В ПОД с иерархической структурой отдельные ЛЕ образуют исходный нижний уровень иерархии. Объединение ЛЕ (условно «предложение») образует второй уровень. Объединение предложений (условно «абзац») образует третий уровень. Количество уровней иерархии не ограничено.

Структурированный ПОД состоит из синтаксических конструкций (объединений ЛЕ) одного или разных уровней иерархии, а также наряду с синтаксическими конструкциями может включать отдельные ЛЕ.

Примеры:

1. ПОД состоит из простого перечня ЛЕ: А1 А2 А3 А4

2. ПОД состоит из предложений: (А1А2) (А3А4) (А5А6)

3. ПОД состоит из абзацев: ((А1А2) (A3A4)) ((А5А6) (А7А8))

4. ПОД состоит из предложения и отдельных ЛЕ: (А1А2) А3А4А5

5. ПОД состоит из абзаца и предложения; ((А1А2) (А3А4)) (А5А6А7)

6. ПОД состоит из абзаца, предложения и отдельной ЛЕ: ((А1А2) (A3A4)) (A5A6) А7

2.2. ПОД на языке предметных рубрик всегда имеет иерархическую структуру. Лексическими единицами ПОД на языке предметных рубрик являются предметные заголовки и уточняющие их предметные подзаголовки различного уровня иерархии, Форма их представления и взаимное подчинение заданы словарем (списком) предметных рубрик.

Пример: ПОД состоит из двух предметных рубрик (Р). Первая рубрики включает заголовок (З) и подзаголовок (ПЗ). Вторая рубрика включает заголовок, подзаголовок и подподзаголовок (ПП3)

Р1: З1—ПЗ1

Р2 : З2—ПЗ2— —ППЗ2

2.3. Данные, относящиеся к одному дескриптору, записывают в одном поле с меткой 630, которое может содержать подполя согласно п. 3.2. Каждое поле с меткой 630 должно содержать один дескриптор и не более одного вхождения каждого из прочих подполей, которые расположены в порядке, указанном в п. 3.2.

2.4. Данные, относящиеся к одному ключевому слову, записывают в одном поле с меткой 640, которое может содержать

3 подполя согласно п. 3.3. Каждое поле с меткой 640 должно содержать одно ключевое слово и не более одного вхождения каждого из прочих подполей, которые расположены в порядке, указанном в п. 3.3.

2.5. Каждый предметный заголовок, подзаголовок или подподзаголовок предметной рубрики записывают в отдельном поле с меткой 670 согласно п. 3.4. Связь отдельных элементов сложной рубрики выражается иерархическим кодом. Каждое поле с с меткой 670 должно содержать одну предметную рубрику и не более одного вхождения каждого из прочих подполей, которые располагают в порядке, указанном в п. 3.4.

2.6. Данные о связи ЛЕ, а также информационный вес синтаксических конструкций записывают в полях данных с меткой 420 согласно п. 3.5. Каждой синтаксической конструкции (каждой вершине графа синтаксических связей) соответствует отдельное поле, содержащее два подполя с идентификаторами Е и N, которые расположены в порядке, указанном в п. 3.5.

2.7. В пределах ПОД рекомендуется при каждой ЛЕ приводить одинаковый набор подполей.

3. СПЕЦИФИКАЦИЯ ЭЛЕМЕНТОВ ДАННЫХ, ФОРМИРУЮЩИХ ПОД

3.1. Для идентификации элементов данных ПОД в соответствии с ГОСТ 7.19-85 используют метку, порядковый номер элемента данных в подзаписи (второй и третий символ части справочника, определяемой при применении), индикатор и идентификатор.

Индикатор для элементов данных ПОД принимает значение (пробел).

В настоящем разделе элементы данных описываются в следующем порядке:

обозначение элемента данных: метка, индикатор к идентификатор (его второй символ),

наименование элемента данных,

признак обязательности (О — обязательный, Н — необязательный),

пояснение содержания,

способ записи,

пример записи.

Примеры записи даны в табличной форме, где указано содержание компонентов справочника (метка и порядковый номер поля данных) и полей данных (индикатор, идентификатор и содержание элемента данных) .

3.2. Спецификация элементов данных поля с меткой 630

Перечень подполей с меткой 630 и порядок их следования в записи указан в табл. 1.

4

Таблица 1


Идентификатор Наименование элемента данных

C Дескриптор тезауруса
E Код дескриптора
N Иерархический код дескриптора
S Дополнительная информация о дескрипторе
A Наименование тезауруса
M Регистрационный номер тезауруса в АСВИ

630_C ДЕСКРИПТОР ТЕЗАУРУСА (О — если ПОД получен контролируемым индексированием по тезаурусу)

Лексическая единица (дескриптор), взятая из тезауруса (дескрипторного словаря).

Способ записи.На естественном языке в соответствии со словарем-источником. Каждый дескриптор записывается в поле, включающем также элементы данных 630_A и/или 630_M.

Пример. ПОД состоит из дескрипторов, взятых из тезауруса с регистрационным номером 032.78: микро-ЭВМ, интерфейсы, стандарты, физика высоких энергий.
Компоненты справочника Поля данных
630 01 _ С микро-ЭВМ
М 032.78
630 02 _ С интерфейсы
М 032.78
630 03 _ С стандарты
М 032.78
630 04 _ С физика высоких энергий
М 032 78

630_E КОД ДЕСКРИПТОРА (Н)

Код дескриптора в соответствии с используемым словарем ИПЯ. В коммуникативном формате может употребляться только с элементом данных 630_C «Дескриптор тезауруса».

Способ записи. В виде, представленном в словаре. Подполе входит в состав поля, в котором записан дескриптор (элемент данных 630_C).

630_N ИЕРАРХИЧЕСКИЙ КОД ДЕСКРИПТОРА (О — при записи структурированного ПОД)

Код, обозначающий место дескриптора в иерархии ПОД.

Способ записи. В подполе N поля 630 соответствующего дескриптора в структуре К N1 N2 ... Ni ... Nk, где

К — десятичная цифра, обозначающая число уровней иерархии в синтаксической конструкции,

i=1, 2, 3,..., К — номер уровня иерархии, начиная с верхнего.

Ni — двузначные коды (из множества 01, 02,..., 99, 0A,..., ZZ), обозначающие порядковые номера синтаксических конструкций

5 i-го уровня иерархии, подчиненных одной вышестоящей конструкции (например, порядковый номер ЛЕ в предложении или предложения в абзаце).

Пример. Двухуровневый ПОД состоит из пяти дескрипторов, образующих два предложения:

первое предложение — программное обеспечение, компиляторы программ

второе предложение — грамматический разбор, К-грамматики, применение
Компоненты справочника Поля данных
630 01 _ С программное обеспечение
N 20101
М 032.78
630 02 _ С компиляторы программ
N 20102
М 032.78
630 03 _ С грамматический разбор
N 20201
М 032.78
630 04 _ С К-грамматики
N 20202
М 032.78
630 05 _ С применение
N 20203
М 032.78

630_S ДОПОЛНИТЕЛЬНАЯ ИНФОРМАЦИЯ О ДЕСКРИПТОРЕ (Н)

Характеристики дескриптора, представленные в табл. 2.

Способ записи. В виде 6-символьного кода в соответствии с табл. 2 в поле соответствующего дескриптора. При отсутствии информации в позициях кода проставляется _ (пробел).

Пример. Дескриптор «приусадебное хозяйство» является наименованием журнала и найден в тезаурусе при ручном индексировании данного журнала.
Компоненты справочника Поле данных
630 01 _ С приусадебное хозяйство
S IS__113
М 530.82

Таблица 2


Наименование
характеристики
Позиция
кода
Код характеристики Значение характеристики

Семантическая
характеристика
1 I Имя собственное (идентификатор)
Т Термин
Р Наименование параметра
V Значение параметра
М Число
Е Единица величины

6

Продолжение табл. 2

Наименование
характеристики
Позиция
кода
Код характеристики Значение характеристики

Морфологическая
характеристика
2 F Фрагмент слова
А Простое слово
C Сложное слово
S Словосочетание
B Аббревиатура
Роль в ПОД 3 0 Объект исследования, изобретения
1 Характеристики, свойства, параметры объекта
2 Методы и средства исследования, технологическая оснастка
3 Составные части, узлы, детали объекта
4 Область применения объекта
5 Назначение объекта
6 Цель исследования, разработки
7 Результаты исследования, разработки
Роль ЛЕ в
конструкции
4 K Опорная ЛЕ конструкции (используется как входное слово предметных указателей)
H Второстепенная ЛЕ конструкции (определитель)
F При данной ЛЕ имеется фактографическая информация
Информационный
вес ЛЕ в документе
5 3 Главный элемент (понятие, термин)
2 Определитель главного элемента
1 Второстепенный элемент
0 Отрицательный вес (в документе отсутствуют соответствующие данные)
Способ
получения ЛЕ
6 1 ЛЕ назначена индексатором
2 ЛЕ получена при автоматическом индексировании
3 ЛЕ приписана при избыточном индексировании

630_A НАИМЕНОВАНИЕ ТЕЗАУРУСА (О — при записи ПОД на основе словаря, не зарегистрированного в АСВИЯ)

Наименование словаря-источника на естественном языке.

Способ записи. В соответствии с титульным листом словаря.

630_M РЕГИСТРАЦИОННЫЙ НОМЕР ТЕЗАУРУСА В АСВИЯ (О — при записи ПОД на основе словаря, зарегистрированного в АСВИЯ).

Регистрационный номер словаря-источника, присвоенный Центральной службой АСВИЯ.

7

Способ записи. Элемент данных записывается в структуре ННН.ГГ

(ННН — порядковый номер регистрации, ГГ — две последних цифры года регистрации).

Пример. Индексирование проводилось по тезаурусу, который имеет регистрационный номер 534.82
Компоненты справочника Содержание подполя
630 01 М 534.82

3.3. Спецификация элементов данных поля с меткой 640

Перечень подполей поля с меткой 640 и порядок их следования в записи указаны в табл. 3.

Таблица 3


Идентификатор Наименование элемента данных

А Ключевое слово (КС)
N Иерархический код КС
S Дополнительная информация о КС
С Язык КС

640_A КЛЮЧЕВОЕ СЛОВО (О — если ПОД получен свободным индексированием)

Слово или словосочетание естественного языка, представляющее собой отдельную лексическую единицу ПОД.

Способ записи. На естественном языке в нормализованном виде по ГОСТ 7.25-80 — 80 в соответствии с индексируемым документом: в том же алфавите с сохранением пробелов, знаков:препинания, цифр и специальных знаков. Примеры приведены в описании элемента данных 630_C.

640_N ИЕРАРХИЧЕСКИЙ КОД КЛЮЧЕВОГО СЛОВА (О — при записи структурированного ПОД)

Код, обозначающий место ключевого слова в иерархии ПОД.

Способ записи и пример аналогичны приведенным в описании элемента данных 630_N.

640_S ДОПОЛНИТЕЛЬНАЯ ИНФОРМАЦИЯ О КЛЮЧЕВОМ СЛОВЕ (Н)

Характеристики ключевого слова, представленные в табл. 2.

Способ записи аналогичен приведенному в описании элемента данных 630_S.

8

Пример. ПОД содержит одно предложение и два отдельных ключевых слова:

конференции (информационныйвес=2)

предложение

Париж (имя собственное, информационный вес=1)

обработка данных (информационный вес=1)

программное обеспечение (информационный вес=1)

Примечание. ПОД представляется в виде однородных синтаксических конструкций (предложений). Первое предложение содержит два ключевых слова, второе и третье предложения содержат по одному ключевому слову.

Компоненты справочника Поля данных

640 01 _ А конференции
N 20101
S ____2_
640 02 _ А Париж
N 20102
S ___1_
б49 63 _ А обработка данных
N 20201
S ____1_
640 04 _ А программное обеспечение
N 20301
S ____1_

640_C ЯЗЫК КЛЮЧЕВОГО СЛОВА (О — если язык ключевого слова отличен от языка библиографической записи)

Язык, на котором записаны ключевые слова ПОД.

Способ записи и пример приведены в описании элемента данных 101_A «язык основного текста документа» в ГОСТ 7.19-85 — 85. Элемент данных записывают в поле соответствующего ключевого слова.

3.4. Спецификация элементов данных поля с меткой 670

Перечень подполей поля с меткой 670 и порядок их следования в записи указаны в табл. 4.

Таблица 4


Идентификатор Наименование элемента данных

В Предметная рубрика
N Иерархический код предметных рубрик
С Наименование словаря предметных рубрик
М Регистрационный номер словаря предметных рубрик

670_B ПРЕДМЕТНАЯ РУБРИКА (О — при индексировании по словарю предметных рубрик)

9

Заголовок или подзаголовок предметной рубрики.

Примечание. Предметные рубрики могут состоять из заголовка и уточняющих его подзаголовков 1, 2, 3-го и более глубоких уровней иерархии. Каждый уровень иерархии предметной рубрики содержит не более одной ЛЕ. Формат не ограничивает глубину иерархии предметных рубрик.

Способ записи. В соответствии со словарем-источником. Каждая ЛЕ предметных рубрик записывается в от.дельном поле.

Пример. ПОД включает одну простую предметную рубрику «Аккумуляторы», являющуюся заголовком и не имеющую подзаголовков:
Компоненты справочника Поле данных
670 01 _ В Аккумуляторы

670_N ИЕРАРХИЧЕСКИЙ КОД ПРЕДМЕТНОЙ РУБРИКИ (О — при индексировании по словарю предметных рубрик)

Код, обозначающий место лексической единицы в иерархии предметной рубрики.

Способ записи. В виде трехсимвольного кода в подполе поля соответствующей ЛЕ в структуре РУУ

(Р — односимвольный порядковый номер рубрики в ПОД,

УУ — двухсимвольный номер уровня иерархии ЛЕ в предметной рубрике).

При этом нумерация уровней иерархии ведется от уровня заголовка предметной рубрики, которому присваивается номер 00.

Пример. ПОД включает две предметные рубрики, имеющие подзаголовки:

Торф — Влажность — Измерение

Торф — Брикетирование
Компоненты справочника Поле данных
670 01 _ В Торф
N 100
670 02 _ В Влажность
N 101
670 03 _ В Измерение
N 102
670 04 _ В Торф
N 200
670 05 _ В Брикетирование
N 201

670_C НАИМЕНОВАНИЕ СЛОВАРЯ ПРЕДМЕТНЫХ РУБРИК (О — при индексировании по словарю предметных рубрик).

Описание аналогично элементу данных 630_C.

670_M РЕГИСТРАЦИОННЫЙ НОМЕР СЛОВАРЯ ПРЕДМЕТНЫХ РУБРИК (О — при наличии регистрационного номера АСВИЯ),

Описание аналогично элементу данных 630_M.

10

3.5. Спецификация элементов данных поля с меткой 420

Перечень подполей поля с меткой, применяемых для представления ПОД, и порядок их следования в записи указаны в табл. 5.

Таблица 5


Идентификатор Наименование элемента данных

Е Характер отношения между элементами данных
N Характер отношения между ЛЕ в ПОД

420_E ХАРАКТЕР ОТНОШЕНИЯ МЕЖДУ ЭЛЕМЕНТАМИ ДАННЫХ (Н)

В соответствии с ГОСТ 7.19-85 содержит символ 4 для обозначения связи ЛЕ.

420_N ХАРАКТЕР ОТНОШЕНИЯ МЕЖДУ ЛЕ В ПОД (Н)

Дополнительная информация о характере отношения между ключевыми словами и/или дескрипторами ПОД, а также об информационном весе синтаксической конструкции.

Способ записи. В виде трехсимвольного кода, позиции которого заполняют по табл. 6, сопровождаемого адресами характеризуемых элементов данных, записываемыми вслед за трехсимвольным кодом и отделяемыми от него и друг от друга пробелом. Адресом ЛЕ является метка 630 или 640 с порядковым номером поля данных. Адресом синтаксической конструкции является метка 420 с порядковым номером поля данных. При отсутствии соответствующих данных в позициях трехсимвольного кода проставляется _ (пробел).

Пример 1. Характеризуются отношения между третьим, четвертым и пятым ключевым словом ПОД. Отношение является связью компонентов в параметрической конструкции.
Компоненты справочника Поле данных
420 01 _ E4 N Е___ 640 03 _ 640 04 _ 640 05

Пример 2. Вторая и третья ЛЕ дескрипторного ПОД являются синонимами.
Компоненты справочника Поле данных
420 02 _ E4 N _C__ 630 02 _ 630 03

Пример 3. Синтаксическая конструкция типа абзац образована первым и вторым;предложением, а также включает пятый дескриптор. Конструкция характеризуется как главный элемент ПОД.
Компоненты справочника Поле данных
420 03 _ Е4 N __3_ 420 01 _ 420 02 _ 630 05

11

Таблица 6

Характер отношения между ЛЕ


Наименование
характеристики
Позиция
кода
Код
характеристики
Значение характеристики

Синтаксическая
связь
1 С Содержательная неинтерпретированная связь
D Порядковая связь (указывать не обязательно)
F Связь фрагментов лексической единицы
Е Связь компонентов параметрической конструкции
А Связь типа «объект-характеристика»
Парадигматические
отношения
2 С Синонимия
B Связь опорной ЛЕ с вышестоящей по иерархии
Н Связь опорной ЛЕ с нижестоящей по иерархии словаря индексирования
А Ассоциация
Информационный
вес синтаксической
конструкции
3 3 Главный элемент (ключевая конструкция)
2 Определитель главного элемента
1 Второстепенный элемент (неключевая конструкция)
0 Отрицательный вес

4. ПРЕДСТАВЛЕНИЕ ДАННЫХ В ЗАПИСИ

4.1. При записи ПОД используют наборы символов и методы кодирования по ГОСТ 7.19-85. Не допускается заменять коды знаков одного алфавита кодами сходных по начертанию знаков другого алфавита.

4.2. В тех случаях, когда ПОД содержит дескрипторы или предметные рубрики, взятые из одного и того же словаря, либо ключевые слова, относящиеся к одному и тому же языку, достаточно указывать элементы данных 630_A, 630_M, 670_M и 640_C только при первой лексической единице данного типа в записи.

Пример. ПОД, приведенный в примере к описанию элемента данных 630_C, допускается представлять в следующем виде.
Компоненты справочника Поля данных
630 01 _ С микро-ЭВМ
М 032.78
630 02 _ С интерфейсы
630 03 _ С стандарты
630 04 _ С физика высоких энергий

12

4.3. В качестве идентификаторов и кодов характеристики лексических единиц, установленных настоящим стандартом, применяют цифры и прописные буквы латинского алфавита.

ПРИЛОЖЕНИЕ
Справочное

ПОЯСНЕНИЯ К ТЕРМИНАМ, ПРИМЕНЯЕМЫМ В СТАНДАРТЕ

Вербальный ИПЯ — информационно-поисковый язык, для представления лексических единиц которого используются слова или выражения естественного языка.

Иерархический код — элемент данных, выраженный кодом, определяющим положение лексической единицы или синтаксической конструкции в иерархической структуре ПОД.

Структурированный ПОД — поисковый образ документа, записанный при помощи ИПЯ, использующего объединение лексических единиц в синтаксические конструкции.

Синтаксическая конструкция ПОД — объединение двух или более лексических единиц ПОД, которые при поиске информации должны рассматриваться совместно или в связи друг с другом. Синтаксические конструкции могут включать в себя синтаксические конструкции нижнего уровня и входить в конструкции верхнего уровня.

Отдельные ЛЕ тоже могут. быть рассмотрены как вырожденные синтаксические конструкции.

АСНТИ — автоматизированная система научно-технической информации.

ГАСНТИ — Государственная автоматизированная система научно-технической информации.

АСВИЯ — Автоматизированная система ведения информационных языков.

РАЗРАБОТАН

Государственным комитетом СССР по науке и технике
Академией наук СССР
Государственным комитетом СССР по стандартам
Министерством электротехнической промышленности
Министерством авиационной промышленности
Государственным комитетом СССР по делам изобретений и открытий

ИСПОЛНИТЕЛИ
Г. Г. Белоногов, Н. Д. Кравченко, Н. П. Очнева, С. Я. Калачкина,
В. И. Федосимов, В. Н. Белоозеров, О. А. Фуралев, Л. В. Шемберко,
С. А. Горбань, Д. Г. Лахути, Н. В. Поцелуева, Е. Н. Казаков, А. Б. Антопольский,
В. А. Киптенко, Т. В. Стрельцова, Н. И. Антонова, Ю. В. Сипапин, К. В. Благова

ВНЕСЕН Государственным комитетом СССР по науке и технике

Член Комитета Н. Б. Арутюнов

УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Постановлением
Государственного комитета СССР по стандартам от 28 марта 1985 г., № 931

Hosted by uCoz