<?xml version="1.0" encoding="UTF-8"?>
<item xmlns="http://omeka.org/schemas/omeka-xml/v5" itemId="4678" public="1" featured="0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://omeka.org/schemas/omeka-xml/v5 http://omeka.org/schemas/omeka-xml/v5/omeka-xml-5-0.xsd" uri="http://repositorio.febab.libertar.org/items/show/4678?output=omeka-xml" accessDate="2026-05-01T18:35:04-07:00">
  <fileContainer>
    <file fileId="3747">
      <src>http://repositorio.febab.libertar.org/files/original/45/4678/SNBU1996_028.pdf</src>
      <authentication>d7773d7466ca977c419b1fee3286825a</authentication>
      <elementSetContainer>
        <elementSet elementSetId="4">
          <name>PDF Text</name>
          <description/>
          <elementContainer>
            <element elementId="92">
              <name>Text</name>
              <description/>
              <elementTextContainer>
                <elementText elementTextId="52021">
                  <text>5.15

METODOLOGIA DE COLETA DE DOCUMENTOS PARA A PRODUÇÃO DE
BASES DE DADOS BIBLIOGRÁFICOS
Maria Betânia Monte Alto Lambert*
Selma Chi Barreiro*

RESUMO

É feita uma descrição detalhada das etapas que compõem o processo de coleta de
documentos para a formação de bases de dados bibliográficos. Chama-se atenção,
dentro da metodologia, para dois fatos: o desdobramento das fontes e a repetição,
sendo desdobramento a identificação de várias outras fontes a partir de um único
documento e repetição a possibilidade de identificação de fontes já selecionadas.
Os arquivos necessários para o controle adequado das informações coletadas, bem
como o conteúdo de cada um deles são apresentados.

1 INTRODUÇÃO
O trabalho de coleta de documentos para a produção de bases de dados
bibliográficos é pouco conhecido no Brasil. São poucas as organizações brasileiras
que têm essa experiência e se pesquisarmos a literatura brasileira publicada muito
pouco encontraremos sobre o assunto.
O Centro de Informações Nucleares da Comissão Nacional de Energia
Nuclear (CIN/CNEN) tem uma longa experiência na coleta de documentos para a

___________________

* Bibliotecárias do Centro de Informações Nucleares

�5.15

produção da base de dados INIS na área de Energia Nuclear. Recentemente, o CIN
passou também a fazer a coleta de documentos para alimentar a base de dados
ENERGY, que inclui todas as fontes de energia.
É objetivo deste nosso trabalho registrar essa experiência de forma que
outros profissionais, envolvidos nesta mesma tarefa,

possam ter seu trabalho

facilitado.

2 ÂMBITO DO TRABALHO

No contexto deste nosso trabalho, trataremos da coleta de documentos para
a organização de bases de dados bibliográficos, apesar desta metodologia servir
também para a coleta de documentos para outros tipos de bases de dados.
Outro aspecto a ser ressaltado é a coleta de documentos para bases de
dados que tenham como objetivo cobrir o

mais exaustivamente possível as

informações geradas em um determinado assunto. É o trabalho que se chama
convencionalmente

de ‘organização de uma bibliografia exaustiva sobre um

determinado assunto’.
Este caso é bem diferente da produção de bases de dados que tem como
objetivo a automatização do acervo de uma biblioteca. Neste caso, o acervo está
todo reunido e não há o problema de coleta; ao contrário, normalmente é feita uma
seleção do que vai ser incluído ou não na base de dados.
Já a coleta de documentos para a organização de bases de dados num
determinado assunto exige muito esforço, muita disciplina e muita persistência. Isto
porque os documentos de interesse estão dispersos em diversas bibliotecas, em

�5.15

diferentes organizações, são publicados em diferentes veículos de informação, sob
diferentes formas e é preciso identificar todas essas fontes, todos esses veículos
para atingir plenamente o objetivo.
Quando mencionamos ‘fontes de informação’ no nosso trabalho, damos um
sentido bem amplo para a expressão: podem ser pessoas, instituições, publicações
em papel ou em meio magnético que nos levem a um documento de interesse.

3 POLÍTICA DE FORMAÇÃO

DA

BASE

DE

DADOS E

A DEFINIÇÃO

DOS PARÂMETROS DA COLETA

Antes do trabalho de coleta propriamente dito, há uma fase anterior, a da
definição dos parâmetros a serem aplicados na coleta de documentos. Estes
parâmetros estão diretamente ligados à política de formação da base de dados: se a
política adotada para a formação da base de dados é muito abrangente, maior será
o esforço requerido na coleta dos documentos. É importante, então, que se avalie
cuidadosamente os impactos dos parâmetros estabelecidos no trabalho da coleta,
para não chegar à conclusão, no meio do trabalho, de que eles não são realistas.
Esses parâmetros são de extrema importância, pois eles servirão para a
identificação da base de dados no mercado de informações. Assim sendo, os
profissionais envolvidos na produção da base de dados devem conhecê-los muito
bem, para poderem aplicá-los corretamente no trabalho rotineiro.

�5.15

4 PARÂMETROS UTILIZADOS PARA A COLETA DE DOCUMENTOS

Os parâmetros utilizados para a coleta dos documentos são os seguintes:
definição do escopo, tipo de literatura a ser incluída, limite geográfico e período de
tempo a ser coberto.

4.1 DEFINIÇÃO DO ESCOPO

O assunto deve ser de interesse da instituição que vai organizar a base de
dados. Existem casos, no entanto, em que a instituição tem interesses diversos, ou
o assunto é tão amplo que necessitaria ser subdividido em subtemas. Nestes casos,
é importante que a administração da instituição participe, fornecendo as prioridades.
Uma solução para este problema é iniciar o trabalho com um escopo mais
reduzido e, ao longo do tempo, depois de alguma experiência, ir acrescentando
novos assuntos.
Uma vez definido o assunto, é fundamental que seja preparada a ‘Tabela de
Assuntos Cobertos pela Base de Dados ...’, que contenha a lista detalhada dos
tópicos e inclua explicações detalhadas para facilitar a identificação da relevância ou
não dos documentos para a base de dados. Caso existam aspectos dos tópicos que
não sejam de interesse para a base de dados, isto também deve ser incluído na
Tabela.
Esta tabela deverá ser usada tanto pelos profissionais responsáveis pela
seleção dos documentos para a produção da base de dados, como também pelos
usuários que a utilizarão futuramente. Daí a importância de sua elaboração.

�5.15

No exemplo a seguir, vemos como pode ser apresentado um tópico na
‘Tabela de Assuntos Cobertos pela Base de Dados’ .
Ex: Radiologia e Medicina Nuclear
Radiação externa em diagnóstico.
Avanços no uso de radiações ionizantes, por exemplo, raios-X

radiação

gama. Avanços em procedimentos de imagens, incluindo espectroscopia de RMN
(ressonância magnética nuclear) e tomografia.
Nota: ultra-sonografia e raios-X de rotina em diagnóstico são excluídas.

4.2 TIPO DE LITERATURA

Dependendo do objetivo da base de dados, a seleção do tipo de literatura a
ser incluída pode ser mais ou menos rígida.
No caso das bases de dados que cobrem assuntos técnico-científicos,
somente deve ser incluída aquela literatura resultante de um trabalho de pesquisa
ou o resultado de um estudo técnico, como as dissertações e teses, os artigos de
periódicos técnico-científicos, os relatórios das instituições da área, patentes, os
anais de eventos etc. Ficam assim excluídos os artigos de revista não-assinados, as
notícias de jornal, os materiais de divulgação científica, folhetos e folders.

4.3 LIMITE GEOGRÁFICO

�5.15

O limite geográfico vai determinar as fronteiras do trabalho de coleta, vai
definir as fontes de informação que serão utilizadas, se vão ser limitadas às fontes
nacionais ou se serão direcionadas também às fontes internacionais.
Existem dois casos que podem nos levar a definir um limite geográfico ‘misto’.
Um deles é quando há escassez de literatura nacional no assunto desejado e é
preciso recorrer à literatura internacional para tornar a base de dados válida. No
segundo caso há um ou mais países, onde a pesquisa no assunto desejado é tão
avançada que não se pode omitir sua literatura. Neste último caso, a ênfase pode
ser dada à literatura nacional, mas incluir-se-á a literatura internacional por sua
importância.

4.4 PERÍODO DE TEMPO

Normalmente, quando se inicia a organização de uma base de dados,
retroage-se o período de tempo apenas alguns anos para trás, principalmente
quando se trata de base de dados na área técnico-científica. Isto se dá pelo fato do
volume da literatura publicada na área técnico-científica ser muito grande e o fator
‘data de publicação’ poder ser fundamental para o interesse ou não dos documentos
da base de dados.
Se, por outro lado, o período de tempo é definido pensando-se somente na
atualidade das informações e estabelecendo-se que só o que for publicado ‘daqui
para a frente’ deve ser incluído, podemos ter o problema de falta de documentos
para se alimentar a base de dados.

�5.15

Estudos já mostraram que a concentração dos documentos incluídos nas
bases de dados de um determinado ano foram publicados há dois anos. Assim,
caso a atualidade das publicações seja um fator importante na construção da base
de dados, pode-se retroagir o período de tempo em dois anos, estabelecendo um
parâmetro de alta qualidade para a base de dados.
O estabelecimento de períodos de tempo que retroagem em muitos anos
pode ser um fator complicador na coleta dos documentos, pois a tarefa é dupla:
tem-se que coletar os documentos antigos, acumulados por anos e anos, e o que
vem sendo publicado regularmente.

5 MANUAL DE COLETA DA BASE DE DADOS

Uma vez definidos os parâmetros da coleta, isto deve ficar registrado num
manual, que pode ser chamado de ‘Manual de Coleta da Base de Dados ...’. Neste
Manual pode-se incluir também a ‘Tabela de Assuntos Cobertos pela Base de
Dados ...’ . Sempre que possível, devem ser incluídos exemplos que facilitem a
seleção, como títulos de documentos que se enquadrem perfeitamente no escopo
da base de dados, como também títulos de documentos que devam ser rejeitados
por não serem de interesse.
Qualquer redefinição dada ou alteração introduzida em qualquer desses
parâmetros deve ser imediatamente registrada no ‘Manual de Coleta da Base de
Dados’ e informada ao grupo responsável pela produção da base de dados. Isto
evitará erros e falhas no processo de seleção de documentos.

�5.15

6 METODOLOGIA DA COLETA DE DOCUMENTOS

A metodologia da coleta de documentos envolve uma série de etapas, que
devem ser muito bem coordenadas e documentadas para evitarmos a duplicação de
esforços. A natureza do trabalho tende a gerar um volume muito grande de
informações, que precisam estar diligentemente organizadas para nos darem as
respostas que precisamos.
A coleta pode ser dividida em quatro etapas: levantamento das fontes de
informação, organização dos arquivos, organização dos contatos e feedback aos
autores.

6.1 LEVANTAMENTO DAS FONTES DE INFORMAÇÃO

Neste tópico, faz-se necessário mencionar dois fatos que ocorrem no trabalho
de levantamento das fontes de informação. O primeiro é a possibilidade de se obter
a partir de um só documento, indicações de novas fontes de informação. Por
exemplo: se identificamos uma bibliografia na lista das referências bibliográficas de
um documento, vamos ter, a partir daí, uma série de referências bibliográficas que
nos levarão a inúmeras outras, a nomes de autores, editores e orientadores, títulos
de periódicos, nomes de instituições etc. Formando o que se pode chamar de
cadeia de fontes de informações.
Esse ‘desdobramento de fontes de informação’ é um ponto positivo neste
contexto, fornecendo, sempre, farto material de trabalho. Por isso, o exame das

�5.15

listas de referências bibliográficas dos documentos identificados é o ponto
fundamental da metodologia de coleta de documentos.
O segundo fato que ocorre no desenvolvimento deste trabalho é a
possibilidade de, em algum ponto desta cadeia, surgirem fontes de informação já
anteriormente identificadas e coletadas, ou seja: a identificação de obras repetidas.
Daí a importância da sistematização das informações em arquivos bem
organizados, como vamos ver a seguir, e da disciplina nos procedimentos de coleta.
Esses dois fatos, o desdobramento e a possibilidade de repetição, podem ser
perfeitamente controlados com a organização de diversos arquivos. Esses arquivos
tem um papel fundamental, não só para informar se aquela fonte já foi identificada
ou não, mas também para nos dizer se ela foi relevante ou não para a base de
dados.
Para facilitar a manipulação das fontes de informações impressas, é
conveniente que elas sejam separadas em primária, secundária e terciária, pois elas
serão desdobradas de forma diferenciada. Nas fontes primárias o desdobramento é
mais simples, pois vamos direto às referências. Já no caso das fontes terciárias,
temos que passar por mais etapas, até chegarmos às referências bibliográficas do
documento primário.

6.2 ORGANIZAÇÃO DOS ARQUIVOS

O trabalho fica facilitado se já temos algum material identificado. Mas, caso
não o tenhamos, podemos dar início fazendo um levantamento das principais fontes
de informação da área. Os periódicos podem ser um bom ponto de partida, pois

�5.15

contêm informações sobre autores da área, instituições que desenvolvem pesquisa,
congressos realizados, títulos de outros periódicos relevantes e, através das
bibliografias dos artigos de periódico, outros documentos de interesse.
Reunindo essas informações, teremos os seguintes arquivos:
• Lista dos títulos de periódicos relevantes
Informações a incluir:
- nome do editor e endereço completo;
- nome das bibliotecas onde o título pode ser encontrado;
- controle dos volumes e números já vistos.
• Lista dos congressos realizados na área
Informações a incluir:
- nome das instituições patrocinadoras;
- local e data de realização do evento.
• Lista das instituições que desenvolvem pesquisas e estudos
Informações a incluir:
- endereço e o nome de um contato na instituição;
- publicação de relatórios anuais e outras publicações técnicas;
- existência ou não de biblioteca na instituição e nome do bibliotecário.

�5.15

• Lista das publicações identificadas
Informações a incluir:
- referência completa;
- biblioteca onde o documento pode ser encontrado;
- selecionado ou não para a base de dados (em caso negativo, é importante
colocar o motivo: fora do escopo, fora do prazo de coleta etc.).
• Lista dos documentos em processamento
Informações a incluir:
- título;
- autor;
- referência.

6.3 ORGANIZAÇÃO DOS CONTATOS

A organização dos contatos é etapa importante na coleta de documentos.
Cada instituição e pessoa de interesse pode ser abordada de diferentes formas. Os
contatos podem ser feitos através de correspondências formais, como as cartaspadrão, os formulários de pedidos entre bibliotecas, os formulários COMUT etc. E
também através de contatos informais, como o telefone, fax, e-mail etc. Os contatos
pessoais

são

extremamente

importantes,

pois

permitem

conscientizar

os

pesquisadores e/ou as instituições da necessidade de registro do trabalho científico
e da cooperação. Além disso, o contato pessoal com uma pessoa ou instituição
também pode gerar a multiplicação de outras fontes de referência, num processo de
realimentação contínuo.

�5.15

6.4 FEEDBACK AOS AUTORES

Esta é uma etapa fundamental para se estabelecer um fluxo constante de
documentos. Muitas vezes, a falta de vontade em remeter ou emprestar um
documento se deve ao fato de que as pessoas não sabem o que vai ser feito
daquele documento. Para evitar que isso aconteça basta informar ao autor do
trabalho, ou à pessoa que enviou o exemplar do documento, quando ele foi
incorporado à base de dados. Ainda melhor é enviar uma cópia da página da
bibliografia (caso haja) que contenha a referência bibliográfica em questão.

7 CONCLUSÃO

Como pode ser visto, os procedimentos para a coleta de documentos para
alimentação de bases de dados não são difíceis na sua essência, porém são
complexos na sua estrutura. A metodologia aqui apresentada é uma tentativa de
sistematização destas atividades, a fim de agilizar o trabalho dos profissionais
envolvidos e evitar duplicação de esforços e desperdício de dinheiro. É importante
salientar que qualquer oportunidade de contato neste processo

não deve ser

desperdiçada, seja formal ou informal. A comunicação é a base social para geração
de conhecimentos.
ABSTRACT
This paper provides a detailed description of the steps in the process of collecting
documents to form library databases, and calls attention to two points in the
methodology: the multiplication of information sources, and repetition. Multiplication

�5.15

is the identification of various other sources from the starting-point of a single
document, while repetition is the possibility of identifying sources already selected.
The files necessary for adequate control of information gathered, and the contents of
each, are also described.

REFERÊNCIAS BIBLIOGRÁFICAS
1 DODEBEI, Vera Lucia Doyle Louzada de Mattos. Metodologia de coleta de
documentos para bases de dados bibliográficos. Revista de Biblioteconomia
de Brasília, v. 14, n. 2, p. 313-327, jul./dez. 1986.
2 LAMBERT, Maria Betânia Monte Alto. Manual de coleta de documentos para
alimentação da base de dados do INIS. Rio de Janeiro : CNEN, 1996. (a
ser publicado)
3 MAREK, D. Organizaing input collection. In: INIS. Rio de Janeiro : Papers...
(Special Seminar Session for Latin American, 1981)

�</text>
                </elementText>
              </elementTextContainer>
            </element>
          </elementContainer>
        </elementSet>
      </elementSetContainer>
    </file>
  </fileContainer>
  <collection collectionId="45">
    <elementSetContainer>
      <elementSet elementSetId="1">
        <name>Dublin Core</name>
        <description>The Dublin Core metadata element set is common to all Omeka records, including items, files, and collections. For more information see, http://dublincore.org/documents/dces/.</description>
        <elementContainer>
          <element elementId="50">
            <name>Title</name>
            <description>A name given to the resource</description>
            <elementTextContainer>
              <elementText elementTextId="51360">
                <text>SNBU - Edição: 09 - Ano: 1996 (UFPR &amp; PUCPR - Curitiba/PR)</text>
              </elementText>
            </elementTextContainer>
          </element>
          <element elementId="49">
            <name>Subject</name>
            <description>The topic of the resource</description>
            <elementTextContainer>
              <elementText elementTextId="51361">
                <text>Biblioteconomia&#13;
Documentação&#13;
Ciência da Informação&#13;
Bibliotecas Universitárias</text>
              </elementText>
            </elementTextContainer>
          </element>
          <element elementId="41">
            <name>Description</name>
            <description>An account of the resource</description>
            <elementTextContainer>
              <elementText elementTextId="51362">
                <text>Tema: A biblioteca universitária e a sociedade da informação.</text>
              </elementText>
            </elementTextContainer>
          </element>
          <element elementId="39">
            <name>Creator</name>
            <description>An entity primarily responsible for making the resource</description>
            <elementTextContainer>
              <elementText elementTextId="51363">
                <text>SNBU - Seminário Nacional de Bibliotecas Universitárias</text>
              </elementText>
            </elementTextContainer>
          </element>
          <element elementId="45">
            <name>Publisher</name>
            <description>An entity responsible for making the resource available</description>
            <elementTextContainer>
              <elementText elementTextId="51364">
                <text>UFPR &amp; PUC-PR</text>
              </elementText>
            </elementTextContainer>
          </element>
          <element elementId="40">
            <name>Date</name>
            <description>A point or period of time associated with an event in the lifecycle of the resource</description>
            <elementTextContainer>
              <elementText elementTextId="51365">
                <text>1996</text>
              </elementText>
            </elementTextContainer>
          </element>
          <element elementId="44">
            <name>Language</name>
            <description>A language of the resource</description>
            <elementTextContainer>
              <elementText elementTextId="51366">
                <text>Português</text>
              </elementText>
            </elementTextContainer>
          </element>
          <element elementId="51">
            <name>Type</name>
            <description>The nature or genre of the resource</description>
            <elementTextContainer>
              <elementText elementTextId="51367">
                <text>Evento</text>
              </elementText>
            </elementTextContainer>
          </element>
          <element elementId="38">
            <name>Coverage</name>
            <description>The spatial or temporal topic of the resource, the spatial applicability of the resource, or the jurisdiction under which the resource is relevant</description>
            <elementTextContainer>
              <elementText elementTextId="51368">
                <text>Curitiba (Paraná)</text>
              </elementText>
            </elementTextContainer>
          </element>
        </elementContainer>
      </elementSet>
    </elementSetContainer>
  </collection>
  <itemType itemTypeId="8">
    <name>Event</name>
    <description>A non-persistent, time-based occurrence. Metadata for an event provides descriptive information that is the basis for discovery of the purpose, location, duration, and responsible agents associated with an event. Examples include an exhibition, webcast, conference, workshop, open day, performance, battle, trial, wedding, tea party, conflagration.</description>
  </itemType>
  <elementSetContainer>
    <elementSet elementSetId="1">
      <name>Dublin Core</name>
      <description>The Dublin Core metadata element set is common to all Omeka records, including items, files, and collections. For more information see, http://dublincore.org/documents/dces/.</description>
      <elementContainer>
        <element elementId="50">
          <name>Title</name>
          <description>A name given to the resource</description>
          <elementTextContainer>
            <elementText elementTextId="51995">
              <text>Metodologia de coleta de documentos para a produção de bases de dados bibliográficos. </text>
            </elementText>
          </elementTextContainer>
        </element>
        <element elementId="39">
          <name>Creator</name>
          <description>An entity primarily responsible for making the resource</description>
          <elementTextContainer>
            <elementText elementTextId="51996">
              <text>Lambert, Maria B. Monte Alto; Barreiro, Selma Chi</text>
            </elementText>
          </elementTextContainer>
        </element>
        <element elementId="38">
          <name>Coverage</name>
          <description>The spatial or temporal topic of the resource, the spatial applicability of the resource, or the jurisdiction under which the resource is relevant</description>
          <elementTextContainer>
            <elementText elementTextId="51997">
              <text>Curitiba (Paraná)</text>
            </elementText>
          </elementTextContainer>
        </element>
        <element elementId="45">
          <name>Publisher</name>
          <description>An entity responsible for making the resource available</description>
          <elementTextContainer>
            <elementText elementTextId="51998">
              <text>PUCPR</text>
            </elementText>
          </elementTextContainer>
        </element>
        <element elementId="40">
          <name>Date</name>
          <description>A point or period of time associated with an event in the lifecycle of the resource</description>
          <elementTextContainer>
            <elementText elementTextId="51999">
              <text>1996</text>
            </elementText>
          </elementTextContainer>
        </element>
        <element elementId="51">
          <name>Type</name>
          <description>The nature or genre of the resource</description>
          <elementTextContainer>
            <elementText elementTextId="52001">
              <text>Evento</text>
            </elementText>
          </elementTextContainer>
        </element>
        <element elementId="41">
          <name>Description</name>
          <description>An account of the resource</description>
          <elementTextContainer>
            <elementText elementTextId="52002">
              <text>É feita uma descrição detalhada das etapas que compõem o processo de coleta de documentos para a formação de bases de dados bibliográficos. Chama-se atenção, dentro da metodologia, para dois fatos: o desdobramento das fontes e a repetição, sendo desdobramento a identificação de várias outras fontes a partir de um único documento e repetição a possibilidade de identificação de fontes já selecionadas. Os arquivos necessários para o controle adequado das informações coletadas, bem como o conteúdo de cada um deles são apresentados.</text>
            </elementText>
          </elementTextContainer>
        </element>
        <element elementId="44">
          <name>Language</name>
          <description>A language of the resource</description>
          <elementTextContainer>
            <elementText elementTextId="68182">
              <text>pt</text>
            </elementText>
          </elementTextContainer>
        </element>
      </elementContainer>
    </elementSet>
  </elementSetContainer>
</item>
