Arquigrafia: uma coleção de imagens da arquitetura brasileira

17 02 2018

A carência de ferramentas adequadas para tratar e compartilhar imagens de forma profissional é notável em nosso país. No ambiente das bibliotecas, com suas velhas regras e foco eternamente em documentos textuais,  boas iniciativas ainda são poucas.

E o que seria um bom catálogo de imagens? Basicamente, um sistema que mostre prioritariamente as imagens, com boa qualidade, descritas com metadados específicos para imagens e indexadas de acordo com métodos e vocabulários controlados pensados para documentos fotográficos já seria um bom começo. O pesquisador de imagens que se deparar com um registro MARC cheio de informações inúteis para ele, com um link remetendo a uma imagem que demora a carregar vai fugir decepcionado para as montanhas.

O Arquigrafia, fruto de um projeto de pesquisa multidisciplinar coordenado por um professor da Faculdade de Arquitetura e Urbanismo da USP, escapa da maldição do banco de imagens que mais parece um catálogo de livros. Trata-se de um “ambiente colaborativo” criado para compartilhar imagens de obras arquitetônicas e  espaços urbanos brasileiros, que tem os seguintes pontos fortes:

é um sistema que leva em consideração a visão do usuário especialista na área e privilegia as informações importantes para esse público

as imagens são exibidas de forma agradável e amigável

colaborativo, permite que qualquer interessado no assunto faça um cadastro e insira suas imagens

a interface de catalogação é fácil de usar

tem aplicativo móvel

tem ferramenta para interpretação da obra arquitetônica que deve permitir, futuramente, a busca por semelhança

Os pontos fracos são aqueles típicos dos sistemas colaborativos de compartilhamento de imagens: faltam orientações e critérios mínimos para descrição das imagens. Não me refiro àquelas complicadas regras de catalogação que os bibliotecários adoram, que nem seriam necessárias dentro da proposta do Arquigrafia, mas a algumas convenções básicas poderiam ser adotadas na descrição das imagens. Vamos ver alguns exemplos.

Atribuição de títulos

Como nomear uma foto de detalhe? Altar da Igreja de São Francisco de Assis ou Igreja de São Francisco de Assis: altar?

Se na imagem o que realmente aparece é a marquise do Parque do Ibirapuera, o título deve ser: Parque do Ibirapuera ou Marquise do Parque do Ibirapuera ou Parque do Ibirapuera: marquise?

No campo descrição

É realmente necessário iniciar a descrição com a expressão “vista do“? Quando é necessário especificar se é uma vista geral ou parcial, faz sentido. Caso contrário, é redundância. É uma fotografia, logo, é uma vista.

A utilidade de um  texto descritivo ao lado de uma imagem é, sobretudo, esclarecer aspectos que não estão evidentes na própria imagem. Explicitar os elementos presentes na imagem e sua distribuição espacial, informando o nome daquele chafariz que aparece em primeiro plano ou explicando que as as paredes são de adobe, por exemplo. Apenas repetir a informação que está perfeitamente evidente na própria imagem e no seu título é inútil. Na mesma linha de raciocínio, é interessante informar dados históricos que esclareçam aspectos da imagem, como  a alteração da fachada em  reformas posteriores, ou o fato do piso não ser original. Mas será que é realmente importante inserir no campo descrição um histórico completo da obra ou local fotografado, como se o registro fosse um verbete da Wikipedia?

 

Muitas imagens do Arquigrafia são fotos ou slides antigos digitalizados, já que o acervo da Biblioteca da Faculdade de Arquitetura e Urbanismo também está sendo registrado na plataforma. É muito comum encontrarmos imagens com sinais de deterioração. Seria interessante que, na descrição ou num campo específico a ser criado, fosse inserida a observação de que a imagem está desbotada e o colorido original da obra está alterado. Pode parecer óbvio, mas como nem sempre a deterioração é evidente aos olhos dos leigos, é interessante alertar. Se a informação quanto ao estado de conservação for registrada em campo específico, poderá ser usada como filtro na busca, permitindo que o usuário exclua imagens desbotadas.

Critérios para indexação

Indexar imagens não é exatamente brincadeira de crianças. Se mesmo profissionais treinados e experientes vacilam e cometem erros clássicos, certamente não se pode esperar consistência ou precisão de usuários sem formação específica. O Arquigrafia já tem uma lista de tags pré-determinadas para ajudar o usuário em suas escolhas, e a equipe tem planos de melhorar o controle vocabular, mas o problema não é só a normalização dos termos. Quando indexamos imagens um dos grandes desafios é decidir quando vamos atribuir determinado assunto e como manter a consistência nas escolhas que fazemos ao longo do tempo.

Um dos erros mais comuns é confundir o local onde foi feita a foto com o assunto da foto. A imagem abaixo, publicada no Arquigrafia, foi feita na marquise do Parque Ibirapuera, mas nela o local realmente aparece de forma reconhecível? Um eventual usuário em busca de informações visuais sobre a dita marquise consideraria útil essa imagem que mostra, sobretudo, um patinador em movimento num  espaço quase vazio? Poderíamos, naturalmente, dizer que a resposta depende do tipo de uso a ser feito da imagem. Pela sua força expressiva, a fotografia poderia ser usada numa peça publicitária ou num cartaz de filme sobre o parque, por exemplo, mas o fato é que a marquise do Ibirapuera quase não aparece na imagem.

Foto de Beatriz Mendes Costa e Natália Andrade.

Acredito ser importante estabelecer um critério e orientar os usuários nesse sentido, para evitar recuperação de imagens irrelevantes. Afinal, é razoável esperar de uma biblioteca de imagens especializada algum rigor na indexação. Mas sei perfeitamente o quanto isso é difícil de ser colocado em prática.

Um outro ponto complicado é o nível de detalhamento na indexação. Ao analisar imagens, é importante considerar os diversos elementos visíveis na cena ou objeto fotografado, mas também é preciso saber desconsiderar detalhes pouco pertinentes. Indexar cada centímetro da imagem pode gerar excesso de informações de pouca utilidade para os usuários. Na imagem abaixo estão visíveis uma árvore, uma pomba e condicionadores de ar nas janelas do prédio, mas é pouco provável que inserir tags para esses elementos tenha algum interesse para quem pesquisa.

Foto de Larissa França Peres

Já a identificação de elementos técnicos da construção de um edifício, ainda que bastante específicos aos olhos de um leigo, podem ser importantes para o especialista,  como mostra a escolha de tags para a imagem abaixo: colônia de férias, sindicato, lazer, centro recreativo, quadra poliesportiva, canteiro de obras, coluna, laje
nervurada, concreto, concreto armado, vão.

Foto do acervo da Biblioteca da FAU

O usuário sem formação em arquitetura terá dificuldades em indexar usando termos técnicos ou usar a ferramenta de interpretação arquitetônica. Um glossário visual dos conceitos básicos da área seria útil, mas, sinceramente, não sei se é viável.

Num acervo colaborativo será impossível evitar decisões diferentes  quanto ao nível de especificidade na indexação, pois cada usuário terá o seu próprio olhar sobre as imagens, condicionado por suas experiências, conhecimento de arquitetura, lógica pessoal etc. Entretanto, acredito que, se forem oferecidas na plataforma orientações básicas e simples para guiar os colaboradores  na atribuição das tags, será possível melhorar um pouco a consistência na indexação.

Um dos conceitos clássicos da análise de imagens,  como aponta Sarah Shatford, é a capacidade que tem uma imagem de representar ao mesmo tempo um objeto específico e uma categoria genérica à qual esse objeto pertence. O assunto de uma foto da Praça da Sé, por exemplo, é tanto Praça da Sé quanto praças. Muitos usuários do Arquigrafia devem intuir isso e indexam as imagens postadas tanto pelo nome específico quanto pela categoria geral, mas nem todos. Seria bastante bem-vinda uma orientação nesse sentido.

Georreferenciação

Ao subir uma imagem por meio do aplicativo móvel, a localização é dada automaticamente pelo Google Maps. O recurso é ótimo, mas só funciona adequadamente se a imagem for postada no local onde foi registrada. Se o usuário fizer o upload em outro local, a georreferenciação ficará errada. Apesar de ser um fato óbvio, muitos usuários não se dão conta disso. Seria útil que o sistema desse um alerta no momento do upload, lembrando que é possível editar e corrigir a localização caso não esteja realizando a postagem no local da tomada da foto.

Adequação das imagens aos objetivos da coleção

Pode parecer evidente, a qualquer ser humano razoável, que a foto de um cachorro ou de um armário de roupas não tem qualquer interesse para uma coleção de imagens de arquitetura brasileira. Está explícito no texto do projeto: “imagens digitais de edifícios e espaços urbanos do Brasil e da comunidade lusófona”.  Não parece difícil de entender (nem de aceitar), mas parece que alguns colaboradores imaginam que seu cachorro ou suas camisetas se enquadram nessa definição. Um controle mínimo de qualidade se faz necessário, portanto,  para preservar as características do projeto.

Observações finais

O Arquigrafia é um trabalho em construção, e tenho certeza de que, apesar das dificuldades inerentes aos projetos tocados com verbas de agências de financiamento de pesquisa, sem pessoal fixo nem dotação orçamentária, ainda vai evoluir bastante. A equipe, da qual fazem parte bibliotecárias da FAU/USP e professoras do Curso de Biblioteconomia da ECA/USP está sempre aberta a sugestões, e eu mesma já dei meus palpites.

A plataforma é aberta a todos que se disponham a compartilhar imagens de arquitetura brasileira. Para participar, basta fazer um cadastro. Não é necessário ser arquiteto, nem estudante de arquitetura, nem fotógrafo. Por esse motivo, considero o Arquigrafia como uma boa oportunidade para professores e estudantes interessados em tratamento documentário de imagens testarem suas habilidades e conhecimentos na prática, travando contato com um sistema de concepção moderna, que busca dialogar tanto com o especialista quanto com os interessados leigos no assunto. Dá para pensar bastante em diversas questões relacionadas ao universo da catalogação e indexação de fotografias, contribuindo, ao mesmo tempo, com a formação de uma bela coleção de imagens de arquitetura brasileira. Sem esquecer, é claro, do cuidado indispensável com a qualidade e pertinência das imagens e informações postadas.

Referência

SHATFORD, S. Analyzing the subject of a picture: a theoretical approach. Cataloging & Classification
Quarterly, v.6, n. 3, p. 39-62,1986.

Mais informações sobre o projeto do Arquigrafia: http://www.arquigrafia.org.br/project

 

 

 

 

 

 

 

 

 

Anúncios




As Obras de Arte, suas Imagens e a Catalogação

17 12 2013

No SNBU de 2008, José Estorniolo Filho e eu apresentamos um trabalho sobre  imagens de arte, no qual examinávamos algumas peculiaridades envolvidas no tratamento desse material e as ideias promissoras trazidas pelos novos princípios e padrões que despontavam no mundo da documentação: os Requisitos Funcionais para Registros Bibliográficos da IFLA (FRBR) e o Cataloguing Cultural Objects, da Visual Resources Association (CCO).

Em novembro deste ano,  no último Encontro Nacional de Catalogadores (Enacat), foram apresentados dois trabalhos  sobre padrões para tratamento de imagens: um deles sobre o padrão de metadados VRA Core, outro que propõe um modelo de requisitos funcionais para documentos imagéticos digitais. Fora isso, não tenho visto produção brasileira de textos acadêmicos sobre o tema imagem e FRBR ou sobre catalogação de imagens de obras de arte usando o padrão CCO. Também não observei experiências de aplicações práticas do CCO em projetos de instituições brasileiras, o que não deixa de ser decepcionante, visto que se trata de uma regra de catalogação desenvolvida especialmente para obras de arte e para as imagens delas.

Suponho que ainda não existam no Brasil acervos de imagens suficientemente organizados para considerarem o estudo de regras de catalogação, ou profissionais da informação atuando nas instituições com esse tipo de acervo, ou que os bibliotecários ainda estejam presos ao AACR2 e sonhando com o RDA sem estudá-lo de fato. Suposições, apenas.

Algumas bibliotecas digitais de imagens lançadas recentemente, como a Biblioteca Digital de Artes Visuais da Unesp e o Arquigrafia, projeto da Faculdade de Arquitetura e Urbanismo da USP, não estão usando o CCO para catalogar as imagens e adotam em suas bases de dados o princípio de registrar foto a foto, sem fazer a distinção entre registro da Obra e registro das imagens da Obra.

Na USP comecei a trabalhar, com o pessoal do Departamento Técnico do Sistema Integrado de Bibliotecas, num projeto de biblioteca digital para a produção artística dos professores usando as entidades do primeiro grupo dos FRBR como base para os registros. Infelizmente, o projeto parou como tantos outros na USP, e não tenho mais esperanças de que seja retomado. Além de ser  muito complicado, a produção artística não é devidamente valorizada na USP.

Mas quais seriam, afinal, as vantagens de tratar imagens de arte pensando na distinção entre a Obra fotografada e as imagens dela? Vou tentar explicar.

A imagem abaixo é da escultura Maman, de Louise Bourgeois, obra de 1999, em bronze, mármore e aço inoxidável, medindo 895 x 980 x 1.160 cm, versão do Museu Guggenheim de Bilbao. Foi fotografada em 2011, em preto e branco, de baixo para cima, por José Estorniolo Filho, que fez, na ocasião, diversas outras fotos em vários ângulos e tomando diferentes decisões estéticas. Todas essas informações, em princípio, podem interessar a um pesquisador de imagens de arte.

???????????????????????????????

A descrição dessa imagem, de acordo com o AACR2 e numa base de dados em formato MARC, seria mais ou menos assim:

100 = Bourgeois, Louise $d1911-2010
245 = Maman / foto de José Estorniolo Filho
260 = $c2011
300 = 1 foto digital; p&b; 66.1 Kb
520 = Vista parcial, câmera baixa, com parte das paredes do Museu Guggenheim em segundo plano.
534 = $pObra fotografada $aBourgeois, Louise$tMaman $c1999 $e1 escultura : bronze, mármore, aço ; 895 x 980 x 1.160 cm $lMuseu Guggenheim, Bilbao $nEdição 2/6, fundida em 2001
650 = Esculturas públicas
650 = Aranhas
700 = Estorniolo Filho, José

A descrição reflete a condição ambígua das fotografias de obras de arte, usadas como substitutas das obras originais pelo professor, por exemplo, que precisa apresentar aos alunos trabalhos localizadas em diversos pontos do mundo. A entrada principal é o autor da obra fotografada, que é o foco principal do interesse do pesquisador. Mas não se pode esquecer os aspectos da fotografia que está sendo tratada: o nome do fotógrafo (quando conhecido), a data em que a imagem foi produzida e seus dados físicos, pelo menos. O enquadramento, a posição da câmera e outros aspectos da imagem em si, que registrei no campo 520 (resumo) por falta de opção melhor são importantes para a seleção final das imagens pelo usuário. Num bom catálogo de imagens esses elementos deveriam ser filtros disponíveis no sistema de busca. Afinal, o pesquisador pode estar um busca de outro tipo de imagem da Maman, como esta, por exemplo:

maman 2
Agora vamos imaginar um acervo que tenha mais 145 imagens da mesma obra, de vários fotógrafos e épocas, em suportes físicos variados. Quem já trabalhou em acervos de slides, de fotos em papel ou imagens digitais, sabe que essa situação não é improvável. Se nosso hipotético acervo for especializado em esculturas ou pertencer a uma instituição da cidade de Bilbao, a quantidade poderá ser ainda maior. Se essas 145 fotos da mesma obra de arte forem catalogadas de acordo com a lógica de tratar o item em mãos – sou seja, cada uma das fotos individualmente – teremos 145 registros com praticamente a mesma descrição. Isso porque a obra fotografada é a mesma, e a parte  mais importante da descrição se refere a essa obra, a Maman de Louise Bourgeois.  Além da repetição um tanto inútil de trabalho, catalogar imagens dessa forma pode gerar inconsistências nas informações. Catalogadores diferentes, ou o mesmo catalogador em diferentes ocasiões, podem omitir um dos dados da obra por distração ou por não encontrá-lo na imagem específica que está sendo tratada.

E o que acontece lá na outra ponta, na recuperação da informação?

O pesquisador vai encontrar 145 (ou mais) imagens isoladas da mesma obra, sem qualquer relação lógica entre uma e outra, nem com a obra documentada. Inconsistências na catalogação, como ausência do nome do museu ou da data da obra, por exemplo, podem gerar dúvidas difíceis de serem resolvidas pela simples visualização das imagens: estou diante de um detalhe da Maman do Guggenheim de Bilbao ou de outra das sete cópias realizadas pela artista? Falta de cuidado na descrição das características específicas das imagens, como enquadramento e posição de câmera dificultam o processo de seleção dos documentos.

Façam uma experiência: entrem no Flickr , pesquisem “maman Louise Bourgeois” e observem a imensa quantidade imagens bastante diferentes entre si que é recuperada. Mesmo quem não está habituado a pesquisar imagens vai entender o problema que é para o usuário encontrar “aquela foto” ou aquele tipo específico de foto da Maman que atenda às suas necessidades.

Para fazer diferente, usando uma lógica que considere mais o usuário da imagem do que princípios de catalogação criados para documentos textuais, vamos tentar o seguinte.

1. Descrever a obra de arte com todos os dados necessários e criar um registro no catálogo para essa descrição.
2. Descrever as imagens dessa obra, ressaltando os aspectos específicos do documento fotográfico e relacionar cada registro de imagem ao registro da obra da obra de arte.

Catalogando de acordo com o CCO, resultado seria algo mais ou menos assim:

Registro da Obra

Classe: Escultura
Tipo de obra: Escultura pública
Título: Maman
Criador: Louise Bourgeois (escultura francesa, 1911-2010)
Data de criação: 1999
Assunto: Maternidade; Aranhas
Localização atual: Museu Guggenheim de Bilbao (Bilbao, Espanha)
Dimensões: 895 x 980 x 1.160 cm
Materiais e técnicas: bronze, mármore, aço
Edição: 2/6, fundida em 2001
Descrição: Aranha gigantesca com vários ovos de mármore no interior do abdômen, concebida pela artista como homenagem à sua mãe, que trabalhava como restauradora de tapeçarias.

Registro de imagem 1

Agente: José Estorniolo Filho (fotógrafo  )
Título: Maman
Data da imagem: 2011
Tipo de imagem: imagem digital
Formato da imagem: jpg
Medidas: 66.1 Kb
Descrição da vista: Vista parcial de baixo da escultura, abdômen com ovos visível, parte da parede do museu enquadrada em segundo plano.
Tipo de vista: Vista parcial; Vista de baixo.
Assunto da vista: Abdomen; Pernas; Ovos.
Direitos autorais: José Estorniolo Filho, licença Creative Commons
Obra relacionada: link para a obra

maman pequena 1

Registro de imagem 2

Agente: José Estorniolo Filho (fotógrafo)
Título: Maman
Data da imagem: 2011
Tipo de imagem: imagem digital
Formato da imagem: jpg
Medidas: 2,01 Mb
Descrição da vista: Vista geral de cima, com sombra projetada no chão, parte de passarela e lago enquadrados, pessoas ao redor da escultura.
Tipo de vista: Vista geral; Vista de cima.
Direitos autorais: José Estorniolo Filho, licença Creative Commons
Obra relacionada: link para a obra

???????????????????????????????

Registro de imagem 3

Agente: Kainet
Título: Looking way too skinny to be healthy
Data da imagem: 2010
Tipo de imagem: imagem digital
Formato da imagem: jpg
Descrição da vista: Vista geral da obra, com Museu Guggenheim ao fundo, realizada com objetiva olho-de-peixe.
Tipo de vista: Vista geral;  Olho-de-peixe; Moldura circular.
Assunto da vista: Museu Guggenheim de Bilbao
Direitos autorais: Kainet, licença Creative Commons.
Obra relacionada: link para a obra

looking way too skinny to be healthy

Registro de imagem 4

Agente: Michael
Título: Chez Maman
Data da imagem: 2007
Tipo de imagem: imagem digital
Formato da imagem: jpg
Descrição da vista: Vista parcial da obra e do Museu Guggenheim, realizada durante o pôr-do-sol.
Tipo de vista: Vista parcial; Luz crepuscular
Assunto da vista: Pôr-do-sol
Direitos autorais: Michael, licença Creative Commons.
Obra relacionada: link para a obra

439548053_00c095bb38_z

Alguns desses elementos, como Criador, Assunto, Tipo de Obra e Tipo de Vista, por exemplo, devem ser relacionados a registros de autoridade.  Parte dos metadados que utilizei na descrição das imagens foi extraída do padrão VRA Core, que pode ser usado em conjunto com as normas do CCO.

As vantagens da dupla CCO/VRA Core em relação a outros padrões são, para ficar apenas nas mais evidentes:

  • Por serem padrões desenvolvidos especificamente para tratar obras de arte e suas imagens, trazem soluções para problemas de descrição não previstas por outras normas.
  • Fazem distinção clara entre Obra e Imagem, eliminado possíveis confusões entre um conceito e outro e ajudando a descrever adequadamente elementos que acabam sendo negligenciados quando usamos padrões concebidos para tratamento de textos.
  • Obrigam o catalogador a voltar necessariamente sua atenção para a Obra e para informações importantes que nem sempre podem ser encontradas nas imagens específicas que estão sendo descritas.
  • Propiciam real economia de esforços, já que a Obra é descrita uma única vez.
  • Permitem que a informação seja recuperada de forma mais lógica e organizada.

Leituras:

Sarah Lorenzon Ferreira e Marcelo dos Santos. Elementos da descrição de imagens de arte em ambiente eletrônicos:  considerações sobre o padrão VRA Core 4.0. http://www.enacat.ufscar.br/index.php/eic-enacat/eic-enacat/paper/viewFile/57/20

Margaret N. Webster. The metadata landscape: Cataloging Cultural Objects, the VRA Core, and our visual collections.  http://ecommons.cornell.edu/handle/1813/9417?mode=full

Mick Eadie. Towards an Application Profile for Imageshttp://www.ariadne.ac.uk/issue55/eadie





Uma biblioteca de imagens

11 06 2012

A UNESP lançou sua Biblioteca Digital, uma ótima notícia. E, melhor ainda, é uma biblioteca digital que contém fotografias digitais de obras de arte e arquitetura. Confiram:

Biblioteca Digital da UNESP
A quantidade de imagens disponíveis ainda é pequena, porque a Biblioteca acabou de ser lançada, mas já consegui observar algumas características que me agradam bastante:

–  O software é específico para coleções de objetos digitais:  o DigiTool, que oferece bons recursos para usuários de imagens. Vejam lá, não vou me alongar explicando.

– Quando faço uma busca o resultado são as próprias imagens, não fichas catalográficas  com links para as próprias. Isso faz toda a diferença para um usuário de imagens, que é aquele indivíduo que obviamente precisa de imagens, ainda que alguns bibliotecários não entendam isso.

– A catalogação é um simples, clara e específica para descrição de imagens. Não é uma catalogação de livros que esconde do usuário de imagens a informação que é realmente útil para ele. Não é perfeita, como nenhuma catalogação de fato é, mas me parece feita por quem entende de imagens de obras de arte.

Eu teria algumas críticas, mas não vou fazê-las, por um motivo muito simples: trabalho na Universidade de São Paulo, uma instituição que ainda não conseguiu  – ou não considerou prioritário – oferecer aos seus usuários de imagens um produto semelhante. Apesar da vasta experiência em tratamento de documentos fotográficos e do grande acervo que as bibliotecas da Faculdade de Arquitetura e da Escola de Comunicações e Artes, para citar apenas dois exemplos que conheço, acumulam há muitos anos.

Seria triste em criticar o trabalho alheio se tudo o que tenho à minha disposição para cadastrar imagens é o Dédalus – o Banco de Dados Bibliográficos da USP – tão desnecessariamente amarrado à catalogação de textos que me obriga a preencher o campo 041 do MARC (Código de idioma) ao cadastrar uma fotografia. E se quero registrar as informações data de criação da obra de arte e data da foto num local que não seja uma lamentável Nota Geral preciso usar o campo 260, que é exibido para o público com a curiosa etiqueta “Imprenta”. Por sorte é difícil encontrar um usuário ser humano não bibliotecário que saiba o que é imprenta, mas os usuários de imagens que eventualmente conheçam o termo devem achar essa catalogação um tanto cômica.

Consta que a USP assinou a ARTstor, uma biblioteca digital de imagens de âmbito internacional, na qual os participantes podem incluir seus próprios acervos. O nome da USP já consta como assinante no site do serviço, mas ainda não é possível, por insondáveis razões,  acessar a base. Parece bom, mas por enquanto os felizes colegas da UNESP estão alguns passos à frente.

Mas, enfim, gostaria de apontar apenas um detalhe que me chamou a atenção no sistema de busca da UNESP. Senti falta de poder diferenciar interior e exterior, bem como detalhes e vistas gerais, quando procuro imagens de obras arquitetônicas. Por enquanto é fácil fazer a seleção visualmente, mas quando a quantidade de imagens for maior, utilizar esses termos na indexação poderá ser interessante para o usuário.





Imagens por imagens

25 02 2012

Quando publiquei o post Palavras ao vento, sobre questões relacionadas à busca e identificação de imagens de obras de arte, recebi mensagem do Felipe Salles Silva, aluno nosso lá da ECA e intrépido representante discente na Comissão de Biblioteca. Felipe me perguntava sobre o recurso de busca de imagens com imagens do Google e sugeriu que eu escrevesse sobre o assunto.

Confesso que, embora já conhecesse o recurso, não o usava. Fiz umas poucas buscas rápidas logo que surgiu, não gostei muito do resultado e esqueci. Mas resolvi tentar novamente, porque o Felipe é jovem e a gente precisa prestar atenção nos jovens, que não sabem muita coisa que a gente já aprendeu, mas sabem muita coisa que talvez a gente nunca vá aprender.

Busquei 25 imagens de obras de arte. Na verdade foram mais, mas só registrei o resultado dessas 25.  Não é, obviamente, uma amostragem representativa para uma pesquisa, mas minha intenção foi apenas  entender melhor a ferramenta e fazer algumas observações.  De repente alguém gosta do assunto e faz um TCC ou algo assim.

Procurei  misturar imagens que me pareciam fáceis – obras bem  conhecidas, expostas em museus europeus ou locais públicos – e as supostamente mais difíceis, obras pouco conhecidas, muitas das quais tive dificuldade de localizar pesquisando pelo nome do autor, algumas de artistas brasileiros.

Encontrei com facilidade 11 imagens dos dois grupos. O resultado pode não parecer muito animador, mas é bom. Se você tiver 25 imagens não identificadas no seu acervo, portanto inúteis para o seu usuário, vai gostar de encontrar 11 delas na internet sem muito esforço.

Só  não podemos esquecer do seguinte: encontrar a imagem é só uma parte do problema. A outra parte, até mais difícil, é avaliar se a informação localizada a respeito da imagem é correta, como expliquei no post Palavras ao vento. Pesquisa não é um jogo que a gente ganha quando diz “achei”. Bons resultados exigem análise, senso crítico, rigor e boa dose de desconfiança.

Descobri algumas coisas curiosas nesse meu pequeno teste.  A primeira é uma obviedade, mas não custa lembrar: o conceito de semelhança do robô não é o mesmo do ser humano, como se pode observar por essa resposta:

E antes que alguém pergunte, sim, eu cliquei no link para ver as demais imagens semelhantes …

Essa escultura localizada na área externa da Casa de la Vall, sede do parlamento de  Andorra, está amplamente documentada em diversas fotos disponíveis na internet, mas em enquadramentos diferentes e condições de luz que evidenciam seu colorido.  As fotos abaixo não são semelhantes à  foto que procurei  nem mesmo para olhos humanos, mas o olho humano treinado em buscar fotos de obras de arte teria mais chances de identificar a escultura do que o robô.

A imagem colorida tem alguns direitos reservados para lorentey, http://www.flickr.com/photos/lorentey/42635730/sizes/m/in/photostream/

A propósito, esse é um dos grandes problemas de identificar fotos de obras de arte: reconhecer a obra em fotografias totalmente diferentes.

A imagem abaixo também não foi encontrada, embora o Flickr tenha uma foto da mesma obra perfeitamente reconhecível em termos humanos:

Vejam a foto que localizei no Flickr buscando pelo nome da artista, Felícia Leirner. Recortei a minha foto, tirando fora o pinheiro e o céu, para torná-la mais parecida com a imagem do Flickr e refiz a busca. Também não funcionou.

Segunda constatação: nem sempre o robô localiza uma imagem que existe na rede. A foto abaixo está na minha página no Flickr, mas não foi encontrada. É exatamente  a mesma foto, da Mesquita de Córdoba ao anoitecer.

Não consegui descobrir qual é o critério de busca, mas o robô localizou outras imagens no Flickr.  Imagino que a varredura seja feita nos sites mais acessados, mas não encontrei essa informação nas instruções do Google. Se alguém mais esperto ou paciente do que eu souber, me avise, porque é uma informação importante.

Terceira constatação: os resultados podem ser diferentes para duas imagens muito semelhantes.  A foto abaixo foi localizada, depois que acrescentei a palavra “escultura” na busca:

Essa outra foto não teve a mesma sorte:

Ignoro porque isso acontece, mas a conclusão é evidente: é preciso fazer a busca com todas as fotografias disponíveis da mesma obra, mesmo que elas pareçam praticamente iguais para olhos de bibliotecários.

É importante acrescentar um termo de busca que descreva a imagem de alguma forma. No primeiro exemplo, sem a palavra escultura o resultado foi zero.

Uma das imagens que eu não esperava encontrar foi prontamente localizada:

Mas, curiosamente, entre as imagens que o robô considerou semelhantes, não havia nenhuma foto ou desenho de Jimmy Hendrix e nenhum grafite de um rosto semelhante, mas vieram diversos rostos de bebês e mulheres loiras.  É o lado engraçado da coisa.

Termino fazendo mais um alerta para quem trabalha com acervos de imagens de obras de arte. A busca do Google é uma ferramenta muito útil, apesar das falhas inevitáveis, se as suas fotos já forem digitais. Quem tem vastos contingentes de fotos em papel ou slides para identificar, precisa fazer uma boa avaliação da coleção e estabelecer um plano de trabalho que leve em conta fatores como: a provável relevância das imagens para a instituição; a probabilidade de encontrar na internet imagens semelhantes de acordo com critérios de máquinas; a necessidade de digitalizar o acervo de qualquer forma. Digitalizar todas as imagens apenas para sair procurando pelo Google pode não compensar.

É preciso ainda considerar que eu posso não ter sabido explorar corretamente os recursos da busca no Google Imagens, e que fiz um teste ligeiro, sem nenhum rigor metodológico. Suponho que já exista literatura publicada sobre o assunto, mas ainda não procurei. Se encontrar alguma referência interessante, publico aqui.  Alguém já leu alguma coisa sobre o assunto?

Todas as fotografias aqui publicadas, exceto aquelas para as quais dei o devido crédito, são de minha autoria.