Imagens por imagens

25 02 2012

Quando publiquei o post Palavras ao vento, sobre questões relacionadas à busca e identificação de imagens de obras de arte, recebi mensagem do Felipe Salles Silva, aluno nosso lá da ECA e intrépido representante discente na Comissão de Biblioteca. Felipe me perguntava sobre o recurso de busca de imagens com imagens do Google e sugeriu que eu escrevesse sobre o assunto.

Confesso que, embora já conhecesse o recurso, não o usava. Fiz umas poucas buscas rápidas logo que surgiu, não gostei muito do resultado e esqueci. Mas resolvi tentar novamente, porque o Felipe é jovem e a gente precisa prestar atenção nos jovens, que não sabem muita coisa que a gente já aprendeu, mas sabem muita coisa que talvez a gente nunca vá aprender.

Busquei 25 imagens de obras de arte. Na verdade foram mais, mas só registrei o resultado dessas 25.  Não é, obviamente, uma amostragem representativa para uma pesquisa, mas minha intenção foi apenas  entender melhor a ferramenta e fazer algumas observações.  De repente alguém gosta do assunto e faz um TCC ou algo assim.

Procurei  misturar imagens que me pareciam fáceis – obras bem  conhecidas, expostas em museus europeus ou locais públicos – e as supostamente mais difíceis, obras pouco conhecidas, muitas das quais tive dificuldade de localizar pesquisando pelo nome do autor, algumas de artistas brasileiros.

Encontrei com facilidade 11 imagens dos dois grupos. O resultado pode não parecer muito animador, mas é bom. Se você tiver 25 imagens não identificadas no seu acervo, portanto inúteis para o seu usuário, vai gostar de encontrar 11 delas na internet sem muito esforço.

Só  não podemos esquecer do seguinte: encontrar a imagem é só uma parte do problema. A outra parte, até mais difícil, é avaliar se a informação localizada a respeito da imagem é correta, como expliquei no post Palavras ao vento. Pesquisa não é um jogo que a gente ganha quando diz “achei”. Bons resultados exigem análise, senso crítico, rigor e boa dose de desconfiança.

Descobri algumas coisas curiosas nesse meu pequeno teste.  A primeira é uma obviedade, mas não custa lembrar: o conceito de semelhança do robô não é o mesmo do ser humano, como se pode observar por essa resposta:

E antes que alguém pergunte, sim, eu cliquei no link para ver as demais imagens semelhantes …

Essa escultura localizada na área externa da Casa de la Vall, sede do parlamento de  Andorra, está amplamente documentada em diversas fotos disponíveis na internet, mas em enquadramentos diferentes e condições de luz que evidenciam seu colorido.  As fotos abaixo não são semelhantes à  foto que procurei  nem mesmo para olhos humanos, mas o olho humano treinado em buscar fotos de obras de arte teria mais chances de identificar a escultura do que o robô.

A imagem colorida tem alguns direitos reservados para lorentey, http://www.flickr.com/photos/lorentey/42635730/sizes/m/in/photostream/

A propósito, esse é um dos grandes problemas de identificar fotos de obras de arte: reconhecer a obra em fotografias totalmente diferentes.

A imagem abaixo também não foi encontrada, embora o Flickr tenha uma foto da mesma obra perfeitamente reconhecível em termos humanos:

Vejam a foto que localizei no Flickr buscando pelo nome da artista, Felícia Leirner. Recortei a minha foto, tirando fora o pinheiro e o céu, para torná-la mais parecida com a imagem do Flickr e refiz a busca. Também não funcionou.

Segunda constatação: nem sempre o robô localiza uma imagem que existe na rede. A foto abaixo está na minha página no Flickr, mas não foi encontrada. É exatamente  a mesma foto, da Mesquita de Córdoba ao anoitecer.

Não consegui descobrir qual é o critério de busca, mas o robô localizou outras imagens no Flickr.  Imagino que a varredura seja feita nos sites mais acessados, mas não encontrei essa informação nas instruções do Google. Se alguém mais esperto ou paciente do que eu souber, me avise, porque é uma informação importante.

Terceira constatação: os resultados podem ser diferentes para duas imagens muito semelhantes.  A foto abaixo foi localizada, depois que acrescentei a palavra “escultura” na busca:

Essa outra foto não teve a mesma sorte:

Ignoro porque isso acontece, mas a conclusão é evidente: é preciso fazer a busca com todas as fotografias disponíveis da mesma obra, mesmo que elas pareçam praticamente iguais para olhos de bibliotecários.

É importante acrescentar um termo de busca que descreva a imagem de alguma forma. No primeiro exemplo, sem a palavra escultura o resultado foi zero.

Uma das imagens que eu não esperava encontrar foi prontamente localizada:

Mas, curiosamente, entre as imagens que o robô considerou semelhantes, não havia nenhuma foto ou desenho de Jimmy Hendrix e nenhum grafite de um rosto semelhante, mas vieram diversos rostos de bebês e mulheres loiras.  É o lado engraçado da coisa.

Termino fazendo mais um alerta para quem trabalha com acervos de imagens de obras de arte. A busca do Google é uma ferramenta muito útil, apesar das falhas inevitáveis, se as suas fotos já forem digitais. Quem tem vastos contingentes de fotos em papel ou slides para identificar, precisa fazer uma boa avaliação da coleção e estabelecer um plano de trabalho que leve em conta fatores como: a provável relevância das imagens para a instituição; a probabilidade de encontrar na internet imagens semelhantes de acordo com critérios de máquinas; a necessidade de digitalizar o acervo de qualquer forma. Digitalizar todas as imagens apenas para sair procurando pelo Google pode não compensar.

É preciso ainda considerar que eu posso não ter sabido explorar corretamente os recursos da busca no Google Imagens, e que fiz um teste ligeiro, sem nenhum rigor metodológico. Suponho que já exista literatura publicada sobre o assunto, mas ainda não procurei. Se encontrar alguma referência interessante, publico aqui.  Alguém já leu alguma coisa sobre o assunto?

Todas as fotografias aqui publicadas, exceto aquelas para as quais dei o devido crédito, são de minha autoria.


Ações

Information

Deixe uma resposta

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair / Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair / Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair / Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair / Alterar )

Conectando a %s




%d blogueiros gostam disto: