You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Descreva o bug
Olá, tudo bem? A raspagem não consegue ser concluída com o uso da ferramenta que raspa vários acervos, nem com o uso da ferramenta que raspa um acervo por vez. A correspondência de termos entres os acervos que me interessam variam de 300 a 3000, mas apresenta erro mesmo nos acervos de menor correspondência. O programa gera csv de relatório, textos de busca e erro, mas não gera csv de resultado.
Reproduzir
python pyHDB_acervos.py (ou pyHDB cujo erro é o mesmo)(python3 não funciona como comando na minha versão, mas eu sou leigo, aprendi só o básico para fazer essa tarefa)
Código do acervo: 100439_12
Termo de Busca: "Belford Roxo" Comportamento esperado
Esperava que o programa, após o comando de busca, retornasse um csv com as informações referentes às correspondências do termo buscado nos acervos
Screenshots
Desktop (por favor, preencha as seguintes informações):
SO: Windows 10
Versão do Python: 3.12
Terminal ou terminal virtual: Py Charm Community 2024.1.1
The text was updated successfully, but these errors were encountered:
Boa tarde, @Matheuszul
Fico feliz de ver a ferramenta sendo ussada e ajudando na pesquisa.
Eu não consegui reproduzir o errro, pois testei com o raspador de acervo único e funcionou tanto no windows como no Linux.
Eu estou trabalhando em uma atualização do programa para melhorar o desempenho (você pode ver as mudanças no branch issue-22. Em breve (até meados de junho) devo lançar a versão atualizada.
Na minha experiência esse tipo de erro acontece com maior frequência com acervos maiores do que 300 ocorrências mesmo, devido a erros de carregamento da própria HDB.
Eu sugiro que você tente limitar mais a busca, seja fragmentando por décadas, seja talvez utilizando o termo de busca entre aspas ("Belford Roxo") para buscar apenas expressões exatas.
Outra dica que pode ajudar, é encerrar os processos relacionados ao programa após um erro (procurar nos processo em execução - não tenho certeza como fazer isso no windows), ou apenas reiniciar o computador para encerrar todos esses processos que deram erro.
Descreva o bug
Olá, tudo bem? A raspagem não consegue ser concluída com o uso da ferramenta que raspa vários acervos, nem com o uso da ferramenta que raspa um acervo por vez. A correspondência de termos entres os acervos que me interessam variam de 300 a 3000, mas apresenta erro mesmo nos acervos de menor correspondência. O programa gera csv de relatório, textos de busca e erro, mas não gera csv de resultado.
Reproduzir
python pyHDB_acervos.py (ou pyHDB cujo erro é o mesmo)(python3 não funciona como comando na minha versão, mas eu sou leigo, aprendi só o básico para fazer essa tarefa)
Código do acervo: 100439_12
Termo de Busca: "Belford Roxo"
Comportamento esperado
Esperava que o programa, após o comando de busca, retornasse um csv com as informações referentes às correspondências do termo buscado nos acervos
Screenshots
Desktop (por favor, preencha as seguintes informações):
The text was updated successfully, but these errors were encountered: