Diário Oficial da União
Data files
This dataset is embargoed . Please contact Johne Jarske at rb.psu@eksraj.enhoj with any questions.
Lists of files and downloads will become available to the public when released.
Abstract
O Diário Oficial da União - DOU, é uma publicação na qual o estado brasileiro tem de tornar público todo e qualquer assunto acerca do âmbito federal.
Methods
A versão eletrônica é disponibilizada no formato Portable Document Format - PDF ou no formato HTML. A versão em PDF segue o mesmo leiaute do antigo formato impresso que parou de circular no dia 01/12/2017.
Apesar da sua importância para o estado, para as empresas e pessoas físicas, os recursos do mecanismo de busca da publicação são limitados permitindo visualizar os dados no formato PDF ou HTML (adicionado recentemente) . A consulta avançada é limitada permite: i) selecionar os cadernos, optando-se por todos simultaneamente ou ainda por uma combinação de um ou mais cadernos disponíveis, a saber, DOU1, DOU2, DOU3, DJ e eDJF1, sendo os dois últimos, apenas por razões históricas, uma vez que não são mais editados; ii) definir um intervalo de datas; iii) inserir palavras-chave; iv) e consultar por palavra chave exata ou fonética.
Existe um plano do governo para que os dados sejam disponibilizados em formato aberto, mas o cronograma do projeto está atrasado.
Coleta dos dados:
Periodicidade: diária
Formato: PDF (posteriormente convertido para texto)
Coleções: 3 seções (DOU1, DOU2 e DOU3)
Periodicidade: diária, em dias íteis.
Quantidade de arquivos: em média 450 arquivos PDF diários
Volume diário (MB): 50 MB PDF/4,5 MB TXT
Endereço: http://pesquisa.in.gov.br
O download dos PDF será feito diariamente e posteriormente convertidos em TXT.