Dados Abertos

Dados Abertos constituem a publicação e disseminação de dados e informações públicas na Web, seguindo alguns critérios que possibilitam sua reutilização e o desenvolvimento de aplicativos por toda a sociedade. O paradigma de dados abertos está fundamentado na constatação de que o dado, quando compartilhado abertamente, tem seu valor e seu uso potencializados.

A filosofia de dados abertos não define exaustivamente uma lista de formatos permitidos. Para ser considerado um dado aberto, o conjunto de dados deve estar disponível em um formato de especificação aberta, não proprietário, e estruturado. Além disso, é imprescindível que seja utilizado um formato amplamente conhecido.

A seguir uma lista com alguns formatos não proprietários para dados abertos:

  • CSV
    Significa Comma-Separated Values, ou valores separados por vírgula, e é um formato para armazenamento de dados tabulares em texto. A codificação é muito simples: cada linha do arquivo representa uma linha na tabela, e as colunas são separadas por vírgula. Campos que podem conter vírgula devem ser delimitados por aspas. CSV é recomendado para representação de estrutura de dados mais simples, de natureza tabular, onde não existem subpropriedades ou listas, gerando um arquivo menor e mais leve para processamento. Arquivos CSV são processáveis diretamente por editores de planilhas, como o OpenOffice e o MS Excel.

 

  • ODS
    Significa Open Document Spreadsheet, é um formato não proprietário de arquivo basedo em XML, padronizado pela ABNT sob a norma NBR ISO/IEC 26300:2006. É comumente chamado de planilha, similar ao XLS do MS Office Excel, porém aberto, por isso deve ser utilizado em substituição ao XLS. Planilhas são largamente utilizadas, são de fácil utilização e manipuláveis por diversos aplicativos. Apesar de ser um formato estruturado, é muito flexível, possibilitando manipulação e mistura de diversos tipos de dados, como imagens e textos formatados. Para a publicação de dados abertos tabulares, é recomendável a utilização de CSV, pela sua simplicidade e padronização.

 

  • RDF
    Significa Resource Description Framework, é um modelo de dados estruturado em grafos e possui diversos formatos de serialização, tais como RDF/XML, Notation 3 e Turtle. Os formatos baseados em RDF têm seus dados descritos em vocabulários disponíveis na Web. Apesar da grande qualidade dos dados disponibilizados em RDF, a construção de vocabulários para seu uso não é trivial. Numa escala de níveis de qualidade/complexidade de dados abertos, o RDF está no último nível, onde se constituirá a Web semântica.

 

  • RTF
    Significa Rich Text Format (literalmente, formato de texto enriquecido), é um formato de arquivo de documento desenvolvido com o intuito de facilitar o intercâmbio de documentos entre diversas plataformas, com base no processador de texto.
    Atualmente, e devido à sua simplicidade e documentação disponível, a maioria dos processadores de texto são capazes de ler e escrever documentos guardados em arquivos RTF.
    No Brasil, o formato RTF é o formato preferencial para edição e distribuição de documentos de texto oficiais conforme recomendação do Manual de Redação da Presidência da República. Também os Tribunais Superiores (STF e STJ) são exemplos de entidades onde os documentos são guardados e distribuídos frequentemente em formato Rich Text.

 

Seguem alguns exemplos de informações disponibilizadas em dados abertos: