???item.export.label??? ???item.export.type.endnote??? ???item.export.type.bibtex???

Please use this identifier to cite or link to this item: https://tede.ufrrj.br/jspui/handle/jspui/2592
???metadata.dc.type???: Dissertação
Title: Tratamento de grandes volumes de dados hidrometeorológicos apoiados por validação cruzada em Workflows científicos
Other Titles: Treatment of large volumes of hydrometeorological data supported by cross-validation in scientific workflows
???metadata.dc.creator???: Tomaz, Ulisses Roque 
???metadata.dc.contributor.advisor1???: Cruz, Sérgio Manuel Serra da
First advisor-co: Gregório, Ronaldo Malheiros
???metadata.dc.contributor.referee1???: Santos, Ednaldo Oliveira dos
???metadata.dc.contributor.referee2???: Manhães, Laci Mari Barbosa
???metadata.dc.description.resumo???: Obtergrandes volumes de dados meteorológicos de qualidade e livre de falhas são grandes desafios para estudos climáticos ambientais.O estudo de dados pluviométricos é de grande importância no dia a dia, pois viabiliza o entendimento da variabilidade espacial da precipitação em uma região ou bacia hidrográfica o que possibilita determinar o período e avaliar a probabilidade da ocorrência de eventos extremos, sendo de suma importância para as ações associadas ao planejamento urbano, industrial e agropecuário, além do uso racional dos recursos hídricos.No Brasil, eles são obtidos a partir de estações meteorológicas, geograficamente distribuídasem todo território e fornecidos por vários órgãos, principalmente, peloInstituto Nacional de Meteorologia (INMET)e pela Agência Nacional de Águas (ANA).No entanto, obter dados estruturados curados de qualidade e livre de falhas é um problema que ainda é estudado por diversos autores. Assim, detectar e preencher as falhas encontradas nos dados é um passo importante para o controle de qualidade. Neste sentido, este trabalho estuda e aplica o método de validação cruzada para a seleção dos métodos de interpolação (regressão linear, ponderação regional, inverso do quadrado da distância e ponderação regional com base em regressões lineares) no preenchimento de falhasde longas séries de dados pelo uso em workflows científicos. Para controlar, integrar e produzir essa massa de dados curados, as tarefas de computação se apoiaram na execução de experimentos científicosin silico voltados para a área da Meteorologia baseadas no paradigma dos workflows científicos, que capturaram descritores de proveniência, que auxiliam na rastreabilidade dos dados e processos, e assim, revelam como foram produzidos, e, ainda, asseguram a qualidade da metodologia aplicada. Esta pesquisa propôs, modelou e avaliou umworkflow científico com base em experimentos computacionais capazes de manipular grandes volumes de dados meteorológicos brutos, transformando-os em curados e estabelecendo sua proveniência. Além disso, a proposta consiste em armazená-los na base de dados compatível com o sistema Meteoro desenvolvido previamente pelo nosso grupo de pesquisas.Neste processo foram analisados os dados hidrológicos de 34 estações pluviométricas (séries com no mínimo 10 anos), de 77 inicialmente selecionadas e,dentre os métodos avaliados o que apresentou melhores resultados foi o da ponderação regional (PR).
Abstract: Researchers face several challenges in order to handle large volumes of high-quality meteorological data, free of missing (or gaps). The detailed comprehension of rainfall temporal data is important in daily activities such as in the evaluation of the distribution of rain in a given area. The proper study of such dataset may aid administrators in planning cities, industries and farmlands. In Brazil, meteorological dataset is collect by meteorological rainfall stations that are spread in the geographic space. Part of such dataset are maintained Agência Nacional de Águas (ANA) by means of HidroWeb system. Activities like detect and fill temporal series gaps are crucial to control the quality of meteorological data. This dissertation presents a computational approach based on scientific workflows and crossvalidation and interpolation methods to face the above-mentioned challenges. The interpolation methods we have used in this dissertation are linear regression,regional weighting, inverse square distance, regional weighting with linear regression. The scientific workflows we have developed are able to use the four methods to generate large volumes of high meteorological data; they are also able to collect retrospective provenance from the in silico experiments. Our experiments evaluated dataset from 34 (from 77) meteorological rainfall stations which the temporal serial has at least ten years of data. Our experimental results showed that the best results were achieved with PR method
Keywords: Workflow científico
validação cruzada
proveniência
Scientific workflow
cross-validation
provenance
???metadata.dc.subject.cnpq???: Matemática
Language: por
???metadata.dc.publisher.country???: Brasil
Publisher: Universidade Federal Rural do Rio de Janeiro
???metadata.dc.publisher.initials???: UFRRJ
???metadata.dc.publisher.department???: Instituto de Ciências Exatas
???metadata.dc.publisher.program???: Programa de Pós-Graduação em Modelagem Matemática e Computacional
Citation: TOMAZ, Ulisses Roque. Tratamento de grandes volumes de dados hidrometeorológicos apoiados por validação cruzada em Workflows científicos. 2016. 117 f. Dissertação (Mestrado em Modelagem Matemática e Computacional) - Instituto de Ciências Exatas, Universidade Federal Rural do Rio de Janeiro, Seropédica - RJ, 2016.
???metadata.dc.rights???: Acesso Aberto
URI: https://tede.ufrrj.br/jspui/handle/jspui/2592
Issue Date: 19-Sep-2016
Appears in Collections:Mestrado em Modelagem Matemática e Computacional

Files in This Item:
File Description SizeFormat 
2016 - Ulisses Roque Tomaz.pdfUlisses Roque Tomaz20.48 MBAdobe PDFThumbnail

Download/Open Preview


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.