@MASTERSTHESIS{ 2016:2092057131, title = {Tratamento de grandes volumes de dados hidrometeorol?gicos apoiados por valida??o cruzada em Workflows cient?ficos}, year = {2016}, url = "https://tede.ufrrj.br/jspui/handle/jspui/2592", abstract = "Obtergrandes volumes de dados meteorol?gicos de qualidade e livre de falhas s?o grandes desafios para estudos clim?ticos ambientais.O estudo de dados pluviom?tricos ? de grande import?ncia no dia a dia, pois viabiliza o entendimento da variabilidade espacial da precipita??o em uma regi?o ou bacia hidrogr?fica o que possibilita determinar o per?odo e avaliar a probabilidade da ocorr?ncia de eventos extremos, sendo de suma import?ncia para as a??es associadas ao planejamento urbano, industrial e agropecu?rio, al?m do uso racional dos recursos h?dricos.No Brasil, eles s?o obtidos a partir de esta??es meteorol?gicas, geograficamente distribu?dasem todo territ?rio e fornecidos por v?rios ?rg?os, principalmente, peloInstituto Nacional de Meteorologia (INMET)e pela Ag?ncia Nacional de ?guas (ANA).No entanto, obter dados estruturados curados de qualidade e livre de falhas ? um problema que ainda ? estudado por diversos autores. Assim, detectar e preencher as falhas encontradas nos dados ? um passo importante para o controle de qualidade. Neste sentido, este trabalho estuda e aplica o m?todo de valida??o cruzada para a sele??o dos m?todos de interpola??o (regress?o linear, pondera??o regional, inverso do quadrado da dist?ncia e pondera??o regional com base em regress?es lineares) no preenchimento de falhasde longas s?ries de dados pelo uso em workflows cient?ficos. Para controlar, integrar e produzir essa massa de dados curados, as tarefas de computa??o se apoiaram na execu??o de experimentos cient?ficosin silico voltados para a ?rea da Meteorologia baseadas no paradigma dos workflows cient?ficos, que capturaram descritores de proveni?ncia, que auxiliam na rastreabilidade dos dados e processos, e assim, revelam como foram produzidos, e, ainda, asseguram a qualidade da metodologia aplicada. Esta pesquisa prop?s, modelou e avaliou umworkflow cient?fico com base em experimentos computacionais capazes de manipular grandes volumes de dados meteorol?gicos brutos, transformando-os em curados e estabelecendo sua proveni?ncia. Al?m disso, a proposta consiste em armazen?-los na base de dados compat?vel com o sistema Meteoro desenvolvido previamente pelo nosso grupo de pesquisas.Neste processo foram analisados os dados hidrol?gicos de 34 esta??es pluviom?tricas (s?ries com no m?nimo 10 anos), de 77 inicialmente selecionadas e,dentre os m?todos avaliados o que apresentou melhores resultados foi o da pondera??o regional (PR).", publisher = {Universidade Federal Rural do Rio de Janeiro}, scholl = {Programa de P?s-Gradua??o em Modelagem Matem?tica e Computacional}, note = {Instituto de Ci?ncias Exatas} }