Wednesday 14 March 2018

Moving average ggplot2


Estou trabalhando com um pequeno conjunto de dados (21 observações) e tenho o seguinte intervalo QQ normal em R: Ver que o enredo não suporta a normalidade, o que eu poderia inferir sobre a distribuição subjacente. Parece-me que uma distribuição mais distorcida à direita Seria um ajuste melhor, é certo. Além disso, quais outras conclusões podemos extrair dos dados solicitados em 5 de junho às 10:44, o método de três pontos de Tukey39 funciona muito bem para usar parcelas QQ para ajudá-lo a identificar formas de reexpressar um Variável de uma maneira que o torna aproximadamente normal. Por exemplo, escolhendo os penúltimos pontos nas caudas e no ponto intermediário neste gráfico (que eu estimo ser (-1,5,2), (1,5,220) e (0,70)), você descobrirá facilmente que o A raiz quadrada aproxima-se de linearizá-los. Assim, você pode inferir que a distribuição subjacente é aproximadamente a raiz quadrada normal. Ndash whuber 9830 5 jun 14 às 13:09 Eu entendo que é forma e tipo de desvio de linearidade o que importa aqui, mas ainda parece estranho que ambos os eixos sejam rotulados como quot. Quantiles quot e um eixo é igual a 0,2 0,4 0,6 e o ​​outro é como -2 -1 0 1 2. Novamente, parece que alguns pontos de dados estão dentro do meio de uma distribuição teórica, mas como eles podem ser distribuídos entre 3 O próprio distributon, como o eixo dos Y em seu lote mais baixo da direita sugere ndash Macond 2 de dezembro 14 às 15:27 Eu fiz um aplicativo brilhante para ajudar a interpretar a trama QQ normal. Experimente este link. Neste aplicativo, você pode ajustar a afinidade, a afinidade (kurtosis) e a modalidade de dados e você pode ver como o histograma e QX mudam. Por outro lado, você pode usá-lo de uma maneira que, dado o padrão de QQ plot, então verifique como o skewness etc deve ser. Para mais detalhes, consulte a documentação nele contida. Eu percebi que não tenho espaço livre suficiente para fornecer este aplicativo on-line. Como pedido, vou fornecer todos os três troços de código: sample. R. Servidor. R e ui. R aqui. Aqueles que estão interessados ​​em executar este aplicativo podem simplesmente carregar esses arquivos no Rstudio, depois executá-lo em seu próprio PC. O arquivo sample. R: O arquivo server. R: Finalmente, o arquivo ui. R: respondeu 4 de dezembro 15 às 19:06 Parece que a capacidade do seu Shiny app39s foi maximizada. Talvez você possa apenas fornecer o código ndash rsoren 21 de janeiro 16 às 19:38 adicionado, espero que ajude e eu estou ansioso para ouvir sugestões. Ndash Zhanxiong 17 de fevereiro às 18:59 Bom trabalho, Zhanxiong Eu realmente aprecio :) ndash Vilmantas 6 de janeiro às 19:01 Sua resposta 2017 Stack Exchange, IncHow para fazer gráficos de bolhas Um gráfico de bolhas também pode ser liso para aumentar as bolinhas de tamanho proporcional , Mas aqui vamos abordar como criar a variedade que é como um diagrama de dispersão com uma terceira dimensão borbulhante. A vantagem desse tipo de gráfico é que ele permite comparar três variáveis ​​ao mesmo tempo. Um está no eixo dos x, um está no eixo dos e, e o terceiro é representado pelo tamanho da área das bolhas. Dê uma olhada no quadro final para ver o que fazemos. Passo 0. Download R We8217re vai usar R para fazer isso, então baixe isso antes de seguir em frente. It8217s gratuito e open-source, então você não tem nada a perder. Além disso, é um nome de necessidade de conhecer 2017. então você também pode conhecê-lo agora. Você pode me agradecer mais tarde. Etapa 1. Carregar os dados Supondo que você já tenha aberto R, a primeira coisa que we8217ll faz é carregar os dados. Estamos examinando os mesmos dados do crime que fizemos para o nosso último tutorial. I8217ve adicionou a população do estado desta vez. Uma nota sobre os dados. Os números do crime são realmente para 2005, enquanto as populações são para 2008. Este não é um grande negócio, uma vez que estamos mais interessados ​​em populações relativas do que nós somos os valores brutos, mas tenha isso em mente. Ok, em frente. Você pode baixar o arquivo delimitado por tabulações aqui e mantê-lo local, mas a maneira mais fácil é carregá-lo diretamente em R com a linha de código abaixo: You8217re dizendo R para baixar os dados e lê-lo como um arquivo delimitado por vírgulas com um cabeçalho. Isso o carrega como um quadro de dados na variável crime. Passo 2. Desenhe alguns círculos Agora podemos obter direito ao desenho de círculos com o comando symbols (). Passe os valores para o eixo dos x, eixo y e círculos, e it8217ll cuspir um gráfico de bolhas para você. Execute a linha de código acima, e you8217ll obtê-lo: tudo pronto, certo errado. Isso foi um teste. O tamanho acima do raio dos círculos pela população. Queremos dimensioná-los por área. As proporções relativas são todas fora do wack se você tamanho por raio. Etapa 3. Dimensione os círculos corretamente Para dimensionar os raios corretamente, olhamos para a equação para a área de um círculo: Área do círculo 960r 2 Nessa área, a área do círculo é população. Queremos saber o r. Mova algumas coisas e obtemos isso: r 8730 (Área do círculo 960) Substitua a população para a área do círculo e traduz para R, e nós obtemos isso: Yay. Círculos adequadamente dimensionados. Eles são muito grandes, no entanto, para que este gráfico seja útil. Por padrão, os símbolos () dimensionam a maior bolha para uma polegada e, em seguida, escalam o resto de acordo. Podemos mudar isso usando o argumento "polegadas". Seja qual for o valor que você coloca, substituirá o padrão de uma polegada. Enquanto nós estivermos aí, let8217s adicionam cor e alteram os rótulos dos eixos x e y. Observe que usamos fg para mudar a cor da borda, bg para alterar a cor do preenchimento. Aqui é o que recebemos: agora estamos chegando a algum lugar. Por sinal, você também pode fazer um gráfico com outras formas com símbolos (). Você pode fazer quadrados, retângulos, termômetros, caixas e estrelas. Eles tomam diferentes argumentos do que o círculo. Os quadrados, por exemplo, são dimensionados pelo comprimento de um lado. Mais uma vez, certifique-se de dimensioná-los adequadamente. Em que quadrados se parecem, usando a linha de código abaixo. Let8217s colam com círculos por enquanto. Etapa 4. Adicionar rótulos Como está, o gráfico mostra algum senso de distribuição, mas nós não sabemos qual círculo representa cada estado. Então let8217s adicionar rótulos. Fazemos isso com o texto (). Cujos argumentos são coordenadas x, coordenadas y, eo texto real para imprimir. Nós temos tudo isso. Como as bolhas, o x é assassinato e o y é assaltos. Os rótulos reais são nomes de estados, que é a primeira coluna em nosso quadro de dados. Com isso em mente, fazemos isso: o argumento cex controla o tamanho do texto. É 1 por padrão. Valores superiores a um tornam os rótulos maiores e o oposto por menos de um. Os rótulos centrar-se-ão nas coordenadas x e y. Aqui é o que parece. Etapa 5. Limpe Finalmente, como de costume, eu limpo no Adobe Illustrator. Você pode mexer com isso em R, se quiser, mas eu encontrei a maneira mais fácil de salvar meu arquivo como PDF e fazer o que eu quero com o Illustrator. Descartei os rótulos dos estados para torná-los mais legíveis, girai os rótulos do eixo dos e, de modo que eles eram horizontais, adicionavam uma legenda para a população e tiravam a borda externa. Eu também trouxe a Geórgia para a frente, porque a maior parte estava escondida pelo Texas. Here8217s a versão final. Clique na imagem para vê-la na íntegra. E você vai lá. Digite símbolos em R para obter mais opções de gráficos. Enlouquecer. Para mais exemplos, orientação e qualidade de dados, como este, compre Visualize This. O novo livro FlowingData. Se você quisesse ficar REALMENTE perto da figura resultante sem usar um editor de imagens, então você poderia usar o seguinte código R. Pode-se melhorar o posicionamento do nome do estado com um vetor de deslocamento (e seguir o conselho no texto sobre o posicionamento interativo). Par (tick 0.2, bty 8216n8217) crime lt - read. csv (quotdatasets. flowingdatacrimeRatesByState2008.csv038quot, headerTRUE, sepquottquot) limpar espaços de trânsito no campo de estado statetate ltgsub (039 039, 039039, crimestate) ylim lt - c (200 , 1250) crime lt - ordem do crime (crime de população, diminuindo TRUE), rado lt-sqrt (crimepopulation pi) símbolos (crimemurder, crimewarglary, círculos de raio, polegadas 0,35, ylim ylim, fg 039white039, bg 039red039, xlab 039039, ylab 039039, Yaxt 039n039) ylabpos lt - (1: 6) 200 eixo (2, ylabpos, etiquetas FALSE) texto (-0,35, ylabpos, etiquetas ylabpos, pos 2, xpd TRUE) texto (-1,4, 1350, expressão (negrito (039Burglaries pern100 , 000 população039)), cex 0,8, pos 4, xpd TRUE) texto (mediana (crimemurder), -50, expressão (negrito (039Murores por 100.000 habitantes0)), cex 0.8, xpd TRUE) pos lt - rep (NULL, nrow (Crime)) pos lt - rep (3, nrow (crime)) poscrimestate em c (039Alabama039, 039California039, 039Connecticut039, 039Maine039, 039Mississippi039, 039Ne w York039, 039North Dakota039, 039Georgia039, 039Alaska039) LT - 1 poscrimestate em C (039Hawaii039, 039Indiana039, 039Illinois039, 039Minnesota039, 039Nebraska039, 039West Virginia039, 039Wyoming039) LT - 2 poscrimestate em C (039Arizona039, 039Massachusetts039, 039Nevada039, 039Rhode Island039, 039South Dakota039 039South Carolina039, 039Wisconsin039) lt - 4 text (crimemurder, crimeburglary, crimestate, cex 0,5, pos pos, offset 0,25) create legend legPop lt - c (4e7, 2e7, 3e6) legRad lt - sqrt (legPop pi) hin lt - Par (039pin039) 2 burgPerInch lt - (ylim2 8211 ylim1) hin radPerInch lt - max (raio) 0,35 heightAdj lt - legRadradPerInchburgPerInch símbolos (rep (9,3), rep (200,3) heightAdj, círculos legRad, polegadas 0,35, adicionar VERDADEIRO) tAdj lt - strheight (03940m039, cex 0.5) texto (rep (9,3), rep (200,3) heightAdj2 8211 tAdj, c (03940m039, 03920m039, 0393m039), cex 0.5) isso tem sido útil até agora. Se eu quisesse, no entanto, classificar as bolhas em três categorias por diferentes cores de bolha, o código que é necessário. Por exemplo, eu quero mostrar o roubo (y) por homicídio (x) com tamanho da população (z) para 1. Mulheres, 2.Mais e 3.Children. Tendo, por exemplo, círculos azuis representando homens, círculos vermelhos que representam mulheres e círculos verdes representando crianças8230. Oi Nathan, cheguei ao seu site hoje, estava explorando e fazendo alguns tutoriais. Eu tenho um problema neste, talvez um noob, já que I8217m não é um especialista no Illustrator. Eu exporto o gráfico de bolhas R para PDF e abri-lo no Acrobat ok, mas quando eu abri o Illustrator faltam algumas bolhas e são substituídas por uma imagem X. O que eu estou fazendo de errado por responder. Btw, seu site é ótimo: muita informação e diversão com dados e gráficos.

No comments:

Post a Comment