Como criar graficos box plot comparando sujeitos

Como criar graficos box plot comparando sujeitos

com a compreensão de conceitos como a média aritmética e a mediana, que foi muito discutida, e também com a análise e interpretação de gráficos de colunas (Histograma) e de pontos (Dot-Plot). No entanto estas variáveis ainda foram insuficientes na compreensão de medidas como os quartis, e do gráfico Box-Plot. O estudo de Baker, Biehler e Konold (2004) apresenta dificuldades parecidas no trabalho com o gráfico Box-Plot. Os autores citam que tais dificuldades acontecem, pois, para compreender este tipo de gráfico, é necessário ter conhecimentos sobre quartis, e a divisão dos dados em quartis é de difícil compreensão, e a mediana não é tão intuitiva aos estudantes como os pesquisadores esperavam. Por isso é necessário organizar atividades específicas e em maior número para facilitar a compreensão da mediana e dos quartis. Então, acreditamos que, em nosso trabalho, como os alunos tiveram contato com tantos conceitos novos, seria necessário mais tempo para que pudessem compreender os significados dos quartis e, por conseguinte, a construção do gráfico Box-Plot. Ao final da parte A das atividades, os alunos responderam as questões de interpretação, em que poderiam mobilizar as diferentes representações para obter as informações necessárias. Neste momento, verificamos que os alunos preferiam consultar estas informações nas tabelas, fazendo pouco uso dos gráficos, evidenciando a pouca familiaridade no uso desse tipo de registro de representação semiótica de uma distribuição de freqüências. Nas atividades da parte B da seqüência didática, os alunos foram envolvidos em atividades que trabalhavam desde a coleta dos dados, até a representação e análise deles. Nesta etapa, verificamos que os grupos transitaram por três das quatro dimensões da estrutura do Pensamento Estatístico (WILD e PFANNKUCH, 1998). No ciclo investigativo, os alunos definiram o que pesquisar e como coletar, organizar e analisar estes dados. Na segunda dimensão, os alunos escolheram qual tipo de representação dos dados proporcionava uma melhor compreensão deles, organizando e analisando os dados. No ciclo interrogativo, os alunos 150 interpretaram o resultado de sua pesquisa, resumindo e comparando os dados. Porém não apresentaram disposições para investigar mais ou questionar os dados, ou seja, o pensamento estatístico ainda não está desenvolvido nesses alunos. Todos os grupos preferiram utilizar gráficos de colunas para representar os dados. Dois grupos utilizaram também a representação gráfica das medidas- resumo em seu relatório, indicando o aumento na familiaridade no uso desse registro de representação semiótica quando comparado à primeira fase da atividade. Na representação com lápis e papel, verificamos que houve avanços na construção de gráficos em relação ao teste diagnóstico. Acreditamos que o ambiente informatizado pode ter contribuído com estes avanços, na visualização de diferentes tipos de gráficos. Ainda neste item, verificamos avanços também em relação ao cálculo da média aritmética ponderada, e na obtenção da mediana. Acreditamos que estes avanços foram propiciados pelas interações com o ambiente e com os grupos. Em relação à análise dos dados, os alunos não redigiram um relatório como foi solicitado, mas escreveram frases soltas para resumir cada distribuição. Ao levarmos em consideração que estes alunos nunca tinham trabalhado com este tipo de atividade, que exigia a redação de uma análise estatística, podemos afirmar que os resultados obtidos foram significativos, já que os alunos começaram a escrever uma pequena análise. Ainda em relação a esta atividade, verificamos que os alunos utilizaram poucos recursos do software. Somente em alguns casos analisavam a variação dos dados, e utilizaram por várias vezes a palavra “maioria”, escolhendo os valores mais freqüentes para representar uma distribuição. Neste momento, podemos retomar as questões que motivaram esta pesquisa:  Em que medida as articulações entre os diferentes tipos de registros de representações semióticas podem constituir o acesso à compreensão em estatística?  O uso de um software de estatística dinâmica pode gerar/potencializar a necessidade de diversos registros de representações semióticas, e permitir 151 que o sujeito desenvolva a capacidade de organizar, analisar e interpretar dados?  Quais tipos de articulações entre os registros de representações semióticas de um conjunto de dados podem ser identificados, a partir do uso do ambiente computacional, visando à análise crítica dos dados? Considerando as reflexões apresentadas nas análises e nesta etapa do nosso trabalho, e baseando-se no que pudemos observar na evolução conceitual dos alunos durante a seqüência didática que trabalhamos, podemos responder a essas questões. Quanto à primeira delas, pudemos perceber a importância da articulação dos diferentes tipos de registros de representação semiótica, como entre tabelas e gráficos, representação numérica e gráfica de uma medida como a média ou a mediana, para a compreensão destes conceitos pelos alunos. Quanto à segunda questão, pudemos perceber que a influência do ambiente computacional foi fundamental no sentido de possibilitar a visualização dos diferentes tipos de registros de representação semiótica de uma distribuição de freqüências, principalmente no caso da representação gráfica de medidas como a média e a mediana, contribuindo para a compreensão destes conceitos. Apesar de os alunos ainda não terem compreendido o significado de outros conceitos, como os quartis e a construção do Box-Plot, acreditamos que o uso desse ambiente possa contribuir com a compreensão de tais conceitos, desde que seja desenvolvida uma seqüência de atividades específica, com maior tempo de duração. Fazemos também a hipótese sobre a necessidade de uma associação explícita entre o Box-plot e o Dot-plot, permitindo a visualização das relações que se pode estabelecer na análise da distribuição dos dados. Tal associação permitiria também a melhor atribuição de significados aos quartis. Quanto à terceira questão, percebemos, durante nossas análises, que a utilização do ambiente computacional possibilitou aos alunos a articulação de diferentes representações de um mesmo objeto, além de permitir a visualização simultânea destes vários registros, propiciando a obtenção de um maior número de informações sobre os dados. No entanto os alunos nem sempre faziam uso dessa multiplicidade de informações, e na análise geral das atividades, 152 constatamos que os alunos preferiam as tabelas para ler os dados, ou procurar informações (parte A das atividades), enquanto que para representar os dados, preferiam os gráficos (parte B das atividades). Uma primeira questão que se apresenta como perspectiva a ser investigada mais profundamente diz respeito ao tipo de mobilização de conhecimentos e ao tipo de mente matemática dos alunos, nos termos de Krutestki (1976, apud CAZORLA, 2002), que explicariam tais escolhas. As reflexões apresentadas nesse estudo também sugerem outras questões. Uma delas seria a verificação da equivalência entre as teorias de Duval (1994) sobre os tipos de apreensões de uma figura, e de Curcio (1989) sobre os Níveis de Compreensão Gráfica, verificação que pode ser realizada através de estudos empíricos, necessitando de ferramentas de validação estatística. Uma das limitações deste trabalho diz respeito ao desenvolvimento da compreensão do conceito de quartis e da construção do Box-Plot. Uma terceira questão a ser

Como criar graficos box plot comparando sujeitos
Como criar graficos box plot comparando sujeitos
Como criar graficos box plot comparando sujeitos

Leonardo Rodrigues 29/06/2020 - 6 mins de leitura

A manipulação e interpretação da base de dados é de suma importância dentro de um programa Lean Seis Sigma para o sucesso do método DMAIC.


A fim de facilitar a visualização da distribuição dos dados, são desenvolvidas inúmeras ferramentas gráficas que migram os dados de uma tabela para um diagrama, como o histograma e o boxplot, por exemplo.


Provavelmente você já ouviu falar sobre histograma, tendência central, ou até mesmo do diagrama de séries temporais. Mas e sobre o boxplot? Você sabe o que é? Para que ele serve ou como analisá-lo? Se não, continue lendo este artigo para descobrir tudo sobre esse diagrama.


Assista gratuitamente nossa vídeo-aula sobre Boxplot


O que é Boxplot?


O Boxplot ou box plot é um diagrama de caixa construído utilizando as referências de valores mínimos e máximos, primeiro e terceiro quartil, mediana e outliers da base de dados.


O boxplot tem como objetivo estudar as medidas estatística do conjunto de dados, como propriedades de locação, variabilidade, média, e outliers. Você deve estar pensando que isso tudo pode-se calcular com o histograma, certo?


Realmente, essas duas ferramentas são bem similares, cada uma com suas particularidades, e quando estão juntas, uma complementa muito bem a informação da outra.


No histograma você consegue ver melhor a média e o desvio padrão. Já no boxplot se percebe um pouco melhor as medidas de quartis, mediana, amplitude, além de identificar muito bem os outliers.


No boxplot a parte central do gráfico contém os valores que estão entre o primeiro quartil e o terceiro quartil. As hastes inferiores e superiores se estendem, respectivamente, do primeiro quartil até o menor valor, limite inferior, e do terceiro quartil até o maior valor.


Esse artifício é muito utlizando por profissionais do Lean Seis Sigma, para desenvolver projetos voltados a otimizações de processos e impulsionar o faturamento de empresas. Se você está buscando impulsionar sua carreira, essa é a certificação certa para você.


Como me tornar um destaque no mercado de trabalho?

Quer aprender a usar ferramentas que irão te ajudar a definir, mensurar, analisar e propor soluções aos problemas que interferem no desempenho dos processos organizacionais de sua empresa?

Então acesse o nosso eBook "As principais ferramentas do Lean Seis Sigma"! Com ele você entenderá o conceito de Seis Sigma, bem como um compilado com as principais ferramentas utilizadas por Belts na aplicação de cada etapa do método DMAIC.

Além de se obter a definição de cada uma dessas ferramentas, para que elas servem, e como utilizar, nesse Ebook você encontra, também, dicas de aplicação utilizando o software Minitab.

Então não perca tempo e baixe agora!

Como criar graficos box plot comparando sujeitos


Como analisar o boxplot?


Para te ajudar a entender melhor esse diagrama, separei a imagem a seguir com dois exemplos de boxplot, contendo uma indicação de o que significa cada um de seus pontos notáveis.



O boxplot começa sempre no valor mínimo da base de dados e termina no valor máximo, assim como o histograma.


A caixa representa os valores centrais da base de dados, onde no histograma essa parte é representada pelas barras mais altas, ou seja, dados com maior frequência.


A linha que dá início a caixa representa o valor do primeiro quartil, já a linha que está contida dentro representa a mediana e, por fim, a caixa é finalizada no terceiro quartil.


É importante observar que de cada lado da caixa se tem uma linha que se estende do valor mínimo na parte inferior, até o valor máximo na parte superior.


Ou seja, todo o boxplot representa 100% da base de dados. E sua grande vantagem é que cada região desse gráfico representa uma parte dos dados, facilitando assim a tomada de decisão.


Do valor mínimo até o início da caixa, estão representados 25% dos dados, já dentro da caixa estão representados mais 50% dos dados, e por fim, a haste superior representa os outros 25% restantes.


No boxplot, quando se tem um outlier, valores atípicos, facilmente conseguimos visualizá-los através do asterisco apresentado no boxplot. Isso pode ser observado no boxplot a direita na figura.


Quando se tem um outlier, ele distorce um pouco mais a questão da simetria da figura quando comparada com a figura sem outlier. Isso acontece quando temos valores discrepantes na base de dados e é observado pela diferença do tamanho da haste inferior comparado com a haste superior na figura da direita.


Se fizermos o histograma com os dados que originaram a figura da direita, observaremos um comportamento de curva normal mais estendida para um lado do que para o outro, ou seja, uma curva normal assimétrica.


Boxplot: Exemplo prático no Minitab


Beleza, agora já sabemos interpretar. Mas que tal construir um boxplot para depois analisarmos? Pensando nisso, separei um espaço neste artigo para esse exemplo. Confira!


Na empresa Voitto Tubes, o gestor construiu e coletou informações a respeito dos três principais motivos de desclassificados de sua empresa para fazer uma análise de dados.


Para isso, iremos utilizar o boxplot, pois com ele fica mais evidente a presença de outliers e a assimetria dos dados. Além disso, a comparação entre os três motivos analisados será mais efetiva já que a amplitude e a locação do Boxplot é visualmente mais simples de identificar do que em um histograma.


Para realizar essa análise, após a coleta de dados você deve ir ao software Minitab, selecionar a opção Gráficos e depois Boxplot como mostrado na figura a seguir.



De modo a facilitar a comparação entre as bases de dados, para esse caso, escolha a opção de múltiplos y's para que ambos os boxplots sejam plotados na mesma malha, como mostrado a seguir.



Feito isso, basta clicar em OK e o Minitab gera o gráfico que iremos comparar.



Como analisar esse resultado?


Pelo boxplot, conseguimos perceber que cada um dos três motivos tem um comportamento distinto. Isso não aconteceu por acaso, a ideia é realmente conseguir te explicar vários tipos de análises de modo que consiga absorver o máximo de conteúdo.


O boxplot da emenda é mais achatado, o que indica uma baixa variabilidade e desvio padrão. Porém ele está posicionado na parte superior da tela. Ou seja, a média e o valor mediano são valores bem altos.


Já no boxplot da solda fraca, o problema é um pouco diferente. Nesse caso temos um valor mediano mais baixo que a emenda, porém, altíssima variabilidade.


Isso traz uma certa imprevisibilidade, pois ora se tem valores muito baixos, ora se tem valores muito altos. É fácil de ver que quando essa variabilidade é muito grande, a previsibilidade é muito menor.


Já para ajuste de máquinas, temos dois outliers. Como esse boxplot tem um valor mediano mais baixo e esses dois valores de ajuste de máquinas estão mais distantes do valor mediano, acabamos por entender que são outlier.


Se fizéssemos o histograma dessa situação não ficaria tão fácil de enxergar essa condição do outlier para o ajuste de máquina, mas utilizando essa ferramenta, boxplot, isso fica muito evidente.


Que tal assistir uma vídeo-aula para ver o passo a passo deste exemplo no Minitab?


Aprenda mais!


Já pensou em ter acesso a um Kit completo sobre Lean Seis Sigma, a metodologia que revolucionou a indústria mundial?

Então adquira os conhecimentos necessários sobre a qualidade, as ferramentas Lean e a redução de desperdícios com 4 E-books totalmente gratuitos!

Incrível, né? Além disso, o kit também conta com 2 Webséries e 1 Workshop com 3 aulas sobre o método passo a passo!

Está esperando o que para começar a sua jornada de conquista dos melhores cargos no mercado de trabalho?

Clique na imagem e aproveite já!

Como criar graficos box plot comparando sujeitos