TOPO

Ciência de Dados: o que é e como pode ajudar na gestão educacional

18/03/2021 | Editado em 18/03/2021 18:03

Contribuir para transformar dados em ações. Esse é um dos objetivos da Ciência de Dados. Para isso, são combinados estatística, métodos científicos e diversas técnicas e ferramentas de data science – algumas delas serão apresentadas em futuras edições deste boletimEssa abordagem interdisciplinar detecta padrões e relações que muitas vezes passariam despercebidos, despertando insights e gerando predições que subsidiam uma decisão com propósito, embasada em dados e não em achismos.  

Na educação, embora sejam extremamente relevantes decisões datadriven, ou seja, orientadas por dados, isso ainda é muito incipiente nas políticas educacionais, quando comparado a áreas como saúde, segurança pública ou mobilidade urbana. Alguns dos motivos para tal cenário podem ser a baixa geração de dados (especialmente os de qualidade e os não capturados por meio de processos tradicionais), a não integração de sistemas, a não padronização de processos e a inexistência de cultura data-driven e letramento digital

A pandemia impulsionou a migração do digital (e em muitos casos escancarou as desigualdades digitais). De algum modo, isso acelerou os 3 V’s do Big Data elencados pela consultoria Gartner: o volume alto de informações; a velocidade alta de como os dados são criados, gerados, produzidos e acessados; e a variedade ampla de ativos de informação (dados estruturados, semiestruturados e não estruturados). Também vieram novos desafios, como lidar com o gigantesco volume de dados, produzidos (e desatualizados) em uma velocidade vertiginosa, das mais variadas fontes – incluídos dados sensíveis de estudantes. 

A partir de estudos de diversos pesquisadores apresentados em workshops realizados pela Computing Research Association, Chris Dede, professor da Universidade de Harvard, elencou sete passos para uma educação intensiva em dados. Dede é um nome extremamente relevante na pesquisa de sistemas educacionais que atendam às oportunidades e desafios do século 21. Seus estudos abrangem desde tecnologias emergentes para aprendizagem, políticas que apoiam a transformação educacional, liderança em inovação educacional, ambientes de ensino baseados em mundos virtuais, realidades aumentadas, dentre outros.

passos para uma educação data-driven  

1) Mobilizar a comunidade para oportunidades com base em novas formas de evidênciasChris Dede alerta que a Ciência de Dados aplicada à educação não deve ser enquadrada como uma “solução à procura de um problema, mas em vez disso, como uma alavanca para melhorar a tomada de decisão sobre questões perenes no ensino e na aprendizagem“. O pesquisador também comenta que nem sempre produtores de dados serão também consumidores de dados – e esta distinção nem sempre é clara. É importante pensar em parcerias entre esses dois perfis e alinhar interesses, de modo a garantir o uso eficiente dos dados para otimizar o sucesso dos estudantesPar isso, uma estratégia seria estabelecer definições comuns sobre conceitos importantes e identificar grupos específicos de consumidores para desenvolver produtos direcionados a eles.

2) Disseminar a tomada de decisão baseada em evidências em todo o sistema: o uso de dados na educação traz uma série de oportunidades que vão subsidiar a tomada de decisão, seja em pequena escala, como por exemplo feedback em tempo real na sala de aula, ou em grande escala, como intervenções para reduzir custos. Para Dede, uma maneira de disseminar essa abordagem é focar primeiro na pequena porcentagem do corpo docente que está disposto a usar técnicas baseadas em dados e evidências. Então, gradualmente, ficará evidente para os outros professores que os métodos e resultados podem ser replicados por eles. Outra forma de aumentar a aceitação é passar a mensagem de que a educação baseada em dados e evidências beneficia tanto alunos quanto professores, com melhoria contínua na gestão e no ensino, muitas vezes proporcionando diminuição da carga horária dos professores.  A disseminação precisa ser tanto de cima para baixo (com novas tecnologias produzidas e implementadas) quanto de baixo para cima (com professores relatando uma forte necessidade de um novo sistema e de ação). Essa última é uma forma de garantir que as ferramentas produzidas são realmente acom maior demanda. Por fim, é importante ter um conjunto comum e padronizado de avaliações para comparar as experiências, de modo a ter conclusões mais consistentes sobre o uso intensivo de dados em educação.

3) Desenvolver novas formas de avaliação educacional: novas maneiras de medir a aprendizagem podem fornecer novas formas de evidências para a tomada de decisão para estudantes, professores e outras partes interessadas. Valerie Shute, em relatório editado por Dede, descreve “a coleta contínua de dados como alunos interagindo com ambientes digitais tanto dentro quanto, mais importante, fora da escola. Quando os vários fluxos de dados se aglutinam, as informações acumuladas podem potencialmente fornecer evidências cada vez mais confiáveis e válidas sobre o que os alunos sabem e podem fazer em vários contextos. Isto envolve avaliações de alta qualidade, contínuas e discretas incorporadas em vários ambientes ricos em tecnologia (TREs na sigla em inglês) que podem ser agregados para informar os níveis de competência em evolução de um aluno (em diversas granularidades de dados) e também agregados entre os alunos para informar as decisões de nível superior (por exemplo, do aluno para a classe, para a escola, para o distrito, para o estado, para o país).”

4) Recontextualizar processos de geração, coleta, armazenamento e representação de dados: dados de nível micro (por exemplo, os comportamentos de cada aluno segundo a segundo à medida que aprendem), dados de nível meso (por exemplo, os padrões de ensino dos professores) e dados de nível macro (por exemplo, resultados dos alunos agregados para fins de prestação de contas) são todas entradas importantes para uma infraestrutura de ferramentas e repositórios para compartilhamento e análise de dados abertos. Em artigodisponível em relatório editado por Dede, Andrew Ho argumenta que um aspecto importante disso é a “criação de dados“, porque concentra os analistas no processo que gera odados. Dessa perspectiva, o surgimento do Big Data é o resultado de novos contextos que criam dados, não de novos métodos que extraem dados de contextos existentes. Uma abordagem adicional para determinar quais dados gerar é o Design Centrado em Evidências (ECD, sigla em inglês). Em artigo, Eric Klopfer aponta como o ECD define quatro modelos relevantes: (1) o modelo do estudante (o que sabe ou pode fazer); (2) o modelo de evidência (o que um estudante pode demonstrar e o que podemos coletar para mostrar o que ele sabe); (3) o modelo de tarefa (a experiência a partir da qual podemos coletar dados); e (4) o modelo de apresentação (como isso realmente aparece para o aluno).

5) Desenvolver novos tipos de métodos analíticos: em artigo disponível em relatório editado por DedesPiotr Mitros escreve: “Integrar diferentes formas de dados – desde avaliação por pares à participação em fóruns sociais – resulta em um nível de diversidade dos dados sem precedentes. Isso sugere uma mudança cada vez maior das estatísticas tradicionais para o aprendizado de máquina exige técnicas muito diferentes daquelas desenvolvidas na psicometria tradicional.” Avanços em métodos analíticos são claramente um avanço necessário para a ciência de dados na educação.

6) Construir capacidade humana para fazer ciência de dados e usar seus produtos:  atualmente existem poucos programas de educação em ciência de dados. Fazer a junção de pesquisa educacional com treinamento em ciência de dados ou fornecer uma “trilha” educacional para cientistas de dados poderia oferecer oportunidades interdisciplinares. Dede ainda acrescenta que a ética deve ser incluída em cada etapa do treinamento de ciência de dados para reduzir o dano emocional não intencional que pode resultar de várias análises.

7) Avançar nas questões éticas, legais e de segurançaé preciso estar atento ao uso ético dos dados desde o início do processo. Isso inclui não apenas questões como privacidade e sigilo, mas também passa por temas como estigma e exclusão. Artigo de Patricia Hammer, disponível em relatório editado por Dede, indica que “cada nova tecnologia que um pesquisador queira usar apresentará uma combinação única de riscos, muitos dos quais podem ser protegidos usando tecnologias disponíveis e políticas de informação adequadas. De maneira geral, a privacidade pode ser protegida adequadamente por meio de servidores e dados criptografados, dados anônimos, acesso controlado aos dados, e aplicação de políticas de privacidade para proteger acesso não autorizado e excedido aos dados.” 
 

E como fazer na prática? Conheça 5 aplicações da Ciência de Dados na educação  

Considerando as estratégias elencadas anteriormente, listamos a seguir possíveis aplicações da Ciência de Dados na educação:  

1) Plataformas adaptativas e ensino customizado: a Ciência de Dados pode ser uma grande aliada dos estudantes tímidos que ficam com vergonha de fazer perguntas ou daqueles entediados com a matéria que já dominam. Os padrões detectados em plataformas para pesquisa, exercícios e testes permitem identificar dificuldades, interesses e habilidades individuais. Com isso, é possível customizar o processo de aprendizagem, tornando-o mais atrativo e eficaz para cada perfil. Cada indivíduo pode, ainda, estudar segundo seu próprio ritmo. Os dados coletados nessas plataformas podem também ser cruzados com dados de redes sociais, a fim de criar ambientes que sirvam para aprender melhor. 

2) Desenho de cursos e currículos: a partir da análise de dados obtidos por meio de aplicativos ou ambientes de curso online, por exemploé possível identificar conhecimento tácito – aquele que é difícil de ser explicitado, mas que pode ser captado, de algum modo, por tecnologias educacionais. Esse conhecimento pode subsidiar a construção de cursos e currículos. Esses dados podem, ainda, ser cruzados com os tipos de tarefas propostas e de interação dos alunos.

3) Seleção/casamento (matching): a Ciência de Dados pode proporcionar um Tinder da educação, dando match entre discentes e docentes com cursos e instituições. Isso traz mais possibilidades de satisfação e realização pessoal e facilita o casamento entre pessoas e instituições. 

4) Modelos preditivoscom ferramentas de analytics, é possível prever se o perfil de um discente vai se encaixar com o de um curso e instituição ou ainda se um novo currículo vai funcionar com um curso específico. Uma outra possibilidade é identificar indivíduos com alta probabilidade de abandono e, assim, atuar de modo que isso seja evitado. Em outra edição deste boletim vamos falar sobre o modelo preditivo de abandono que o Instituto Unibanco está pesquisando.

5) Otimizaçãoa Ciência de Dados pode contribuir para otimizar a infraestrutura instalada, considerando os desafios atuais. Além disso, pode ajudar a solucionar problemas logísticos relacionados à roteirização (como visita escolar, entrega de material impresso durante a pandemia, etc.). 

A Ciência de Dados na educação traz diversos efeitos positivos, tais como maior engajamento dos alunos, com ensino customizado, e maior possibilidade de traçar estratégias mais efetivas e precisas de recuperação e aprofundamento, a partir da análise de cada estudante e ciclos rápidos de melhoria. Para isso, é fundamental desenvolver ações para garantir algumas condições: acessibilidade dos estudantes não somente nas escolas, mas nas suas casas; um ambiente de casa que incentive o ensino e tenha condições para os estudos; e ainda a segurança de renda para que se consiga seguir os estudos. E, por fim, capacitar o corpo docente em metodologias ativas, tais como aprendizagem por projetos ou entre pares.

Referências

Dede, Christopher. DataIntensive Research in EducationCurrent Work and Next Steps Computer Research Association. Disponível em https://cra.org/wp-content/uploads/2015/10/CRAEducationReport2015.pdf . Acesso em 20/1/21.

Dede, Christopher. Next steps for “Big Data” in educationUtilizing data-intensive researchEducational Technology LVI (2): 37-42, 2016. Disponível em https://dash.harvard.edu/handle/1/28265473 . Acesso em 20/1/21. 

Mais informações sobre o trabalho de Chris Dede: https://www.gse.harvard.edu/faculty/christopher-dede  

Dica de vídeo 

Assista à palestra com Ricardo Henriques (aos 27min), superintendente-executivo do Instituto Unibanco, no ODS Talks ABRAPS 2020, na qual ele aborda essas questões. Ele participou do painel Tecnologias para Redução das Desigualdades:  Big Data para o Bem Comum”:

GLOSSÁRIO DE CIÊNCIA DE DADOS E INTELIGÊNCIA GEOGRÁFICA 

ENTENDA MELHOR OS TEMAS QUE ESTÃO RELACIONADOS A ESSE CONTEÚDO.  

Big Data: Segundo definição da Gartner, big data são dados com maior variedade que chegam em volumes crescentes e com velocidade cada vez maior – o que é conhecido como os três Vs. Há autores que acrescentaram duas dimensões: veracidade e valor. Os desafios impostos pelo Big Data são, assim, lidar com o gigantesco volume de dados, produzidos (e desatualizados) em uma velocidade vertiginosa, das mais variadas fontes. Além disso, avaliar quais são verídicos e agregam valor. Chris Dede acrescenta: o big data permite a descoberta de novas informações, fatos, relacionamentos e indicadores que não poderiam ter sido percebidos anteriormente. 

Ciência de Dados (ou data science): De acordo com o Data Science Guide, a ciência de dados é a arte de transformar dados em ações. Isso requer a extração de informações oportunas e acionáveis de diversas fontes de dados para conduzir decisões de dados e produtos. O guia recomenda os seguintes passos: Perguntar> Adquirir> Assimilar> Analisar> Responder> Aconselhar> Agir. Desta forma, a ciência de dados combina vários campos, incluindo estatísticas, métodos científicos e análise de dados para extrair valor dos dados. Chris Dede define Ciência de Dados como a captura em grande escala de dados e a transformação desses dados em insights e recomendações para apoio a decisões.  

Dataficação: Processo sistemático de extração e tabulação de dados dispersos e aparentemente irrelevantes, segundo Viktor Mayer-Schönberger e Kenneth Cukier, autores do livro Big Data: Como extrair volume, variedadevelocidade e valor da avalanche de informação cotidiana. Em outras palavras, dataficar um fenômeno é colocá-lo num formato quantificado de modo que possa ser tabulado e analisado. Ainda segundo os autores, dataficação não é sinônimo de digitalização. Este último é apenas um processo de representação numérica por meio de codificação binária.  

Letramento em dadosSegundo guia Developing a Data Literate Workforce, da Qlick, refere-se à habilidade de ler, trabalhar, analisar e se comunicar com dados, independentemente da função, habilidade, nível, ou ferramentas de BI que usa. O letramento em dados aprimora a tomada de decisão, possibilitando fazer as perguntas certas sobre os dados e interpreta-los de modo a tê-los como base para as ações.  

Compartilhe esta notícia!