Rafael FerreiraFederal Rural University of Pernambuco | UFRPE · Department of Computing
Rafael Ferreira
Ph.D.
About
204
Publications
47,894
Reads
How we measure 'reads'
A 'read' is counted each time someone views a publication summary (such as the title, abstract, and list of authors), clicks on a figure, or views or downloads the full-text. Learn more
2,552
Citations
Introduction
Additional affiliations
June 2013 - December 2018
June 2013 - present
March 2013 - March 2015
Education
March 2012 - March 2015
March 2010 - December 2011
January 2006 - December 2009
Publications
Publications (204)
Essays are considered a valuable mechanism for evaluating learning outcomes in writing. Cohesion is a fundamental aspect of the text, as it helps establish meaningful relationships between its parts. This work aims to analyse the performance of cohesion score prediction using item response theory to ensemble scores generated by machine learning mod...
No atual panorama educacional, a disponibilidade abundante de dados tornou-se essencial. Pesquisas revelam que fatores como histórico escolar, comportamento e contexto socioeconômico estão diretamente ligados ao sucesso futuro dos alunos. Ao analisar esses dados, as instituições de ensino podem otimizar seus recursos, prevenindo a evasão escolar e...
A coleta de dados educacionais é essencial para a gestão eficiente de recursos e atendimento das necessidades da população, sendo amplamente utilizada por pesquisadores para compreender e melhorar a educação. Nesse contexto, este estudo visa identificar quais os fatores de risco de evasão escolar de maior impacto com base no Instrumento de Avaliaçã...
A Taxa de Distorção Idade-Série (TDI) mede a quantidade de alunos fora do ano curricular esperado para sua idade. Este artigo utiliza técnicas de aprendizagem de máquina para prever os valores do TDI entre 2018 e 2023, abrangendo períodos pré, durante e pós-pandemia. Utilizando dados do Censo da Educação Básica, detalhamos a seleção do algoritmo e...
Automatic Short Answer Grading (ASAG) is a prominent area of Artificial Intelligence in Education (AIED). Despite much research, developing ASAG systems is challenging, even when focused on a single subject, mostly due to the variability in length and content of students' answers. While recent research has explored Large Language Models (LLMs) to e...
O objetivo deste estudo foi avaliar a eficiência do curso on-line ABC da Inteligência Artificial, tendo adotado a Análise do Comportamento como teoria educacional. Participaram 244 pessoas, ao longo de quatro ofertas do curso, desde graduandos em ciências exatas até pós-graduados de outras áreas. Foi aplicada prova de 30 itens de V/F no início (pré...
O objetivo deste estudo foi avaliar a eficiência do curso on-line ABC da Inteligência Artificial, tendo adotado a Análise do Comportamento como teoria educacional. Participaram 244 pessoas, ao longo de quatro ofertas do curso, desde graduandos em ciências exatas até pós-graduados de outras áreas. Foi aplicada prova de 30 itens de V/F no início (pré...
In the context of early childhood education, students need to acquire fundamental writing skills for their lifelong development. Public schools, especially in low- and middle-income countries, should monitor individual student progress to mitigate the detrimental effects of socioeconomic vulnerabilities in education. Furthermore, the volume of stud...
To meet the growing demand for future professionals who can present information to an audience and create quality written products, educators are increasingly assigning writing assignments that require students to gather information from multiple sources, reorganise and reinterpret knowledge from source materials, and plan for rhetorical structure...
Learning analytics (LA) adoption is a challenging task for higher education institutions (HEIs) since it involves different aspects of the academic environment, such as information technology infrastructure, human resource management, ethics, and pedagogical issues. Therefore, it is necessary to provide institutions with supporting instruments to d...
O objetivo com este artigo é avaliar, de maneira qualitativa e quantitativa,
o processo de validação e de análise de atributos, que compõe a etapa de Triagem
do Programa Nacional do Livro e do Material Didático. O processo atual precisa
de melhorias, considerando que é impactado pela expansão gradual da quantidade
e variedade de materiais inscritos...
Texts produced by the Brazilian judiciary have a complex and technical vocabulary, with elaborate use of the Portuguese language and many legal terms difficult to be understood, generating a barrier in communication between the judiciary and the population. In this sense, the Automatic Text Simplification (ATS), activity of the Natural Language Pro...
Educational feedback is a crucial factor in the student’s learning journey, as through it, students are able to identify their areas of deficiencies and improve self-regulation. However, the literature shows that this is an area of great dissatisfaction, especially in higher education. Providing effective feedback becomes an increasingly challengin...
A Taxa de Distorção Idade-Série (TDI) é um indicador que mede a quantidade de alunos que estejam em um ano curricular diferente de sua idade esperada. Este artigo propõe utilizar Learning Analytics e dados de diferentes fontes para extrair informações relevantes para a tomada de decisão no contexto do TDI. Utilizando fundamentalmente dados do censo...
Este artigo aborda uma análise da redução de características essenciais em cenários de predição de desempenho nas disciplinas de programação. Embora seja comum em aprendizado de máquina utilizar as características mais relevantes para aprimorar o modelo, este estudo se concentra em examinar um conjunto de dados proveniente de um Ambiente de Correçã...
O Plano Nacional da Educação (PNE) estabelece um conjunto de metas educacionais que devem ser alcançadas dentro de sua vigência. A meta 3 deste plano está relacionada ao atendimento escolar da população de 15 a 17 anos. Por outro lado, o ENEM gera anualmente uma grande quantidade de dados socioeconômicos através de um questionário respondido pelos...
Automated essay scoring (AES) is the task of automatically assigning scores (i.e., grades) to written texts. Although AES has been widely studied in the literature (e.g., informational and argumentative essays), specific types of texts still need more attention. Narrative essays are characterized by texts describing personal experiences and stories...
A evasão escolar é um problema global, e o uso de métodos automatizados para prever e acompanhar alunos em risco pode ser eficaz. Este estudo analisa a previsão da evasão de alunos do Instituto Federal de Pernambuco - Campus Jaboatão dos Guararapes por meio de algoritmos de aprendizado de máquina, utilizando dados acadêmicos. O XG Boost apresentou...
A seleção eficaz de tags é crucial na automatização do processo de correção de atividades abertas, auxiliando professores no fornecimento de feedbacks aos estudantes. Nesse contexto, essa pesquisa aborda a crescente demanda por ferramentas que auxiliem os educadores na avaliação de respostas escritas, economizando tempo e melhorando a eficiência. F...
O Bolsa Família é um programa social brasileiro que combate a pobreza e a desigualdade social no país. Uma das exigências do programa é a manutenção dos filhos na escola, o que ajuda a combater a evasão escolar. Contudo, garantir a eficácia do programa é um desafio, pois é necessário implementar sistemas de frequência escolar eficientes e enfrentar...
Feedback is a critical component of the teaching-learning process. Through it, teachers share relevant information so that students understand the subjects and activities, in addition to promoting self-regulation. However, the activity of writing and sharing feedback is not easy and may even lead to students’ demotivation. Given this, it is possibl...
O Plano Nacional de Educação (PNE) estabelece metas, diretrizes e estratégias para o desenvolvimento da educação no Brasil. A forma de cálculo para os indicadores das metas é padronizada entre municípios e estados. Este estudo propõe abordagens alternativas para calcular os indicadores do PNE a nível estadual, investigando seus vieses potenciais. O...
While Thematic Coherence is a fundamental aspect of essay writing, scoring it is labor-intensive. This issue is often addressed using machine learning algorithms to estimate the score. However, related work is mostly limited to the English language or argumentative essays. Consequently, there is a lack of research on other widely used languages and...
A produção textual de redações é uma etapa importante no processo de ensino-aprendizagem, pois permite aos alunos expressarem suas ideias. A coesão textual é um critério fundamental nesse contexto. Apesar do interesse em abordagens automatizadas para avaliação de redações, ainda existem poucos estudos que focam na coesão textual em redações escrita...
As Trilhas de Aprendizagem (TAs) são trajetos realizados pelos alunos durante sua interação com o ambiente virtual. Elas podem ser uma possível solução para acompanhar as ações dos alunos no ensino online. Neste contexto, esta pesquisa apresenta uma ferramenta, o CodeGraph, que faz a identificação e visualização das TAs dos alunos durante as suas i...
Intelligent Tutoring Systems (ITS) have been widely used to enhance math learning, wherein teacher’s involvement is prominent to achieve their full potential. Usually, ITSs depend on direct interaction between the students and a computer. Recently, researchers started exploring handwritten input (e.g., from paper sheets) aiming to provide equitable...
In the last decade, the study of pharmacological networks has received a lot of attention, given its relevance to the drug discovery process. Many different approaches for predicting biological interactions have been proposed, especially in the area of multiple kernel learning (MKL). Such methods comprise integrative approaches that can handle hete...
Textual production is a key activity at different levels of education. The analysis of essays encompasses several criteria, such as lexical and syntactic errors, cohesion, and coherence. Within these criteria, how the students include punctuation (i.e., final mark and comma) could influence the quality of the final production. Thus, the literature...
Automatic code graders, also called Programming Online Judges (OJ), can support students and instructors in introduction to programming courses (CS1). Using OJs in CS1, instructors select problems to compose assignment lists, whereas students submit their code solutions and receive instantaneous feedback. Whilst this process reduces the instructors...
Peer feedback has been widely used in computer-supported collaborative learning (CSCL) setting to improve students’ engagement with massive courses. Although the peer feedback process increases students’ self-regulatory practice, metacognition, and academic achievement, instructors need to go through large amounts of feedback text data which is muc...
Educational feedback is essential to help students learn from their mistakes and self-regulate their learning strategies. However, work overload and lack of time are barriers for educators to give quality and timely feedback, particularly for written assessments. Software tools to support feedback processes typically focus on automatic messages, la...
Este artigo busca demonstrar como a Taxa de Distorção Idade-série (TDI) pode ser utilizada para acompanhar o cenário da educação brasileira utilizando dados abertos. É apresentado também como esses dados podem ser adquiridos, processados e classificados de modo a fornecer um panorama dessa taxa para municípios brasileiros. Com apenas o indicador TD...
O Plano Nacional de Educação (PNE) tem como objetivo central orientar o desenvolvimento da educação no país e seu monitoramento se caracteriza como uma atividade fundamental para a gestão educacional. Para realizar esse monitoramento se fazem necessárias soluções que forneçam um conjunto de dados confiável e capaz de auxiliar na tomada de decisão b...
A área de Inteligência Artificial (IA) tem potencial para melhorar o ensino e a aprendizagem, por exemplo, por meio da análise de dados produzidos em ambientes educacionais. Além disso, também pode agravar a desigualdade, pois exige que alunos e instrutores tenham acesso à infraestrutura (smartphones ou computadores) exigida pela maioria dessas fer...
Applying artificial intelligence in education is relevant to addressing the current educational crises. Many available solutions apply Convolutional Neural Networks (CNNs) to help improve educational outcomes. Therefore, a series of works have been developed integrating techniques in different educational contexts, for instance, in online teaching...
One factor that impacts the quality of Brazilian education is the quality of books and other didactic materials freely distributed throughout the country to public schools, thanks to the Brazilian National Textbook Program. The current evaluation process may take at least two years to complete, involving hundreds of people, and the final result may...
Textual cohesion is an essential aspect of a formally written text, related to linguistic mechanisms that connect elements such as words, sentences, and paragraphs.
Several studies have proposed approaches to estimate textual cohesion in essays automatically. There is limited research that aims to study the extent to which the use of machine learn...
Feedback is an effective way to assist students in achieving learning goals. The conceptualisation of feedback is gradually moving from feedback as information to feedback as a learner-centred process. To demonstrate feedback effectiveness, feedback as a learner-centred process should be designed to provide quality feedback content and promote stud...
Feedback is an effective way to assist students in achieving learning goals. The conceptualisation of feedback is gradually moving from feedback as information to feedback as a learner-centred process. To demonstrate feedback effectiveness, feedback as a learner-centred process should be designed to provide quality feedback content and promote stud...
A distribuição de candidatos em locais de provas é um problema logístico relevante e afeta diversos países, inclusive o Brasil, que realizam exames de seleção por meio de avaliações presenciais. Definir uma distribuição adequada considerando critérios como distância, custo e ocupação é uma tarefa desafiadora. Este trabalho trata a tarefa em questão...
Os chatbots são ferramentas que utilizam inteligência artificial para simular uma conversação humana. Eles podem ser utilizados para diferentes aplicações, como fornecer atendimento dentro de um e-commerce, preenchimento de formulários ou responder a FAQs (Frequently Asked Questions). Este trabalho propõe o desenvolvimento de um chatbot para auxili...
Punctuation Restoration is an essential post-processing task of text generation methods, such as Speech-to-Text (STT) and Machine Translation (MT). Usually, the generation models employed in those tasks produce unpunctuated text, which is difficult for human readers and might degrade the performance of many downstream text processing tasks. Thus, m...
The graphical treatment of data reveals information contained in raw data, facilitating comprehension and production of knowledge. There is a growing interest in data in the field of education, aiming at improving the quality of education systems. In particular, there are several platforms with data related to the National Education Plan (PNE), fac...
A adoção de Learning Analytics (LA) em Instituições de Ensino Superior (IES) é considerada uma tarefa desafiadora, por sugerir mudanças na estrutura da IES e abranger atividades em diversos setores do sistema de ensino. Compreender o nível de maturidade dos projetos de LA existentes dentro das IES torna-se fundamental para que as instituições consi...
A utilização de Learning Analytics (LA) traz consigo diferentes benefícios às instituições de ensino. Porém, exige recursos computacionais e de internet inacessíveis às populações de baixa renda, tornando esta uma tecnologia que pode gerar desigualdade. Nesse contexto, este artigo tem dois objetivos: (i) apresentar o conceito de LA Desconectada, qu...
O feedback dado por professores a estudantes sobre atividades avaliativas é fundamental para a construção do conhecimento e compreensão acerca de sua trajetória de aprendizagem. Entretanto, frequentemente professores não conseguem fornecer feedback de qualidade e em tempo hábil, devido à sobrecarga de trabalho e à falta de tempo, gerando frustração...
A correção automática de redações é um problema que vem sendo bastante explorado nos últimos anos. Um dos aspectos mais desafiadores nessa tarefa é avaliação do nível de domínio do aluno quanto aos mais variados tipos de estruturas textuais. A estrutura narrativa é um caso especialmente complexo devido ao seu caráter extremamente subjetivo. Trabalh...
O feedback é um fator muito importante no processo de ensino-aprendizagem e crucial na Educação a Distância, pois, como professores e alunos estão separados no espaço e/ou tempo, é através do feedback que o aluno vai entender como está o seu desempenho na disciplina e quais são os próximos passos do aprendizado. Existem na literatura modelos de fee...
O Plano Nacional de Educação (PNE) define metas e indicadores relacionados à educação, que devem ser observados pelos gestores dos entes federados do Brasil. No caso do gestor municipal, observar práticas de município com características parecidas e que tenham obtido resultados melhores nos indicadores do PNE, pode auxiliar na decisão sobre a utili...
A internet trouxe inúmeras vantagens quando a questão é facilitar o acesso a informação. Porém, um problema comum que dificulta o acompanhamento dos professores é a sobrecarga de informações. Com intuito de mitigar isto, este artigo realiza agrupamentos utilizando os algoritmos K-Means, K-Medoids e o Aglomerativo em 1652 postagens de 4 fóruns educa...
A correção de redação é um trabalho manual recorrente do professor para avaliar o domínio da escrita do aluno na educação básica. A coesão é um aspecto fundamental do texto, visto que auxilia na relação de sentido. Tratar de forma automática a coesão em redações da língua portuguesa é um desafio na área de Processamento de Linguagem Natural (PLN)....
O interesse pela ciência de dados vêm crescendo nos últimos anos em todas as áreas, sejam STEM ou não-STEM. Alunos não-STEM muitas vezes apresentam dificuldades em programação, mas tem facilidade na absorção ao se utilizar ferramentas visuais. Assim, para este grupo específico utilizar ferramentas vêm se demonstrando essencial para o ensino de ciên...
Coesão textual é uma propriedade fundamental da escrita formal, pois tem relação com a conexão harmoniosa dos elementos de um texto. Apesar de diversos trabalhos analisarem automaticamente a coesão textual em redações, ainda são escassos trabalhos para o português. Este trabalho investiga modelos de regressão para estimar a coesão textual de redaçõ...
A classificação de textos considerando tipos textuais é de suma importância para algumas aplicações de Processamento de Linguagem Natural (PLN). Nos últimos anos, algoritmos de aprendizado de máquina têm obtido bons resultados nesta tarefa considerando textos em inglês. No entanto, pesquisas voltadas para a detecção de tipos textuais escritos em po...
In learning processes, feedback given by instructors is essential to guide students and help them improve from their mistakes. However, in higher education, instructors feel unable to give quality and timely feedback due to work overload and lack of time. As online classes became dominant due to the Covid 19 pandemic, and with increasing numbers of...
A produção de texto é uma tarefa imprescindível para os estudantes do Ensino Fundamental (EF). O texto narrativo é abordado nessa etapa de ensino. Os professores, na correção dos textos, precisam identificar manualmente os elementos dos textos narrativos, o que pode gerar uma sobrecarga e dificultar um feedback personalizado. Prover a identificação...
Open government data (OGD) is increasingly being deployed in many countries. It is often considered a pillar of democracy by providing society with transparency and accountability for public policies and actions. However, the role of OGD in policy-making monitoring has been explored only marginally due to its complexity and inter-organizational bou...
Self-reflection and reflective writing have been pivotal for developing a deep understanding of concepts and fostering professional competency in learners. The confluence of the importance of reflective practices within the educational curriculum and the increased proliferation of technology have resulted in numerous studies of how to use automated...
O Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (INEP) disponibiliza o Censo da Educação Básica, o maior levantamento anual de dados sobre a educação brasileira. Os dados são disponibilizados anualmente e com cerca de 370 colunas e pouco mais de 230 mil registros por ano. Este trabalho apresenta o processo que foi utilizado...
Neste estudo busca-se solucionar a falta de dados de estimativas populacionais segmentadas por município e idade, no período de 2014 a 2020 para todos os municípios do Brasil, através da criação de um Dataset que fornece estes dados de forma estruturada e enriquecida com características para facilitar seu reuso, partindo de dados oficiais como do I...
Assessments are crucial to measuring student progress and providing constructive feedback. However, the instructors have a huge workload, which leads to the application of more superficial assessments that, sometimes, does not include the necessary questions and activities to evaluate the students adequately. For instance, it is well-known that ope...
O objetivo do presente artigo é propor visualizações automáticas de avaliações de atividades feitas no Scratch, a fim de dar suporte para os professores no acompanhamento do aprendizado dos alunos. Foram geradas visualizações gráficas a partir de atividades de programação básica realizadas no Scratch com alunos do 2º ao 5º ano do ensino fundamental...
A evasão e a retenção são problemas recorrentes em cursos de graduação, que podem trazer prejuízos às universidades. A análise de sobrevivência permite buscar soluções para resolver esses problemas com antecedência, através da verificação da influência de eventos, como a evasão, conclusão e vínculo estudantil, de acordo com o tempo e a probabilidad...
In learning processes, feedback given to students by instructors is essential to guide students and help them improve from their mistakes. However, in higher education, instructors feel unable to give quality and timely feedback due to work overload and lack of time. As online classes became common due to the Covid 19 pandemic, and with increasing...
Feedback is a crucial element of a student's learning process. It enables students to identify weaknesses and improve self-regulation. However, studies show this to be an area of great dissatisfaction in higher education. With ever-growing course participation numbers, delivering effective feedback is becoming an in-creasingly challenging task. The...
Social presence is an essential construct of the well-known Community of Inquiry (CoI) model, which is created to support design, facilitation, and analysis of asynchronous online discussions. Social presence focuses on the extent to which participants of online discussions can see each other as “real persons” in computer-mediated communication. In...
Randomized controlled trials usually cannot uncover why some participants benefit more or less from an intervention when they do not collect process data during the implementation. Beyond cost concerns, collecting multiple data points during implementation can be unfeasible or potentially harmful when the participants are young children. This resea...
Os métodos Policy Search (PS) vem sendo utilizados nos últimos anos para se aprender, automaticamente, algoritmos de otimização, obtendo resultados animadores. Neste trabalho, consideramos métodos PS para aprender algoritmos de otimização para problemas de otimização global, considerando um cenário pouco estudado: funções de alta dimensionalidade e...
In Brazil, several minority languages suffer a serious risk of extinction. The appropriate documentation of such languages is a fundamental step to avoid that. However, for some of those languages, only a small amount of text corpora is digitally accessible. Meanwhile there are many issues related to the identification of indigenous languages, whic...
O sistema judiciário é composto por inúmeros documentos relacionados a processos jurídicos. Esses documentos podem conter informações relevantes que suportem a tomada de decisão em processos futuros. No entanto, a coleta dessas informações não é uma tarefa trivial. Este artigo propõe o uso de agrupamento para reunir processos semelhantes e facilita...