Diego Mariano

Diego Mariano
Federal University of Minas Gerais | UFMG · Departamento de Ciência da Computação

PhD

About

78
Publications
20,966
Reads
How we measure 'reads'
A 'read' is counted each time someone views a publication summary (such as the title, abstract, and list of authors), clicks on a figure, or views or downloads the full-text. Learn more
277
Citations
Additional affiliations
April 2019 - present
Federal University of Minas Gerais
Position
  • PostDoc Position
February 2013 - April 2015
Federal University of Minas Gerais
Position
  • Master's Student
Education
March 2015 - February 2019
Federal University of Minas Gerais
Field of study
  • Bioinformatics

Publications

Publications (78)
Article
Full-text available
Petroleum is the most-used energy source in the world. However, as you probably know, petroleum is a fossil fuel that is very harmful to the environment, in addition to not being renewable. Biofuels are a type of fuel produced from plant material. Biofuels are considered an excellent alternative energy source because they are less polluting than fo...
Article
Full-text available
Hearing loss is one of the most common sensory defects, affecting 5.5% of the worldwide population and significantly impacting health and social life. It is mainly attributed to genetic causes, but their relative contribution reflects the geographical region’s socio-economic development. Extreme genetic heterogeneity with hundreds of deafness genes...
Article
Full-text available
Background The SARS-CoV-2 pandemic reverberated, posing health and social hygiene obstacles throughout the globe. Mutant lineages of the virus have concerned scientists because of convergent amino acid alterations, mainly on the viral spike protein. Studies have shown that mutants have diminished activity of neutralizing antibodies and enhanced aff...
Book
Full-text available
Bootstrap é um dos mais populares frameworks para construção de sites responsíveis compatíveis tanto com computadores desktop, smartphones ou dispositivos com telas de diversos tamanhos. Em sua quinta versão, Bootstrap traz uma série de novidades, como nomes de classes mais simplificados, novos recursos em JavaScript (jQuery não é mais necessário)...
Article
Full-text available
Evolutionarily related proteins can present similar structures but very dissimilar sequences. Hence, understanding the role of the inter-residues contacts for the protein structure has been the target of many studies. Contacts comprise non-covalent interactions, which are essential to stabilize macromolecular structures such as proteins. Here we sh...
Article
Full-text available
Bioinformatics is a fast-evolving research field, requiring effective educational initiatives to bring computational knowledge to Life Sciences. Since 2017, an organizing committee composed of graduate students and postdoctoral researchers from the Universidade Federal de Minas Gerais (Brazil) promotes a week-long event named Summer Course in Bioin...
Chapter
A realização de cálculos complexos e análises estatísticas era um dos principais objetivos da criação dos computadores. Entretanto, para isso, caberia aos especialistas da época, matemáticos, estatísticos e cientistas da computação em geral, aprender linguagens de programação para que a implementação desses cálculos fosse viável. Entretanto, as lin...
Article
Full-text available
Augmented Reality (AR) integrates virtual objects into real environments using computer graphics techniques. The use of such techniques may benefit growing areas, such as bioinformatics, generating understandable and impactful 3D visualizations of biomolecules. Bioinformatics is a field of science that integrates computer science with the biologica...
Chapter
Full-text available
Alinhamento estrutural consiste na tentativa de encontrar semelhanças entre duas estruturas tridimensionais de moléculas, como por exemplo, peptídeos, ligantes e proteínas. A estrutura tridimensional de proteínas está estritamente ligada à sua atividade biológica em uma célula. Portanto, conhecer a estruturadas proteínas e poder encontrar equivalê...
Chapter
Full-text available
Compreender como as moléculas se comportam pode ser essencial para desvendar seus mecanismos de atuação, o que pode ter diversas utilidades no campo da biologia, como por exemplo, descoberta de novos medicamentos e outros produtos biotecnológicos. Quando falamos sobre comportamento e mecanismo de ação de uma molécula, estamos nos referindo a sua mo...
Chapter
Full-text available
Ao construir um classificador usando machine learning, um desenvolvedor deve se perguntar o quão bom é seu modelo para predição. Assim, ao treinar um modelo de aprendizagem algumas métricas podem ser utilizadas para avaliação. A métrica utilizada para determinação do “melhor modelo” depende do problema analisado. Neste artigo, veremos as principais...
Chapter
Full-text available
A bioinformática como área de pesquisa tem crescido exponencialmente nos últimos tempos. Entretanto, ainda há uma lacuna de material de estudo escrito em língua portuguesa. Neste livro, apresentamos o primeiro resultado do projeto BIOINFO. BIOINFO é um projeto amplo que engloba um portal, uma rede de divulgação e uma revista digital focada em publi...
Chapter
Full-text available
Devido ao advento da pandemia de COVID-19, eventos acadêmicos passaram a ocorrer em plataformas online. Entretanto, diferente dos eventos presenciais, eventos pela internet limitam a interação entre participantes. Aqui, é apresentada uma estratégia de gamificação usada para ampliar o engajamento dos participantes durante o I Workshop Online de Bioi...
Chapter
Full-text available
A bioinformática como área de pesquisa tem crescido exponencialmente nos últimos tempos. Entretanto, ainda há uma lacuna de material de estudo escrito em língua portuguesa. Neste livro, apresentamos o primeiro resultado do projeto BIOINFO. BIOINFO é um projeto amplo que engloba um portal, uma rede de divulgação e uma revista digital focada em publi...
Chapter
Full-text available
Cobertura é um conceito bastante citado quando se trata desequenciamento de genomas. Dependendo do contexto, oconceito de cobertura pode ter diferentes significados, o quepode gerar um pouco de confusão. Neste artigo, serãoapresentadas terminologias para diferenciar os dois tipos de cobertura:vertical e horizontal. Em sequenciamento NGS, cobertura...
Book
Full-text available
A bioinformática como área de pesquisa tem crescido exponencialmente nos últimos tempos. Entretanto, ainda há uma lacuna de material de estudo escrito em língua portuguesa. Neste livro, apresentamos o primeiro resultado do projeto BIOINFO (www.bioinfo.com.br). BIOINFO é um projeto amplo que engloba um portal, uma rede de divulgação e uma revista d...
Article
Toxicology is a field of science that has undergone changes in recent years. Using modern sequencing technologies, it went from an exclusive animal-based science to a field of data-based decision making. Many databases store important data about toxicology experiments, which can be useful to understand the mechanisms concerning chemical product tox...
Article
Full-text available
Background Protein–peptide interactions play a fundamental role in a wide variety of biological processes, such as cell signaling, regulatory networks, immune responses, and enzyme inhibition. Peptides are characterized by low toxicity and small interface areas; therefore, they are good targets for therapeutic strategies, rational drug planning and...
Book
Full-text available
No mundo moderno, a ciência surge como um elemento transformador para sociedade. Ao cientista, é atribuída a missão de compreender problemas que afetam as pessoas e propor soluções a partir de suas observações e experimentos. Além disso, não se deve esquecer que também é tarefa do cientista documentar seus achados, garantindo assim que o conhecimen...
Conference Paper
Bioinformatics is an interdisciplinary research field that aims to analyze biological data through computational approaches. In the last years, the evolution of technological resources has provided a tidal wave of biological data. Consequently, an unprecedented amount of studies using bioinformatics approaches have been released, increasing peer-re...
Book
Full-text available
Seja bem-vindo ao mundo do desenvolvimento de Websites usando WordPress. WordPress é um dos sistemas de gerenciamento de conteúdo mais populares, estando presente em 1 a cada 3 sites disponíveis na Internet. No mundo de hoje, possuir uma página na internet é fundamental para empresas e até mesmo para construir seu portfólio pessoal. Entretanto, mu...
Preprint
Full-text available
Evolutionarily related proteins can present similar structures but very dissimilar sequences. Hence, understanding the role of the inter-residues contacts for the protein structure has been the target of many studies. Contacts comprise non-covalent interactions, which are essential to stabilize macromolecular structures such as proteins. Here we sh...
Preprint
Full-text available
Evolutionarily related proteins can present similar structures but very dissimilar sequences. Hence, understanding the role of the inter-residues contacts for the protein structure has been the target of many studies. Contacts comprise non-covalent interactions, which are essential to stabilize macromolecular structures such as proteins. Here we sh...
Article
Full-text available
Ligand-based screening of large molecular databases can help reduce costs with experiments by filtering and ranking promising compounds in an initial stage of the drug developing process. However, some ligand-based methods can be ineffective when presented with a high-dimensional number of attributes extracted from an extensive dataset of compounds...
Article
Full-text available
Β-glucosidases are key enzymes used in second-generation biofuel production. They act in the last step of thelignocellulose saccharification, converting cellobiose in glucose. However, most of theβ-glucosidases are inhibitedby high glucose concentrations, which turns it a limiting step for industrial production. Thus,β-glucosidases havebeen targete...
Article
Full-text available
Background: Protein engineering has many applications for industry, such as thedevelopment of new drugs, vaccines, treatment therapies, food, and biofuel production.A common way to engineer a protein is to perform mutations in functionally essentialresidues to optimize their function. However, the discoveryof beneficial mutations forproteins is a...
Article
β-glucosidases (EC 3.2.1.21) have been described as essential to second-generation biofuel production. They act in the last step of the lignocellulosic saccharification, cleaving the β-1,4 glycosidic bonds in cellobiose to produce two molecules of glucose. However, β-glucosidases have been described as strongly inhibited by glucose, causing an incr...
Book
Full-text available
Seja bem-vindo ao mundo do desenvolvimento de Websites usando WordPress. WordPress é um dos sistemas de gerenciamento de conteúdo mais populares, estando presente em 1 a cada 3 sites disponíveis na Internet. No mundo de hoje, possuir uma página na internet é fundamental para empresas e até mesmo para construir seu portfólio pessoal. Entretanto, mui...
Chapter
Desde os primórdios da humanidade, os seres humanos buscam prever seu futuro. Os primeiros caçadores-coletores precisavam prever quais regiões eram mais propensas para obter alimento e quais eram mais perigosas. Para os primeiros agricultores, a capacidade de prever as condições climáticas era vital para definir o melhor momento para o plantio e a...
Chapter
Ao lidar com dados do mundo real, não basta ao cientista ter conhecimento das técnicas e dos algoritmos para mineração de dados. Por mais poderoso que um algoritmo seja, o processo de obtenção de conhecimento a partir de dados brutos ainda dependerá da qualidade destes. Mesmo bases de dados obtidas por sistemas altamente precisos ou que passaram po...
Chapter
Neste capítulo, você verá como implementar técnicas de agrupamento usando a linguagem de programação R e o software RStudio. Inicialmente, você conhecerá o algoritmo k-means, um dos mais populares algoritmos de agrupamento, e verá como ele se comporta para agrupar amostras do conjunto de dados iris usando diferentes parâmetros de entrada.
Chapter
Computadores pessoais (PC, do inglês personal computer) são dispositivos vitais no mundo moderno, fazendo parte de diversas tarefas do nosso dia a dia. Em virtude dos sistemas produzidos com interface cada vez amigável, seu funcionamento interno ainda permanece um mistério para a maior parte da população. Neste capítulo, você verá desde o contexto...
Chapter
Um dos pilares da infraestrutura de tecnologia da informação consiste na conceitualização de hardware, descrito como a parte física de um computador, e de software, a parte lógica. No primeiro, estão incluídos equipamentos eletrônicos como placas-mãe, processadores e memórias, além de dispositivos periféricos (p. ex., monitores, impressoras, mouses...
Chapter
Antes de iniciar o processo de descoberta de conhecimento, é necessário ter uma visão geral dos dados. Entretanto, a análise de grandes bases de dados pode ser inviável, uma vez que pode extrapolar a capacidade humana de investigação manual (DA SILVA; PERES; BOSCARIOLI, 2017). Nesse contexto, a análise exploratória de dados surge como uma metodolog...
Chapter
Neste capítulo, será apresentada a importância das ferramentas do processo de busca de conhecimento em bases de dados, mais conhecido como KDD (do inglês knowledge-discovery in databases), seus tipos e exemplos de uso. Ainda, trataremos da tendência recente da virtualização de recursos computacionais para armazenamento e processamento de dados, com...
Chapter
A descoberta de conhecimento em bases de dados (do inglês knowledge discovery in databases, ou KDD) pode ser realizada a partir de grandes bases de dados, sendo muito útil em diversas áreas. Entretanto, antes de aplicar algoritmos de mineração, deve-se atentar a diversos fatores, como seleção de dados, análise descritiva, pré-processamento e pós-pr...
Chapter
Datacenters, também conhecidos como centro de processamento de dados (CPD), são ambientes especialmente projetados para alocação de componentes eletrônicos de alto desempenho, como servidores, roteadores, redes de área de armazenamento, etc., cuja principal função consiste em fornecer um ambiente altamente controlado para processamento e armazename...
Chapter
Nos últimos anos, temos observado uma estrondosa evolução nos dispositivos eletrônicos, desde os primeiros computadores usados para cálculos balísticos até a chegada dos computadores pessoais. Entretanto, essa evolução teve um impacto profundo em nossas vidas quando alterou as formas de comunicação, já que hoje uma pessoa pode contatar outra do out...
Chapter
Ao buscarem uma melhor compreensão e interpretação automatizada de textos, as técnicas de processamento de linguagem natural (PLN) se deparam com o desafio de compreender variações em palavras com sentidos próximos, como no caso da língua portuguesa e de suas diversas formas de flexão verbal e nominal. Nesse contexto, as expressões regulares se apr...
Patent
A presente invenção consiste em um método de triagem de compostos que utiliza um modelo de regressão logística modificada e que permite a utilização de um número superior de atributos (descritores moleculares e/ou físico-químicos e/ou topológicos e/ou estruturais e/ou farmacológicos) em relação ao número de entidades (fármacos ou ligantes), podendo...
Article
Full-text available
Glucosidases are enzymes with high importance for many industrial processes, catalyzing the last and limiting step of the conversion of lignocellulosic material into fermentable sugars for biofuel production. However, β-glucosidases are inhibited by high concentrations of the product (glucose), which limits the biofuel production on an industrial s...
Data
The following are available online at http://www.mdpi.com/1420-3049/24/18/3215/s1. Supplementary PDF file (Figures S1–S13, Tables S1–S6). Video S1: MD of the glucose exit in a glucose-tolerant GH1 β-glucosidase (also available at <https://youtu.be/fzWynXUbdcI>). Video S2: Interactions among glucose, D228, K257, and N312 (also available at <https://...
Article
The advent of the high‐throughput next‐generation sequencing produced a large number of biological data. Knowledge discovery from the huge amount of available biological data requires researchers to develop solid skills in biology and computer science. As the majority of the Bioinformatics professionals are either computer science or life sciences...
Article
Full-text available
With the use of genetic engineering, modified and sometimes more efficient enzymes can be created for different purposes, including industrial applications. However, building modified enzymes depends on several in vitro experiments, which may result in the process being expensive and time-consuming. Therefore, computational approaches could reduce...
Chapter
Neste capítulo, você aprenderá a implementar códigos utilizando a biblioteca jQuery. O jQuery é uma biblioteca rápida, pequena e rica em recursos. Foi criada com o objetivo de simplificar a linguagem JavaScript, tornando o desenvolvimento mais rápido e simplificando a criação de efeitos visuais e de interatividade em sites (SILVA, 2013). Em outras...
Chapter
Arquivos CSS permitem uma melhor organização do código fonte de páginas da internet, armazenando a maior parte de códigos referentes à aparência da página. Neste capítulo, você conhecerá o conceito de CSS e aprenderá a descrever seu funcionamento e suas vantagens. Além disso, saberá como implementar leiautes em HTML com CSS.
Chapter
Formulários permitem que usuários interajam com sistemas Web, estabelecendo conexão entre cliente e servidor. Neste capítulo, você estudará sobre a interligação de páginas da Internet por meio de links. Será mostrado como desenvolver páginas HTML com links e âncoras, assim como com formulários. Você também será capaz de identificar os diferentes ti...
Article
Lately, numerous works have characterized the effectiveness of games in the process of learning. Benefits such as pleasure, stimulation, creativity, and enthusiasm have captivated people's interest in science through interactive games. Hence, many games for teaching subjects in biochemistry have been developed. However, understanding molecular inte...
Poster
Full-text available
Protein engineering is a technique adopted in the production of synthetic proteins (mutants) with a wide range of functionalities for the industry, since the production of new medicines until production of second-generation biofuel. The construction of mutants can improve the stability, solubility, resistance to inhibition, and also keep the activi...
Article
Corynebacterium pseudotuberculosis has been widely studied in an effort to understand its biological evolution. Transcriptomics has revealed possible candidates for virulence and pathogenicity factors of strain 1002 (biovar Ovis). Because C. pseudotuberculosis is classified into two biovars, Ovis and Equi, it was interesting to assess the transcrip...
Poster
Full-text available
Computing contacts in proteins is important to several types of studies from Bioinformatics to Structural Biology. An accurate computation of contacts is essential to correctness and reliability of application involving folding prediction, protein structure prediction, structural quality assessment, network contacts analysis, thermodynamic stabilit...
Article
Full-text available
β-glucosidases are enzymes that catalyze the hydrolysis of oligosaccharides and disaccharides, such as cellobiose. These enzymes play a key role in cellulose degrading, such as alleviating product inhibition of cellulases. Consequently, they have been considered essential for the biofuel industry. However, the majority of the characterized β-glucos...
Technical Report
Full-text available
Bioinformatics research depends on high-quality databases to provide accurate results. In silico experiments, correctly performed, may prospect novel discoveries and elucidates pathways for biological experiments through data analysis in large scale. However, most biological databases have presented mistakes, such as data incorrectly classified or...
Article
Full-text available
Bioinformatics research depends on high-quality databases to provide accurate results. In silico experiments, correctly performed, may prospect novel discoveries and elucidates pathways for biological experiments through data analysis in large scale. However, most biological databases have presented mistakes, such as data incorrectly classified or...
Poster
Full-text available
Bioinformática é uma área de pesquisa que engloba a ciência da computação e a biologia molecular, além de outras áreas como matemática, engenharias, química e física. A Bioinformática tem por objetivo usar técnicas computacionais para desvendar padrões em grandes bases biológicas, e assim, elucidar caminhos para experimentos em bancada.
Article
Full-text available
Pasteurella multocida is one of the most frequently isolated bacteria in acute pneumonia cases, being responsible for high mortality rates in Peruvian young alpacas, with consequent social and economic costs. Here we report the genome sequence of P. multocida strain UNMSM, isolated from the lung of an alpaca diagnosed with pneumonia, in Peru. The g...
Book
Full-text available
Olá mundo! Anteriormente aprendemos Python e sua robusta biblioteca Biopython. A seguir vimos Perl, uma linguagem poderosa para processamento de texto. Sempre imaginei a série de livros “Introdução à Programação para Bioinformática” como uma trilogia. Falar de linguagens para Web talvez seja a melhor maneira de encerrá-la. Neste livro aprenderemos...
Article
Full-text available
Background The evolution of Next-Generation Sequencing (NGS) has considerably reduced the cost per sequenced-base, allowing a significant rise of sequencing projects, mainly in prokaryotes. However, the range of available NGS platforms requires different strategies and software to correctly assemble genomes. Different strategies are necessary to pr...
Article
Full-text available
Corynebacterium pseudotuberculosis strain VD57 (Cp_VD57), a highly virulent, nonmotile, non-sporulating, and a mesophilic bacterium, was isolated from a goat's granulomatous lesion in the municipality of Juazeiro, Bahia State, Brazil. Here, we describe a set of features of the strain, together with the details of its complete genome sequence and an...
Article
Full-text available
Streptococcus agalactiae, also referred to as Group B Streptococcus, is a frequent resident of the rectovaginal tract in humans, and a major cause of neonatal infection. The pathogen can also infect adults with underlying disease, particularly the elderly and immunocompromised ones. In addition, S. agalactiae is a known fish pathogen, which comprom...
Article
Full-text available
We present here the genome sequence of the attenuated Corynebacterium pseudotuberculosis strain T1. The sequencing was performed with an Ion Torrent Personal Genome Machine platform. The genome is a circular chromosome of 2,337,201 bp, with a G+C content of 52.85% and a total of 2,125 coding sequences (CDSs), 12 rRNAs, 49 tRNAs, and 24 pseudogenes.
Article
Full-text available
Corynebacterium ulcerans is an emergent pathogen infecting wild and domesticated animals worldwide that may serve as reservoirs for zoonotic infections. In this study, we present the draft genome of C. ulcerans strain 03-8664. The draft genome has 2,428,683 bp, 2,262 coding sequences, and 12 rRNA genes.
Article
Full-text available
In this work, we describe a set of features of Corynebacterium auriscanis CIP 106629 and details of the draft genome sequence and annotation. The genome comprises a 2.5-Mbp-long single circular genome with 1,797 protein-coding genes, 5 rRNA, 50 tRNA, and 403 pseudogenes, with a G+C content of 58.50%.
Article
Full-text available
Background: Studies have detected mis-assemblies in genomes of the species Corynebacterium pseudotuberculosis. These new discover have been possible due to the evolution of the Next-Generation Sequencing platforms, which have provided sequencing with accuracy and reduced costs. In addition, the improving of techniques for construction of high accu...
Article
Full-text available
Here, we present the draft genome of toxigenic Corynebacterium ulcerans strain 04-7514. The draft genome has 2,497,845 bp, 2,059 coding sequences, 12 rRNA genes, 46 tRNA genes, 150 pseudogenes, 1 clustered regularly interspaced short palindromic repeat (CRISPR) array, and a G+C content of 53.50%.
Article
Full-text available
Corynebacterium ulcerans is a pathogenic bacterium infecting wild and domesticated animals; some infection cases in humans have increased throughout the world. The current study describes the draft genome of strain 04-3911, isolated from humans. The draft genome has 2,492,680 bp, 2,143 coding sequences, 12 rRNA genes, and 50 tRNA genes.
Article
Full-text available
Here, we present the genome sequence of Corynebacterium ulcerans strain FRC11. The genome includes one circular chromosome of 2,442,826 bp (53.35% G+C content), and 2,210 genes were predicted, 2,146 of which are putative protein-coding genes, with 12 rRNAs and 51 tRNAs; 1 pseudogene was also identified.
Book
Full-text available
Este é o segundo livro da série "Introdução à Programação para Bioinformática". Nesta edição abordaremos a linguagem de programação Perl e a biblioteca BioPerl. Assim, este livro se destina a profissionais de diversas formações que necessitem analisar dados biológicos, tais como bioinformatas, biólogos, geneticistas, biomédicos, microbiologistas,...
Poster
Full-text available
In this work, we propse a Web tool called POTTER (PrOtein muTaTion viewER), for point mutations analysis and visualization in wild and mutant proteins.
Poster
Full-text available
In this work, we propose an analysis of collected beta-glucosidase structures to detect patterns that can be used to engineering beta-glucosidases with high catalytic efficiency. We also aim to detect possible glucose-tolerant beta-glucosidases in data obtained from high-throughput platforms of sequencing.
Article
Full-text available
Unlabelled: The newest technologies for DNA sequencing have led to the determination of the primary structure of the genomes of organisms, mainly prokaryotes, with high efficiency and at lower costs. However, the presence of regions with repetitive sequences, in addition to the short reads produced by the Next-Generation Sequencing (NGS) platforms...
Article
Full-text available
We present here the complete genome sequence of Corynebacterium pseudotuberculosis strain 12C, isolated from a sheep abscess in the Brazil. The sequencing was performed with the Ion Torrent Personal Genome Machine (PGM) system, a fragment library, and a coverage of ~48-fold. The genome presented is a circular chromosome with 2,337,451 bp in length,...
Article
Full-text available
Organisms utilize a multitude of mechanisms for responding to changing environmental conditions, maintaining their functional homeostasis and to overcome stress situations. One of the most important mechanisms is transcriptional gene regulation. In-depth study of the transcriptional gene regulatory network can lead to various practical applications...