Pedro Univaso

Pedro Univaso
Pontifical Catholic University of Argentina | UCA · Departamento de Ingeniería en Informática

Doctor of Engineering
Forensic Speaker Verification

About

42
Publications
26,919
Reads
How we measure 'reads'
A 'read' is counted each time someone views a publication summary (such as the title, abstract, and list of authors), clicks on a figure, or views or downloads the full-text. Learn more
51
Citations
Introduction
I am currently involved in the launch of BlackVOX, a technology-based Argentine company, incubated in the Sensory Research Laboratory (INIGEM, CONICET-UBA), which provides technological tools for the forensic identification of speakers. During its incubation it received the support of the Ministry of Science, Technology and Productive Innovation and the granting of a research and development project for the "Development of objective methods for the recognition of the speaker" whose adopting agent was the Argentine National Gendarmerie. Now we also work together with the federal police, the ministry of science and justice and the judiciary.
Additional affiliations
September 2020 - present
Universidad Tecnológica
Position
  • Managing Director
Description
  • Curso de certificación de competencias laborales "Identificación Forense por Voz"
September 2017 - present
Austral University (Argentina)
Position
  • Docente
Description
  • Multimedia Data Mining (Maestria en explotación de datos y gestión del conocimiento)
January 2014 - January 2016
Pontifical Catholic University of Argentina
Position
  • Managing Director

Publications

Publications (42)
Article
Full-text available
1  I. INTRODUCCIÓN L reconocimiento del hablante (RH), también conocido como reconocimiento de locutor o de las personas por la voz, es una técnica biométrica de comparación que incluye la verificación o autenticación, identificación y clasificación de una persona por su voz, y por extensión, la segmentación, detección y rastreo de hablantes. El i...
Article
Full-text available
Abstract: In Forensic Speaker Comparison (FSC) several different parameters are commonly analysed. In this investigation we propose a multiparametric system combining long-term features (F0, voice quality and durational aspects) with short-term features (MFCCs), used by a standard automatic system based on i-vector/PLDA approaches (baseline system)...
Preprint
Full-text available
La tarea de los verificadores de hechos (fact checkers) en periodismo es la confirmar y comprobar hechos y datos que se usan en los discursos (sobre todo los políticos) y en los medios de comunicación y otras publicaciones. El propósito es detectar errores, imprecisiones, simulaciones y mentiras (fake news), aunque en actualidad se está comenzando...
Article
Full-text available
Resumen: Objetivo: obtener las distribuciones discriminantes de igual/diferentes hablantes para la tipificación del modelo de voces masculinas para el cálculo del cociente de verosimilitudes (LR). Desarrollo experimental: se inicia con el desarrollo de una base de datos de frases que considera la grabación de 2520 frases en distintas sesiones y gra...
Article
Purpose: To provide voice experts with a method for determining the likelihood ratio (LR) from the perceptual evaluation of distinctive voice attribute scores. The proposed method aims to obtain the similarity and typicality judgments made by forensic voice experts (FVEs) during the comparison of attributes in voice pairs. Method: It is based on t...
Article
Full-text available
Resumen: Objetivo: obtener las distribuciones probabilísticas de las respuestas a la evaluación de pares de voces femeninas provenientes de la misma y diferentes hablantes que permiten desarrollar el método indirecto para el cálculo del cociente de verosimilitudes (LR). Desarrollo experimental: se inicia con la creación de una base de datos que con...
Preprint
Full-text available
Objetivo Difundir a la comunidad de fonoaudiología y peritos de voz el desarrollo de un sistema de transformación de puntajes de atributos en relaciones de verosimilitud Desarrollo La evaluación humana en casos forenses es el complemento necesario de los métodos automáticos y semiautomáticos actuales en la identificación de voces y se suman a los r...
Conference Paper
Full-text available
Resumen. Se presentan los antecedentes históricos que llevaron al desarrollo informático impulsado por el Ministerio de Ciencia, Tecnología e Innovación Productiva y plasmado por el grupo de ingenieros de BlackVOX que crearon el sistema FORENSIA para su empleo en las pericias forenses de voz para la jus-ticia y las fuerzas de seguridad. Los desarro...
Preprint
Full-text available
En la Argentina los casos de identificación de sospechosos por medio de la voz que son solicitados por la justicia son procesados por la Policía Federal Argentina, la Gendarmería Nacional Argentina, y en la provincia de Buenos Aires por la Dirección General de la Asesoría Pericial del Poder Judicial. En el país se realizan trabajos de investigació...
Article
Full-text available
En esta nueva historia analizamos la efectividad en las llamadas telefónicas realizadas a los clientes del banco BPI para la adquisición de plazos fijos. El Banco Portugués de Investimento o BPI es el cuarto mayor banco privado de Portugal y pertenece al Grupo CaixaBank. El objetivo de este caso es incrementar la efectividad, definida como la cant...
Preprint
Full-text available
Detector vocal de COVID (app), alerta temprana de la pandemia, un monitor de epidemias, implementación por los "cuatro tigres asiáticos", Deep Learning, aplicaciones telefónicas, imágenes de escáner, avisos automáticos por email, detección de cercanía y el Proyecto Global Virome.
Preprint
Full-text available
Bajo el nombre de “Verificación de causas climáticas en el aumento de enfermedades fúngicas en la producción de peras y nueces en el Alto Valle de Río Negro” un grupo de la segunda cohorte del año 2019 presentó el siguiente trabajo final. El grupo estuvo conformado por: Mariana Greco, Edith Zima, Facundo Segura, Ignacio Noli y César Armesto. El ob...
Preprint
Full-text available
El objetivo del presente trabajo es la construcción de un modelo de clasificación supervisada apropiado para la detección de casos sospechosos de fraude en operaciones de venta de planes en telecomunicaciones en una empresa de Argentina. Se propuso como hipótesis lograr una precisión (accuracy) del modelo superior al 80% y un alcance (recall) super...
Preprint
Full-text available
El objetivo del presente trabajo, es construir un modelo de predicción de bajas de afiliados (clientes) para el rubro “medicina prepaga”, a través de la aplicación de las herramientas de Data Mining. Esta necesidad surge, principalmente, de la difícil situación que atraviesa este rubro en nuestro país, la cual produce, que a muchos de los afiliado...
Preprint
Full-text available
En esta serie de artículos de divulgación bajo el título de "historia de datos" presentaremos aplicaciones reales desarrolladas por alumnos de los cursos de "Data Mining y Big Data" organizados por la Facultad de Ingeniería y Ciencias Agrarias de la UCA y dictados durante el período 2017-2019 en el formato on-line. Historia de datos I: Modelo del...
Preprint
Full-text available
El análisis de datos se está convirtiendo en un aspecto central de los deportes profesionales. Deportes como el tenis han comenzado a utilizar los datos como una nueva fuente de ingresos para servir a las empresas de pantalla y juegos de azar. Los datos fueron la materia prima para el análisis y aprendizaje automático y de la misma manera que se es...
Conference Paper
Full-text available
Objetivo Presentar a los auxiliares de la justicia, jueces, secretarios, defensores, fiscales y peritos una guía de buenas prácticas para la solicitud y realización de las pericias de identificación forense de voces. Se espera que esta guía permita la homogeneización de los pasos y reglas a seguir para lograr mayor certidumbre en todas las instanci...
Thesis
Full-text available
Some of the most popular applications of speaker recognition are: financial, forensic and legal, security, audio and video indexing, surveillance, teleconferencing, and e-learning. This work focuses on forensic applications, and seeks to improve automatic speaker recognition systems by incorporating distinctive long-term features to actual short-te...
Poster
Full-text available
Las imágenes satelitales se han convertido en herramientas de uso masivo en los últimos años. En particular el programa Google Earth es una aplicación que ha masificado el acceso a imágenes aéreas y satelitales de todo el mundo con el único requisito de tener una conexión de Internet de banda ancha y un dispositivo computacional (móvil o de escrito...
Preprint
Full-text available
In Forensic Speaker Comparison (FSC) several different parameters are commonly analysed. In this investigation we propose a multiparametric system combining long-term features (f0, voice quality and durational aspects) with short-term features (MFCCs), used by a standard automatic system based on i-vector/PLDA approaches (baseline system). The obje...
Preprint
Full-text available
The objective of this work is to analyze the characteristics of the samples the judge send to the forensic laboratories for comparison. We have not found works that analyze in particular known and unknown voices present in real forensic speaker recognition. Their linguistic and acoustic characteristics, as well as the audio signals, differ from eac...
Data
This forensic speaker identification system was presented for the Speakers in the Wild (SITW) speaker recognition challenge 2016, hosted by SRI International and verified with data from NIST HASR 2012 evaluation.
Article
Full-text available
Tanto la comunidad forense como la jurídica abogan por tener una metodología unificada para la interpretación de la fuerza de la evidencia científica. La recomendación para que el perito empleen cocientes de verosimilitudes (factor de Bayes) independiza los resultados del tipo de análisis forense y la técnica empleada, y permite hacerlos más compre...
Article
Full-text available
Multimedia Data Mining es la combinación de dos áreas emergentes: multimedia y data mining. Cada una de estas jóvenes áreas multidisciplinarias, que comenzaron en el principio de los años 90, ha evolucionado simultáneamente con grandes avances actuales. Cuando hablamos de Multimedia nos estamos refiriendo a la combinación de diversos medios de exp...
Article
Full-text available
This paper presents an overview of the methodologies used in the forensic field for the identification of speakers. First, an introduction shows the interest of the forensic community in speaker recognition and its limitations. Then the history of the evolution of speaker recognition systems -from Bell Laboratories in the fifties to current i-vecto...
Data
Full-text available
While the forensic and judicial community advocate a unified methodology for the identification of speakers, the market with its need for differentiation and the scientific field with its vertiginous progress are opposed with indifference to that longing. This paper proposes a methodology that includes as broadly as possible all the technologies av...
Article
Full-text available
Resumen— Mientras la comunidad forense y judicial abogan por tener una metodología unificada para la identificación de hablantes, el mercado con su necesidad de diferenciación y el ámbito científico con su vertiginoso avance se contraponen con indiferencia a ese anhelo. En este trabajo se propone una metodología que incluya de la forma más amplia p...
Data
Full-text available
1  I. INTRODUCCIÓN L reconocimiento del hablante (RH), también conocido como reconocimiento de locutor o de las personas por la voz, es una técnica biométrica de comparación que incluye la verificación o autenticación, identificación y clasificación de una persona por su voz, y por extensión, la segmentación, detección y rastreo de hablantes. El i...
Data
Full-text available
En la Argentina los casos de identificación de sospechosos por medio de la voz que son solicitados por la justicia son procesados por la Policía Federal Argentina, la Gendarmería Nacional Argentina, y en la Pcia. de Buenos Aires por la Dirección General de la Asesoría Pericial del Poder Judicial. La Policía Federal Argentina, a través del Gabinete...
Research
Full-text available
Pedro Univaso, Jorge Gurlekian y Diego Evin. Revista Clepsidra Nro. 8, pp. 13-22, Universidad Autónoma de Colombia, 2009.
Research
Full-text available
“Reconocedor de habla continua independiente del contexto para el español de Argentina”, Pedro Univaso, Jorge Gurlekian y Diego Evin. Revista Clepsidra Nro. 8, pp. 13-22, Universidad Autónoma de Colombia, 2009.
Article
Full-text available
In this paper we analyze the advantages of using data mining techniques and tools for data fusion in forensic speaker recognition. Segmental and suprasegmental features were employed in 28 different classifiers, in order to compare their performances. The selected classifiers have different learning techniques: lazy or instance-based, eager and ens...
Article
Full-text available
This paper focuses on the analysis of the discriminative power of the sibilant fricative /s/, in order to incorporate this knowledge in future automatic speaker recognition systems. The selected fricative is the most frequent consonant in the corpus. An acoustical parameter ranking of /s/ was performed based on minor intra-speaker variability and m...
Article
Full-text available
This work proposes a method for human assisted speaker recognition using an ASR system based on HMMs. Manual transcriptions are first marked at the word level and then coded by an automatic phonetic transcriptor. An initial forced alignment is made using a speaker-independent model. After this a second forced alignment is performed using each speak...
Conference Paper
Full-text available
En el año 2007, en el marco del convenio de colaboración entre la Universidad Austral y el Instituto Argentino para la Calidad, se realizó una encuesta de opinión dirigida a responsables de calidad de empresas argentinas, cubriendo distintos aspectos relacionados con la implementación de Seis Sigma. Desde principios de los 90 Seis Sigma ha ganado p...
Conference Paper
Full-text available
Resumen. En este trabajo se propone discriminar la información de los acentos lexicales para construir modelos acústicos en un sistema de reconocimiento automático del habla. Se estudia y compara el desempeño del modelo propuesto con respecto al modelado acústico estándar empleando como material de evaluación habla telefónica leída para el Español...
Article
Full-text available
This paper presents the results obtained with a continuous speech recognition system for Argentine Spanish. The word-based recognizer used context-independent units, monophones, as basic units of the acoustical model. Modeling used three left-to-right states semi-continuous Hidden Markov Models SC-HMM associated to 31 monophones (30 phonemes and a...
Article
Full-text available
Due to the difficulties in the recognition of quite similar utterances, such as CV syllables with the same vowel, a two‐step approach was proposed. In the first step the normalized log energy, 32 spectral band log energies, and the spectral change were used through a DP algorithm to determine: (a) one of the five broad acoustic classes of the conso...

Network

Cited By

Projects

Projects (4)
Project
Certify the suitability of forensic experts in the perceptual verification of speakers.
Project
Explore actual Data Mining applications in different fields.
Project
Fact-checkers usually roll their eyes when they need to verify an audio file extracted from WhatsApp. They know it’s a time-consuming task and there is a lack of tools to help them reach a verdict about the voice they hear. This scenario, however, has just changed. Forensia is up and running in Buenos Aires, and ready to work in Saxon and Romance languages, a forensic software used for fact-checking.