Someswar Amujala’s research while affiliated with Claremont McKenna College and other places

What is this page?


This page lists works of an author who doesn't have a ResearchGate profile or hasn't added the works to their profile yet. It is automatically generated from public (personal) data to further our legitimate goal of comprehensive and accurate scientific recordkeeping. If you are this author and want this page removed, please let us know.

Publications (2)


Digitization and Data Frames for Card Index Records
  • Article

July 2022

·

9 Reads

·

3 Citations

Explorations in Economic History

Someswar Amujala

·

·

Sanjiv R. Das

We develop a methodology for converting card index archival records into usable data frames for statistical and textual analyses. Leveraging machine learning and natural-language processing tools from Amazon Web Services (AWS), we overcome hurdles associated with character recognition, inconsistent data reporting, column misalignment, and irregular naming. In this article, we detail the step-by-step conversion process and discuss remedies for common problems and edge cases, using historical records from the Reconstruction Finance Corporation.


Citations (1)


... Les taules han estat transcrites automàticament mitjançant la intel·ligència artificial i l'extractor de text AWS Textract, que utilitza la computació en línia i algoritmes predefinits OCR o Optical Character Recognition per a l'aprenentatge automàtic i el reconeixement de caràcters escrits en fons documentals de diversa naturalesa (Amujala et al., 2023;Correia i Luck, 2023). Textract és especialment sensible a la transcripció de documents històrics que no poden ser transcrits de manera automàtica o semiautomàtica amb altres eines ofimàtiques més habituals, com és el cas de les còpies digitals dels oficis mecanografiats del CTV (Figura 3). ...

Reference:

L'últim front al Maresme: la batalla del Turó del Balís a finals de gener de 1939
Digitization and Data Frames for Card Index Records
  • Citing Article
  • July 2022

Explorations in Economic History