
Rajendran Sankaravelayuthan- BSc, MA and PhD in linguistics
- Professor at Amrita Vishwa Vidyapeetham
Rajendran Sankaravelayuthan
- BSc, MA and PhD in linguistics
- Professor at Amrita Vishwa Vidyapeetham
About
237
Publications
476,210
Reads
How we measure 'reads'
A 'read' is counted each time someone views a publication summary (such as the title, abstract, and list of authors), clicks on a figure, or views or downloads the full-text. Learn more
850
Citations
Introduction
Rajendran Sankaravelayuthan was born to his parents C. Sankaravelayuthan and N. Thanammal on 3rd December 1950 at Nagercoil, Tamilnadu, India. He had his schooling from Scott Christian Higher Secondary school, Nagercoil, Tamilnadu. He was graduated from S.T.Hindu College, Nagercoil which is affiliated to Madurai Kamaraj University. He had his M.A. in linguistics from University of Kerala at Trivandrum in 1973 and PhD from University of Poona at Pune in 1978.
Current institution
Publications
Publications (237)
This is a review of a dictionary titled tamiz veeLaaN kalaiccoRkaLin vaTTaara veeRupaaTTu akaraati (A dictionary of Tamil Agricultural vocabulary - Regional Variations) The compilers of the dictionary are N.Rajasekharan Nair , S.Raja , S.Sundarabalu published in 2022. Pp, 328, Rs.390, Kalachuvadu publications, 669 K.P Road Nagercoil – 629 001.
Tam...
This paper aims to summarize the NLP-based technological development of the Tamil language. Tamil is one of the Dravidian languages that are serious about technological development. This phenomenon is reflected in its activities in developing language technology tools and the resources made for technological development. Tamil has successfully deve...
இச்சிற்றேடு செம்மொழித் தமிழாய்யு மத்திய நிறுவனத்தில் "தமிழ் வினையடிகளின் வரலாற்று மொழியியல் ஆய்வு (A Historical Linguistic Analysis of Tamilverbal Bases)" என்ற தலைப்பில் 2008-இல் சமர்ப்பிக்கப்பட்ட ஆய்வேட்டின் (இராசேந்திரன் 2008) ஒரு பகுதியாகும். இவ்வாய்வில் முதலில் வினை அடிகள் அவற்றின் உருனியல், உருபொலியனியல் பண்புக்கூறுகள் அடிப்படையில் வகைப்பாடு ச...
வினையடிகளின் அமைப்பும் ஆக்கமும் விளக்கப்படும். இங்கு தனிநிலை அடிகள், கூட்டுநிலை அடிகளுக்கு எதிராகக் கருத்தில் கொள்ளப்பட்டு தனிநிலை வினைகளின் அமைப்பும் ஆக்கமும் மட்டுமே கருத்தில் கொள்ளப்பட்டுள்ளன. தனிநிலை அடி என்பதை வருணனை நிலையில் எந்த வினையாக்க உருபனின் இடையீடுமின்றி காலம், வினைநோக்கு மற்றும் வினையாற்றுவகை ஒட்டுகளால் நேரடியாகத் திரிபுறுவனவாகும் என...
இங்கு வினையடிகளை அதன் அசையமைப்புச்சாத்தியம் அடிப்படையில் ஆய்வு மேற்கொள்ளப்பட்டுள்ளது. வினைகளை அசைகள் அடிப்படையில் இரு பகுதிகளாகப் பகுக்கப்பட்டு, முதல் பகுதியில் வரும் அசைகளின் அல்லது எழுத்தக்களின் சாத்தியங்களின் அடிப்படையில் வினையடிகள் இங்கு ஆயப்பட்டுள்ளன. தமிழில் 12 உயிர்களும் ஏழு மெய்களும் (க், ச், த், ந், ப், ம், வ்) வினைச்சொற்களின் முதலில் வரும...
வரலாற்று மொழியியலில், இலக்கணவயமாக்கம் (grammatization or grammaticization) என்பது மொழி மாற்றத்தின் ஒரு செயல்முறையாகும்; இதன் மூலம் பெயர் மற்றும் வினைகளைக் குறிக்கும் சொற்கள் இலக்கணக் குறிப்பான்களாக (ஒட்டுக்கள், முன்னுருபுகள் பின்னுருபுகள், துணைவினைகள் போன்றவைகளாக) மாறும். இவ்வாறு இலக்கணவயமாக்கம் சொற்களுக்குப் புதிய இலக்கணச் செயல்பாடுகளை உருவாக்குகி...
இக்கட்டுரை “தமிழ் வினையடிகளின் வரலாற்று மொழியியல் ஆய்வு (A Historical Linguistic Analysis of Tamil verbal Bases)” என்ற செம்மொழி நிறுவன நிதி நல்கையில் மேற்கொள்ளப்பட்ட ஆய்வுத்திட்டத்திற்கு 2008-இல் சமர்ப்பிக்கப்பட்ட ஆய்வேட்டின் (இராசேந்திரன், 2008) ஒரு இயலாக அமைகின்றது.
வினை என்பது பொதுவாக ஒரு வாக்கியத்தில் ஒரு செயலையோ நிலையையோ வெளிப்படுத்துவதற்காக...
இராசேந்திரன் (Rajendran June, 2020) தற்காலத் தமிழ் அடிப்படையில் தமிழ் வினைகளின் இலக்கணமயமாக்கம் என்பது பற்றி விரிவாக ஆய்ந்து கட்டுரை ஒன்றை வெளியிட்டுள்ளார். இது தற்காலத்தமிழில் வினைகள் இலக்கணவயமாக்கப்பட்டுள்ளதைப் பற்றி விளக்குகின்றது. வாசு அரங்கநாதன் அவர்களும் (Vasu Renganathan January 2020) தமது கட்டுரையில் சங்கத் தமிழிலிருந்து தற்காலத் தமிழுக்கு...
இராசேந்திரன் (Rajendran June, 2020) தற்காலத் தமிழ் அடிப்படையில் தமிழ் வினைகளின் இலக்கணமயமாக்கம் என்பது பற்றி விரிவாக ஆய்ந்து கட்டுரை ஒன்றை வெளியிட்டுள்ளார். இது தற்காலத்தமிழில் வினைகள் இலக்கணவயமாக்கப்பட்டுள்ளதைப் பற்றி விளக்குகின்றது. வாசு அரங்கநாதன் அவர்களும் (Vasu Renganathan January 2020) தமது கட்டுரையில் சங்கத் தமிழிலிருந்து தற்காலத் தமிழுக்கு...
சித்த மருத்துவம் என்பது தமிழ்நாட்டில் தோன்றிய பாரம்பரிய மற்றும் பயனுள்ள மருத்துவ முறைகளில் ஒன்றாகும். இந்த முறை இந்தியாவில் மிகவும் பழமையான மற்றும் மிகவும் பிரபலமான மருத்துவ முறைகளில் ஒன்றாகக் கருதப்படுகிறது. சித்தர் என்ற சொல் உடல் மற்றும் ஆன்மீக நடைமுறைகளில் சிறந்து விளங்குபவர்களைக் குறிக்கிறது. அவர்கள் சித்த மருத்துவத்தின் ஆரம்ப பயிற்சியாளர்கள்....
இந்நுல் பின்வரும் ஒன்பது இயல்களைக் கொண்டுள்ளது.
வலைப்பூ அல்லது வலைப்பதிவு
வலைப்பூ அல்லது வலைப்பதிவு உருவாக்கம்
வலைதளம்
வலைதள உருவாக்கம்
வலைப்பூ மரற்றும் வலைதள வடிவமைப்பிற்குக் கிடைக்கப்பெறும் இலவச மற்றும் கட்டற்ற/திறந்த வளங்கள்
வலை தளம் மற்றும் வலைப்பூக்கள் மாதிரி வடிவமைப்பு
இணையப் பயன்பாட்டு மென்பொருட்கள்
இணையப் பயன்பாட்டு மென்பொருட்கள் உருவாக்கத...
தமிழின் தொழிநுட்பவளர்ச்சி பற்றி நான் எழுதிவந்தபோது அதுகுறித்த பல கட்டுரைகள் எழுதி அவற்றை எல்லாம் என் மடிக்கணியில் உள்ளீடு செய்து வந்தேன். ஒளிவழி எழுத்துணரி (Optical Character Recognizer (OCR)) குறித்து நான் எழுதிய வரைவு சிலகாலமாகவே எனது மடிக்கணியில் உறங்கிக்கொண்டிருந்தது. அதற்கு உயிர்கொடுக்கும் எண்ணத்தில் இதைப் பதிவேற்றம் செய்கின்றேன். இதில் நான்கு...
Subtitling translation has emerged as an important aspect for today’s movie industry. A large number of audiences are attracted to watch movies, video games, documentary movies and television programs. The captioning of dialogues or narration on-screen plays a great role in attracting these people. Subtitles are the written translation for dialogue...
This monograph investigates semantic change and semantic extension of verbs in Tamil. The semantic change and semantic extensions of meaning of verbs are studied from the perspectives of cognitive semantics and generative lexicon. The monograph is organized into six chapters. They are briefly described below.
There are a few earlier researches in T...
A Comparative Grammar of the Dravidian or South-Indian Family of Languages (abbreviated here as CGD) and A Dravidian Etymological Dictionary (abbreviated as DED) used to inspire me whenever I try to write something about Tamil on comparative and historical foundation. They are not comparable as they belong to two genres of historical and comparativ...
World is full of things and concepts. Language has only limited number of words to express those things and concepts. Language resorts to many mechanisms to overcome this difficulty. It does fundamentally two things to cope up this difficulty; one is by coining new words and another is expanding the range of the meaning of a word. The second mechan...
இரண்டாம் மொழி கற்பித்தலுக்கும் கற்றலுக்கும் பல்லூடகத்தின் பயன்பாடு இரண்டாம் மொழி கற்பித்தலுக்கும் கற்றலுக்கும் கணினியை அறிமுகம் செய்தன் மூலம் முக்கியத்துவம் அடைந்தது. பல்லூடகத்தின் அறிமுகம் கணிவழி மொழிக் கற்பித்தலை (CALT) குறைத்து, கணினி வழி மொழி கற்றலை (CALL) ஊக்குவித்தது. மொழி கற்பித்தலுக்கும் கற்றலுக்கும் மொழி ஆசிரியரின் பங்கு ஏறக்குறைய குறைக்கப...
நவீன காலத்தின் மிகவும் பயனுள்ள தொழில்நுட்பமான இணையம், நமது அன்றாட வாழ்வில் மட்டுமல்லாது தொழில் வாழ்க்கையிலும் உதவுகிறது. கல்வி நோக்கங்களுக்காகக் தகவல்களைச் சேகரிக்கவும் ஆராய்ச்சி செய்யவும் அல்லது பல்வேறு பாடங்களில், பொருண்மைக்களங்களில் அறிவை அதிகரிக்கவும் இது பரவலாகப் பயன்படுத்தப்படுகிறது.
கல்வியில் இணையம் மிக முக்கிய பங்கு வகிக்கிறது. இந்த நவீன யு...
Ontological Structure for Malayalam (OSM) is an outcome of an extensive research activity that went on in the field of lexical semantics of Malayalam. It went through several stages before being culminated into OSM. It depicts our travel from Malayalam Electronic thesaurus to OSM through Malayalam WordNet. It is a lexical resource which amalgamates...
World is full of things and concepts. Language has only limited number of words to express those things and concepts. Language resorts to many mechanisms to overcome this difficulty. It does fundamentally two things to cope up this difficulty; one is by coining new words and another is expanding the range of the meaning of a word. The second mechan...
The semantic extension of verbal meaning is interesting to study. The meaning extension of verbs is inevitable as there are only a limited numbers of verbs by means of which we need to express innumerable number of verbal concepts. The verbal extensions can be captured by context in which the collocations find a vital part. We tried to capture the...
This monograph written in Tamil has eleven chapters. The first ten chapters deal about the principles of generative lexicon based on James Pustejovsky’s (1995) book on “Generative lexicon. The generative lexicon (shortly GL) presents a new and exciting theory of lexical semantics that addresses the problem of the “multiplicity of word meaning”, tha...
Recognition of polysemy becomes very crucial for the proper understanding of the meanings of sentences. When we translate one language into another language, especially when we resort to machine translation, the polysemy creates a lot of problems. The polysemy leads to ambiguity which makes the translation across language a difficult process. So, t...
Linguists have been focused on a qualitative comparison of the semantics from different languages. Evaluation of the semantic interpretation among disparate language pairs like English and Tamil is an even more formidable task than for Slavic languages. The concept of word embedding in Natural Language Processing (NLP) has enabled a felicitous oppo...
മലയാളത്തിലെ കോശീയ അര്ത്ഥതല രംഗത്ത് നടന്ന വിപുലമായ ഗവേഷണ പ്രവർത്തനത്തിന്റെ ഫലമാണ് മലയാള ഭാഷാ സത്താവിജ്ഞാന ഘടന. മലയാള ഭാഷാ സത്താവിജ്ഞാന ഘടന അവസാനിക്കുന്നതിനുമുമ്പ് ഇത് നിരവധി ഘട്ടങ്ങളിലൂടെ കടന്നുപോയി. മലയാള പദശൃംഖല വഴി മലയാള ഇലക്ട്രോണിക് പ്രയോഗനിഘണ്ടുവില് നിന്ന് മലയാള ഭാഷാ സത്താവിജ്ഞാന ഘടനയിലേക്കുള്ള ഞങ്ങളുടെ യാത്രയെ ഇത് ചിത്രീകരിക്കുന്നു.
Lexicon is the total inventory of lexemes of a language. No language can remain the same for a long period of time. This is particularly true in the case of the lexicon because the change in the lexicon can be particularly noted in the course of time. This change in the lexicon is referred to as lexical change. This change is referred to by Tolkapp...
Ontological structure of Tamil (OST) is an outcome of an extensive research activity that went on in the field of lexical semantics of Tamil for the last three decades. Rajendran’s (Semantic structure of Tamil vocabulary. Report of the UGC sponsored postdoctoral work (in manuscript). Deccan College Post-Doctoral Research Institute, Pune, 1983) post...
Generally, verbs are polysemous in any language as their number is lesser than other categories including nouns. Mostly, the meaning of a verb is decided by the words with which it collocates. The contextual dependency of the verbs reduces the number of verbs in most of the languages or all languages. So by default, verbs become highly polysemous....
The complexity of scientific and technical translation lies in its very essence, and it lies in the necessity to translate highly specific terminology. Apart from understanding the terminology itself, the translator must understand the context where it is used for sometimes it is exactly the context that the use of a particular term depends on. Add...
A brief introduction on word order is given as introduction. The word order parameters have been discussed as they are relevant in typologizing a language based on these parameters. The relative word order of subject, verb and object gives rise to six types: SOV, VSO, VOS, OSV and SVO. The correlations among word order parameters such as Greenberg’...
Translation teaches learners about language, but not how to use it. Translation does not help learners develop their communication skills. Translation encourages learners to use L1, often for long periods of class time, when the aim of modern teaching is to remove it from the classroom. The skills involved in translation may not be suitable for all...
Translation as part of the communicative ELT classroom approach is still a controversial area and one that provokes strong opinions. Translation was the basis of language teaching for a very long time, and then rejected as new methodologies started to appear. It was a key element of the Grammar Translation Method, which was derived from the classic...
The term complementation is used in the analysis of grammatical function, to refer to a major constituent of sentence or clause structure, traditionally associated with ‘completing’ the action specified by the verb. In its broadest sense, complement therefore is a very general notion, subsuming all obligatory features of the predicate other than th...
Linguists consider the word as a crucial unit in their description of language. While doing so they mostly focus on those words that are recognized as part of the vocabulary of a language. Sometimes it is relevant to consider the words that are not part of the vocabulary. They can be referred to as non-existing words. In lexical semantics, it is cu...
இங்கு உறவுமுறைச் சொற்றொகையை வகைப்பாட்டியல் அடிப்படையிலும் மூலப்பொருண்மையியல் ஆய்வு அடிப்படையிலும் ஆய்ந்து ஒரு மீட்பு ஒழுங்கமைப்பையும் கற்பிக்கும் தொகுதியையும் உருவாக்குவது பற்றி விளக்கப்பட்டுள்ளது. உறவு முறைச் சொற்றொகை முந்தைய சொற்றொகை ஆய்வுகளிலிருந்து எவ்வாறு வேறுபடும் என்பதும் விளக்கப்படும்.
மனித உறவுகளின் அடிப்படையில் எழும் உறவுமுறை அமைப்பு பிற...
இவ்வியலில் தாவர இனச் சொற்றொகையை வகைப்பாட்டியல் அடிப்படையிலும் மூலப்பொருண்மையியல் ஆய்வு அடிப்படையிலும் ஆய்ந்து ஒரு மீட்பு ஒழுங்கமைப்பையும் கற்பிக்கும் தொகுதியையும் உருவாக்குவது பற்றி விளக்கப்பட்டுள்ளது. தாவர இனச் சொற்களின் வகைப்பாட்டிற்கு வகைப்பாட்டியல் அடிப்படையாய் அமையும். எனவே இவ்வியலுக்கும் இதனைத் தொடர்ந்து வரும் இயல்களுக்கும் அடிப்படையாக அமையும...
This paper consists of four sections: one is Noun Modifying Expressions (NMES) in Tamil based on the survey list prepared by Peter Hook and others; the second one is on lexicalization of NMEs into (lexical or phrasal) adjectives. The third part is in grammaticalization of NME into adjectival suffixes or adjectivalizers. The fourth part is nominaliz...
The monograph "Nuances of making Spell and Grammar Checker for Tamil" written in Tamil aims at describing the nuances of making a spell and grammar checker for Tamil. The book has 5 chapters. Chapter 1: The first chapter is introduction. It introduces the topic of the research work. It explains the aims and objectives of the book. It also discusses...
There are mainly two processes involved in the formation of words; one is inflection and another derivation. Words inflect in order to add grammatical features such as plurality, cases and tenses. Derivation is the process of forming new words from already available words or morphemes. The derivation of new words is otherwise called word formation....
While validating Malayalam wordNet we have found out that Many synsets are not linked to the core or Major wordNet. (Thanks to the Trento University which has found out this lacunae.) Especially many adjectives in Malayalam wordNet are not linked to the main wordNet. We are planning to explore the reason for the lacunae and trying to come out with...
“Machin Translation - Yesterday, Today and Tomorrow” is a monograph written in Tamil to introduce the deferent dimensions of machine translation to the Tamil readers. It has nine chapters including introduction and conclusion.
Chapter 1: Introduction
The introduction describes the aim and scope of machine translation. It discusses about the genera...
Malayalam has initiated its technological development well in advance. It has made use of all the opportunities given to it for making it suitable for digitalization and computerization. The references listed below stand to establish its efforts in fulfilling the need of the day i.e. technological development. Governments, both state and central, f...
Despite the growth of bilingual word embeddings, there is no work done so far, for directly evaluating them for English–Tamil language pair. In this paper, we present dataset and the evaluation paradigm for English–Tamil bilingual language pair. This dataset contains words that cover a range of concepts that occur in natural language. The dataset i...
The present monograph entitled “Computational Linguistics” written in Tamil deals mainly with four aspects: computational linguistics in general, the processing of language at different levelvels of analysis such as phonology, morphology, syntax and semantics, applications of computational linguistics and technological development of Tamil. This bo...
The onset of this monograph dates back to ten to fifteen years ago when I was teaching MA Applied linguistics in Tamil University, Thanjavur. This write up which was rather class notes was written in Tamil as MA applied linguistics is/was introduced through Tamil medium in Tamil University. The lack of computational linguistics materials in Tamil m...
ഇന്നുള്ള ശാസ്ത്രീയതയില് പ്രമുഖസ്ഥാനത്തു നില്ക്കുന്ന ഒരു യന്ത്രമാണ് കമ്പ്യൂട്ടര്. ഇരുപതാം നൂറ്റാണ്ടില് നിലവില്വന്ന നിത്യോപയോഗ സാധനങ്ങളെ പിന്നില് ആക്കിയതിനുശേഷം നമ്മുടെ വലിയ സുഹൃത്തായി കമ്പ്യൂട്ടര് മാറിയിട്ടുണ്ട്. ഭാഷയെ കുറിച്ചുള്ള സാധ്യതകള് നമുക്ക് കമ്പ്യൂട്ടറില് നിന്നും പലവിധത്തില് ഉപയോഗിക്കാന് സാധിക്കുന്നു. ഇത്തരത്തിലുള്ള ഉപയോഗങ്ങളാണ് ഇ...
Natural Language Processing (NLP) is an area of research and application that explores how computers can be used to understand and manipulate natural language text or speech to do useful things. NLP is having a very important place in our day-to-day life due to its enormous natural language applications. Computational linguistics (CL) is a discipli...
ദ്രാവിഡഭാഷാ പദശൃംഖല, തെലുങ്ക്, തമിഴ്, കന്നഡ, മലയാളം എന്നീ ഭാഷകളുടെ സംയോജിത പദശൃംഖല (Dravidian Wordnet: An intergrated wordnet for Telugu, Tamil, Kannada and Malayalam) എന്നു പറയുന്ന പദ്ധതിയുടെ ഒരു ഭാഗമായിട്ടാണ് മലയാളഭാഷാ പദശൃംഖല നിര്മ്മിച്ചിരിക്കുന്നത്. മലയാളഭാഷാ പദശൃംഖല വികസിപ്പിക്കുന്നതിനായി ഹിന്ദിഭാഷാ പദശൃംഖല വികസിപ്പിക്കാന് പിന്തുടര്ന്ന പ്രവ...
பொருண்மையியலின் ஒரு பகுதியாக அமையும் ஆங்கிலத்தில் ‘Lexical Semantics’ என அழைக்கப்படும் ’சொற்பொருண்மையியல்’ குறித்த விளக்கம் தமிழ் எடுத்துக்காட்டுகளுடன் இங்கு விளக்கப்பட்டுள்ளது. சொற்பொருண்மையியல் குறித்த கட்டுரைகளோ நூல்களோ தமிழில் இல்லாத நிலையில் தமிழில் சொற்பொருண்மையியல் குறித்து அறிய விரும்பும் மாணவர்களுக்கும் ஆய்வாளர்களுக்கும் இது ஒரு தொடக்கப் ப...
‘Computer applications to language studies’ is introduced here to teach fundamentals of computers and the basic linguistics to the students and make the students understand various applications of computers in linguistics and language studies.
Using computer for language studies has emerged into a new filed of hybrid type called computational lingu...
Grammaticalization has been defined as "the change whereby lexical items and constructions come in certain linguistic contexts to serve grammatical functions, and, once grammaticalized, continue to develop new grammatical functions" (Hopper & Traugott 2003:1). To put it differently, grammaticalization is the process in which a lexical word or a wor...
The present study on word sense disambiguation of Malayalam aims at to understand the causes for lexical ambiguity and finding was to resolve the lexical ambiguity. It has been understood that homonymy and polysemy are the reason for creating ambiguity. Here we are concerned with ambiguity due to homonymy. To resolve the ambiguity we propose two ap...
சொற்களின் தொகுப்பு சொற்களஞ்சியம் (thesaurus) எனப்படும். சொற்களஞ்சியம் என்பதை பொருட்புல அகராதி என்றும் குறிப்பிடுவர். சொற்களஞ்சியம் கருத்துருக்களிலிருந்து அல்லது பொருண்மைகளிலிருந்து (அர்த்தங்களிலிருந்து) சொற்களை அடைய உதவும். சொற்களஞ்சியம் என்பதன் விளக்கம் பின்வரும் ஜோன்ஸின் (Jones, 1986:201) மேற்கோள் மூலம் தெளிவாகும்:
“ஒரு சொற்களஞ்சியத்தில் ஒருபொருள...
தமிழ்ச் சொற்றொகையின் வகைப்பாட்டியலின் சுருக்கப்பட்டியல் இதில் தரப்பட்டுள்ளது.
Linguists consider word as a crucial unit in their description of language. While doing so they mostly focus on those words that are recognized as part of the vocabulary of a language. Sometimes it is relevant to consider the words that are not part of the vocabulary. They can be referred as non-existing words. In lexical semantics it is customary...
This paper describes and evaluates the machine translation systems built for Indian languages-to-Indian languages (IL-ILMT) with special reference to Tamil. It is a consortium project funded by Department of Electronics and Information Technology (DeitY), Govt. of India. The IL-ILMT systems are built based on the combination of rule-based and stati...
Introduction The WordNet is a lexical resource. It is lexicon based on psycholinguistics principles. It organizes the lexical information in terms of word meanings. It is a system for bringing together different lexical and semantic relations between words. The WordNet is being developed using the expansion approach with the help of tools provided...
Grammaticalization has been defined as "the change whereby lexical items and constructions come in certain linguistic contexts to serve grammatical functions, and, once grammaticalized, continue to develop new grammatical functions" (Hopper & Traugott 2003:1). Simply said, grammaticalization is the process in which a lexical word or a word cluster...
Tamil has initiated its technological development well in advance. It has made use of all the opportunities given to it for making it suitable for digitalization and computerization. The references listed below stand to establish its efforts in fulfilling the need of the day i.e. technological development. Governments, both state and central, funde...
Parsing is a basic technique in natural language processing; however, a full parser is usually costly and slow. Recently, shallow parsing has been applied to various natural language processing systems. Compared to the performance of full parsers, a shallow parser is much faster and the parsing result is more useful for various applications, such a...
Subtitling translation has emerged as an important aspect for today’s movie industry. A large number of audiences are attracted to watch movies, video games, documentary movies and television programs. The captioning of dialogues or narration on-screen plays a great role in attracting these people. Subtitles are the written translation for dialogue...
Historical novel is a novel that has as its setting a period of history and that attempts to convey the spirit, manners, and social conditions of a past age with realistic detail and fidelity (which is in some cases only apparent fidelity) to historical fact. The work may deal with actual historical personages, or it may contain a mixture of fictio...
Nominalization is a process by which noun phrase is generated from another word class, usually a verb; (other word classes include adjectives and nouns). In other words, the process of nominalization turns verbs (actions or events) into nouns (things, concepts or people). Nouns can be formed from the words belonging to all parts of speech in Malaya...
Linguists consider word as a crucial unit in their description of language. While doing so they mostly focus on those words that are recognized as part of the vocabulary of a language. Sometimes it is relevant to consider the words that are not part of the vocabulary. They can be referred as non-existing words. In lexical semantics it is customary...
Grammaticalization has been defined as "the change whereby lexical items and constructions come in certain linguistic contexts to serve grammatical functions, and, once grammaticalized, continue to develop new grammatical functions" (Hopper & Traugott 2003:1). During grammaticalization nouns and verbs which carry certain lexical meaning develop ove...
Historical novel is a novel that has as its setting a period of history and that attempts to convey the spirit, manners, and social conditions of a past age with realistic detail and fidelity (which is in some cases only apparent fidelity) to historical fact. The work may deal with actual historical personages, or it may contain a mixture of fictio...
In recent years, the multilingual content over the internet has grown exponentially together with the evolution of the internet. The usage of multilingual content is excluded from the regional language users because of the language barrier. So, machine translation between languages is the only possible solution to make these contents available for...
கால வெளிப்பாடு எப்பொழுது எவ்வளவு நேரம் எத்தனை தடவை என்ற கேள்விகளுக்கு விடையளிக்கும். முதல் கேள்விக்கு விடை தரும் கால வெளிப்பாடுகள் காலம் எப்பொழுது என்றும் இரண்டாவது கேள்விக்கு விடையளிக்கும் கால வெளிப்பாடுகள் எவ்வளவு காலம் என்றும் மூன்றாவது கேள்விக்கு விடையளிக்கும் எத்தனை தடவை விடையளிக்கும். இட வெளிப்பாடு எங்கே என்ற கேள்விக்கு விடையளிக்கும். இட-காலச...
பொருண்மை மாற்றத்திற்கும் பொருண்மை நீட்சிக்கும் உள்ள எல்லைக் கோடு மிகவும் மெல்லியது. இவை பொருண்மை மாற்றத்திற்கு எடுத்துக்காட்டுகளாகும் அல்லது இவை பொருண்மை நீட்சிக்கு எடுத்துக்காட்டுகளாகும் என அறிதியிட்டுக் கூறுவது கடினமாகும். நாம் வரலாற்று அடிப்படையில் இரண்டு பதிவுகள் ஒன்றாக இருந்தவை எனவும் காலப்போக்கில் அவை இரண்டு அல்லது அதற்கு மேற்பட்ட பதிவுகளாகக்...
பொருண்மை மாற்றத்திற்கும் பொருண்மை நீட்சிக்கும் உள்ள எல்லைக் கோடு மிகவும் மெல்லியது. இவை பொருண்மை மாற்றத்திற்கு எடுத்துக்காட்டுகளாகும் அல்லது இவை பொருண்மை நீட்சிக்கு எடுத்துக்காட்டுகளாகும் என அறிதியிட்டுக் கூறுவது கடினமாகும். நாம் வரலாற்று அடிப்படையில் இரண்டு பதிவுகள் ஒன்றாக இருந்தவை எனவும் காலப்போக்கில் அவை இரண்டு அல்லது அதற்கு மேற்பட்ட பதிவுகளாகக்...
பொருண்மைக்கள ஆய்வு அடிப்படையில் சமையல் வினைகள் பற்றி இங்கு ஆயப்படுகிறது. லேரர் (Lehrer, 1969) என்பவர் எழுதிய “Semantic cursine” என்ற கட்டுரையின் அடிப்படையில் இவ்வாய்வு அமைகின்றது. சமையல் வினைகளைச் சமையலின் முறை (சுடப்படுகிறதா, அவிக்கப்படுகிறதா), சமையலில் பயன்படுத்தப்படும் அடிப்படை பொருள் (எண்ணெய் பயன்படுத்தப்படுகின்றதா? இல்லையா?), சமையலின் தீவிரம்...
சொற்பொருண்மை மயக்கநீக்கம் என்பது ஒரு கணினிசார் வழி சூழலில் சொற்களின் பொருளைக் கண்டுகொள்ளும் ஒரு திறனாகும். சொற்பொருண்மை மயக்கநீக்கம் ஒரு செயற்கை அறிவு-முழுமைச் சிக்கலாகக் (AI-complete problem) கருதப்படுகின்றது; அதாவது, செயற்கை அறிவில் மிகக் கடினமான சிக்கல்களுக்குச் சமமான செயல்பாடாகும். இங்கே சொற்களின் மயக்கத்தை நீக்குவதற்கான செயலூக்கங்களும் இச்செயல...
ஒரு வாக்கியம் அதன் அமைப்பு அடிப்படையிலும் அதில் வரும் சொற்கள் அடிப்படையிலும் பொருள்கோள் செய்யப்படுகின்றது. ஒரு வாக்கியம் பல வகைப் பகுத்துக் குறிப்புகளைப் (different types of parsing) பெறுகையில் அவ்வாக்கியம் பல பொருள்கோள்களைப் பெறும். மட்டுமன்றி வாக்கியத்தில் வரும் சொற்கள் பல்பொருண்மைத் தன்மை உடையதாய் இருந்தாலும் சொற்போலியாக இருந்தாலும் வாக்கியம் வே...
இக்கட்டுரையில் தமிழில் பொருண்மை மயக்கங்களின் வகைப்பாடு (Taxonomy of Ambiguities in Tamil) பற்றிய விரிவான ஆய்வு மேற்கொள்ளப்பட்டுள்ளது. குறிப்பாக அமைப்புப் பொருண்மை மயக்கம் பற்றியும் சொற்பொருண்மை மயக்கம் பற்றியும் விரிவான விளக்கம் தரப்பட்டுள்ளது. இவ்விரு மயக்கங்களின் வகைகள் எடுத்துக்காட்டுகளுடன் ஆயப்பட்டுள்ளது. தமிழ்த் தரவுதொகுதிகளில் இவ்விரு மயக்கங்...
இயற்கை மொழியைப் பகுப்பாய்வுச் செய்வதற்குச் சில வடிவவாதங்கள் (formalism) தேவை. இயற்கை வடிவமைப்புகள் என்று அழைக்கப்படுகின்ற இலக்கண முன்மாதிரிகள் முழுமையாகவோ, முழுமையல்லாமலோ இயற்கை மொழியின் ஒலியனியல், உருபனியல். தொடரியல் மற்றும் பொருண்மையியல் ஒழுங்கமைப்பை அறிந்துகொள்ள முயலுகின்றது. இலக்கண வடிவ வாதங்கள் மொழியின் எல்லா நிலைகளிலும் காணப்படுகின்ற அலகுகளைய...
பொருண்மை மாற்றத்திற்கும் பொருண்மை நீட்சிக்கும் உள்ள எல்லைக் கோடு மிகவும் மெல்லியது. இவை பொருண்மை மாற்றத்திற்கு எடுத்துக்காட்டுகளாகும் அல்லது இவை பொருண்மை நீட்சிக்கு எடுத்துக்காட்டுகளாகும் என அறிதியிட்டுக் கூறுவது கடினமாகும். நாம் வரலாற்று அடிப்படையில் இரண்டு பதிவுகள் ஒன்றாக இருந்தவை எனவும் காலப்போக்கில் அவை இரண்டு அல்லது அதற்கு மேற்பட்ட பதிவுகளாகக்...
பொருண்மை மாற்றத்திற்கும் பல்பொருள் ஒருமொழியத்திற்கும் இடையிலுள்ள உறவு பொருண்மைக் கோட்பாட்டிற்கு முக்கியத்துவம் வாய்ந்ததாகும். பாலிசெமி ‘பல்பொருளொருமொழி’ என்ற சொல் மைக்கேல் ப்ரெயல்ஸ்சின் (Michel Bréals) அடிப்படையான Essai de sémantique என்பதில் முதல் முறையாகத் தோன்றியது. ப்ரெயல்சின் ஒருபொருள்பன்மொழி பொருண்மை மாற்றத்தின் விளைவாக ஏற்பட்டது; அது சொல்சார...
தற்காலப் சொற்பொருண்மையியலில் முக்கியமான கவனக்குவிப்பு பல்பொருளொருமொழியத்தையும் பொருண்மை நெகிழ்வையும் ஆய்வதில் திரும்பியுள்ளது. ஒரு மொழியை மற்றொரு மொழிக்கு மொழிபெயர்ப்பு செய்கையில் குறிப்பாக இயந்திர மொழிபெயர்ப்பு செய்கையில் பல்பொருளொருமொழியம் சிக்கல்களை உருவாக்குகின்றது. இதனால் மொழியைக் கடைந்து சொற்களுக்கு இடையேயுள்ள பல்பொருளொருமொழியம் அல்லது பொருண்...
மொழிக்கூற்றுகள் காலப் போக்கில் மாற்றமடைவது தவிர்க்க இயலாத ஒன்றாகும். நம்மைப் பொறுத்தவரையில் எவ்வாறு வினைச் சொற்கள் பொருண்மை மாற்றமும் பொருண்மை நீட்சியும் அடைகின்றன என்பது கருத்தத்தக்கதாகும். மொழிக்கூறுகள் சொற்களையும் பிற பெரிய இலக்கணக் கட்டுமானங்களையும் உட்படுத்தும். பொருளடக்கச் சொற்களும் இலக்கணச்சொற்களும் பொருண்மை மாற்றத்திற்கு உள்ளாகும். பொருளடக்...
தமிழ்ப் பெயர்களை வரலாற்று மொழியியல் அடிப்படையில் ஆய்வதற்கு முன் பழந்தமிழ் தரவுகள் அடிப்படையில் எழுதப்பட்ட மரபிலக்கணங்கள் தமிழ்ப் பெயர்களைப் பற்றி எத்தகைய விளக்கங்களைத் தருகின்றன என்று அறிந்துகொள்வது மிக இன்றியமையாதது ஆகின்றது. இதன் காரணமாக ‘மரபிலக்கணங்களில் தமிழ்ப் பெயர்கள்” என்ற தலைப்பில் இவ்வியலில் தொல்காப்பியம், நன்னூல் போன்ற சில முக்கியமான மரபி...
சௌவா (J.F. Sowa, 1996, 14) ) “Ontologies for knowledge sharing” என்ற தமது உரையில் மெய்ப்பொருள் மூல ஆய்வு, கலைச்சொல்சார் மூலபெருண்மையியல் ஆய்வு (terminological ontology), வெளிப்படை உண்மையாக்கப்பட்ட மூலப்பொருண்மையியல் ஆய்வு (axiomatized ontology) என்பவைகளுக்கு முறையல்லா விளக்கங்கள் தருகிறார்:
மூலப்பொருண்மையியல் ஆய்வு (ontology): எதாவது பொருண்மைக்களத...
மூலப்பொருண்மையியல் ஆய்வு (ontology) சொற்பொருண்மையிலிலும் செயற்கைப் பொருண்மையியலிலும் பெரிய களமாகும். அடிப்படையில், ஒரு மூலப்பொருண்மையியல் ஆய்வு ஒரு குறிப்பிட்ட பொருட்புலத்திற்கு அடிப்படைக் கூறுகள், வேறுபட்ட கருத்துருக்கள் மற்றும் அவற்றின் தொடர்புள்ள மொழியியல் மெய் உருவாக்கங்கள் இவற்றால் உருப்படுத்தம் செய்யும் நோக்கம் உள்ள ஒரு முறையான ஒழுங்குமுறையாக...
Subtitling translation has emerged as an important aspect for today’s movie industry. A large number of audiences are attracted to watch movies, video games, documentary movies and television programs. The captioning of dialogues or narration on-screen plays a great role in attracting these people. Subtitles are the written translation for dialogue...
இவ்வியல் நான்சி இட் மற்றும் ஜீன் வெரோனிஸ் (Nancy Ide and Jean Veronis, 1998) என்போர் எழுதிய Words Sense Disambuation: The state of Art என்ற கட்டுரையைத் தழுவி அமைகின்றது. 50-களில் மொழியின் கணினி செயல்பாட்டின் ஆரம்ப நாட்களிலிருந்தே தானியக்கமாகச் சொற்பொருண்மை மயக்க நீக்கம் ஆர்வமுள்ளதாகவும் கருதத்தக்கதாகவும் இருந்தது. பொருண்மை மயக்க நீக்கம் ஒரு இடைப்பட...
இந்திய மொழிகளிலிருந்து இந்திய மொழிகளுக்கான இயந்திர மொழிபெயர்ப்புத் திட்டம் இணையும் அடிப்படையிலான மொழிபெயர்ப்பு திட்டம் 2006 அக்டோபரில் மைய அரசின் கருத்துப் பரிமாற்றம் மற்றும் தகவல் தொழில் நுட்ப அமைச்சின் கீழ் தகவல் தொழில் நுட்பத் துறையின் நிதி நல்கையால் நடைபெற்று வருகின்றது. இதன் முதல் நிலை 2006 அக்டோபர் 30-ஆம் நாள் தொடங்கப்பட்டு 2010 ஏப்பிரலில் மு...
சொல்லாய்வியின் வழி ஆவணங்கள் (Documents) உருவாக்கப் படுகின்றன. ஆவணம் ஒரு கடிதமாகவோ சிறுகுறிப்பாகவோ கட்டுரையாகவோ நூலாகவோ இருக்கலாம். சொல்லாய்வியில் ஆவணத்தை உருவாக்கப் பொதுவாகப் பின்வரும் மூன்று முறைகள் பயன்படுத்தப்படுகின்றன:
1. கணிப்பொறியின் விசைப்பலகை (Keyboard) வழி உள்ளீடு செய்தல்
2. பேச்சுணரி ஒழுங்கு முறையைப் (Voice Recognition System (VRS)) பயன்ப...
கணினியின் வரவால் சொற்பொருண்மையியல் புதிய பரிமாணங்களை எய்தியுள்ளது. கணினியைப் பயன்படுத்திச் சொற்பொருண்மை ஆய்வை மேற்கொள்ளும் செயல்பாடுகள் கணினிச் சொற்பொருண்மையியல் (computational lexical semantics) என்ற புதிய பாடக்கிளை உருவாகும் அளவுக்கு வளர்ந்துள்ளது. சொற்பொருண்மை ஆய்வு என்றால் கணினியைப் பயன்படுத்திச் செய்யப்படும் ஆய்வு என்று கூறுகிற அளவிற்கு இக்கிள...
கால வெளிப்பாடு எப்பொழுது எவ்வளவு நேரம் எத்தனை தடவை என்ற கேள்விகளுக்கு விடையளிக்கும். முதல் கேள்விக்கு விடை தரும் கால வெளிப்பாடுகள் காலம் எப்பொழுது என்றும் இரண்டாவது கேள்விக்கு விடையளிக்கும் கால வெளிப்பாடுகள் எவ்வளவு காலம் என்றும் மூன்றாவது கேள்விக்கு விடையளிக்கும் எத்தனை தடவை விடையளிக்கும். இட வெளிப்பாடு எங்கே என்ற கேள்விக்கு விடையளிக்கும். இட-காலச...
அரிஸ்டாட்டில் காலத்திலிருந்தே பொருட்களும் அவற்றைத் தாங்கும் சொற்களும் வகைப்பாட்டியல் அடிப்படையில் ஆயப்பட்டு வருகின்றன. வகைப்பாட்டியல் தான் தாவர இயலில் தாவரங்களின் இருபெயரீட்டுப் பெயரிடல் (binominal nomenclature) வகைப்பாட்டிற்கும் விலங்கியலில் விலங்குகளின் வகைப்பாட்டிற்கும் அடிப்படையாக அமைகின்றது. இவ்வகைப்பாட்டியலின் அடிப்படையில் தான் சொற்கள் பொருண்...
வரலாற்று மொழியியல் ஆய்வு அடிப்படையில் தமிழ்ப் பெயர்ச்சொற்களை ஆய்வது இக்கட்டுரையின் நோக்கம் ஆகும். தமிழ்மொழியின் வளர்ச்சி காலத்தைப் பொதுவாகப் பழந்தமிழ், இடைக்காலத் தமிழ், தற்காலத்தமிழ் எனப் பிரித்து ஆய்வர். சிலர் சங்கத்தமிழ் காலம், சங்கம் மருவிய காலம், தற்காலம் எனப் பிரித்து ஆய்வர். இங்கு நாம் இரண்டு கால கால கட்டங்களையே கணக்கில் எடுத்துள்ளோம்: ஒன்று...
தமிழ்ப் பெயர்களை வரலாற்று மொழியியல் அடிப்படையில் ஆய்வதற்கு முன் பழந்தமிழ் தரவுகள் அடிப்படையில் எழுதப்பட்ட மரபிலக்கணங்கள் தமிழ்ப் பெயர்களைப் பற்றி எத்தகைய விளக்கங்களைத் தருகின்றன என்று அறிந்துகொள்வது மிக இன்றியமையாதது ஆகின்றது. இதன் காரணமாக ‘மரபிலக்கணங்களில் தமிழ்ப் பெயர்கள்” என்ற தலைப்பில் இவ்வியலில் தொல்காப்பியம், நன்னூல் போன்ற சில முக்கியமான மரபி...
தமிழில் பெயர்ச் சொற்கள் பற்றி மொழியியல் கோட்பாடு அடிப்படையிலான பல ஆய்வுகள் வெளிவந்துள்ளன. இவை பெயர்ச்சொற்களை மரபிலக்கணக் கோட்பாடுகள் அடிப்படையிலோ வருணனை மொழியியல் அடிப்படையிலோ வரலாற்று மொழியியல் அடிப்படையிலோ ஆகின்றன. இங்கு வருணனை மொழியியல் அடிப்படையிலும் வரலாற்று மொழியியல் அடிப்படையிலும் பெயர்ச்சொற்களை ஆயும் முக்கியமான ஆய்வுகளை மட்டும் எடுத்துக்கொண...
1. அறிமுகம் கணினி சசால்லியல் (computational lexicology) என்பது அகராதியயப் பற்றி படிப்பதற்குக் கணினியயப் பயன்படுத்துேயதப் பற்றிக் கூறுகின்ற கணினிசமாழியியலின் கியை ஆகும். இயந்திரம் படிக்கேியலும் அகராதிகயைப் பற்றி படிப்பதுதான் கணினி சசால்லியல் எனக் குறுகலாகவும் ேயரயயற ேிைக்கம் சசய்ேர். இது கணினி அகராதியல் என்பதிலிருந்து வேற்படுத்தப்படவேண்டும். கணினி அ...
This a research work I have started in 1974 as "Syntax and Semantics of Tamil verbs". I worked on "Semantic Structure of Tamil vocabulary". Later on I worked on "Historical Linguistics Study of Tamil verbal bases". I have been working on the lexical semantics and Computational Lexical Semantics since 1974. I have published a Thesaurus for Tamil and...
I have been working on semantic change and semantic extension of Tamil verbs. I have read a number papers related to semantic change and extension. I have made an abstract of those papers in Tamil and presented it for Tamil readers/scholars.