|
அகராதிகள்
அகராதிகள், சொற்களஞ்சியங்கள் போன்ற உயர்தர மொழிபெயர்ப்புக் கருவிகளை உருவாக்குவதும்
என்டிஎம்மின் முக்கிய நோக்கங்களில் ஒன்றாகும். 22 இந்திய மொழிகளில் இருமொழி அகராதிகளும்
மின்-அகராதிகளும் உருவாக்கப்பட்டு வருகின்றன. பேச்சு வழக்கு பாணி, சூழலுக்கேற்ற இயல்பான
வாக்கிய அமைப்பு ஆகியவையும், அதிகப்படியான எடுத்துக்காட்டுக்களும் மற்றும் அடிக்கடி
பயன்படுத்தப்படுகிற தனிச்சொற்களும், இடைச்சொற்களும், இவற்றின் பயன்பாடுளும் இடம்பெற்றுள்ளது
இவ்வகராதிகளின் தனிச்சிறப்புகளில் சில.
பல்வேறு இந்திய மொழிகளில் அகராதிகளை உருவாக்கும் பணியில் என்டிஎம் ஈடுபட்டுள்ளது. தற்போது
கீழ்கண்ட இரு வகையான சொல்வள உருவாக்கப் பணிகளை மேற்கொண்டுள்ளது:
|
a) 1) இருமொழி அடிப்படை அகராதிகள்
b) 2) இருமொழி மின்-அகராதிகள்
|
இருமொழி அடிப்படை அகராதிகள்
|
மைசூரில் உள்ள இந்திய மொழிகளின் நடுவண் நிறுவனமும், யுனைடட் கிங்டத்தில் உள்ள லாங்மென்
பியர்சன் குழுமமும் இணைந்து 2006 ஆம் ஆண்டு மே-ஜூன் மாதங்களில் இருமொழி அகராதிகள் உருவாக்கும்
வேலையை ஆரம்பித்தன. என்டிஎம் தொடங்கப்படும்பொழுது இவ்வகராதிகள் மொழிபெயர்ப்புக் கருவிகளாக
பயன்படும் என்றெண்ணப்பட்டது. 2008-இல் இத்திட்டம் என்டிஎம்முடன் இணைக்கப்பட்டது. பிரிட்டிஷ்
நேஷனல் கார்பஸை (British National Corpus – BNC) அடிப்படையாக வைத்து, மிக அதிகமாக பயன்படுத்தபடுகிற
14,000 வார்த்தைகள் மற்றும் சொற்றொடர்களைக் கொண்டு தயாரிக்கப்பட்ட மிக பிரபலமான பேசிக்
– இங்கிலீஷ் – இங்கிலீஷ் டிக்ஷனரியில் குறிப்பிட்ட இந்தியமொழி நிகரன், விளக்கம், எடுத்துக்காட்டு
ஆகியவற்றை சேர்ப்பதன் மூலம் இந்த அகராதிகள் உருவாக்கப்பட்டுள்ளன. .
இந்த லாங்மென்–என்டிஎம்–சிஐஐஎல் அடிப்படை இருமொழி அகராதிகளைப் படிப்படியாக வெளிகொண்டுவர
திட்டமிடப்பட்டுள்ளது. வங்காளம், ஹிந்தி, கன்னடம், மலையாளம், ஒடியா மற்றும் தமிழ் ஆகிய
ஆறு மொழிகளில் அகராதிகள் ஏற்கனவே வெளியிடப்பட்டுள்ளன. பஞ்சாபி, குஜராத்தி, மராத்தி,
தெலுங்கு மற்றும் உருது அகராதிகள் விரைவில் வெளிவர இருக்கின்றன.
|
|
|
2011-2012 –இல் பியர்சன் எஜூகேஷன் (இந்தியா) வெளியிட்ட அகராதிகளின் பட்டியல்:
|
|
1.
|
லாங்மென் – சிஐஐஎல் ஆங்கிலம் ஆங்கிலம் ஹிந்தி அகராதி
|
|
2.
|
லாங்மென் – சிஐஐஎல் ஆங்கிலம் ஆங்கிலம் பெங்காலி அகராதி
|
|
3.
|
லாங்மென் – சிஐஐஎல் ஆங்கிலம் ஆங்கிலம் கன்னடா அகராதி
|
|
4.
|
லாங்மென் – என்டிஎம் – சிஐஐஎல் ஆங்கிலம் ஆங்கிலம் ஒரியா அகராதி
|
|
5.
|
லாங்மென் – என்டிஎம் – சிஐஐஎல் ஆங்கிலம் ஆங்கிலம் மலையாளம் அகராதி
|
|
6.
|
லாங்மென் – என்டிஎம் – சிஐஐஎல் ஆங்கிலம் ஆங்கிலம் தமிழ் அகராதி
|
இந்திய அரசியலமைப்புச் சட்டத்தின் எட்டாவது பட்டியலில் உள்ள 22 இந்திய மொழிகளிலும்
அகராதிகளைக் கொண்டுவரவும் சொல்வளங்கள் உருவாக்கத்தை விரிவுபடுத்துவதற்கும் என்டிஎம்
பணியாற்றி வருகிறது.
இருமொழி மின்-அகராதிகள்
பியர்சன் எஜூகேஷனின் XML தரவுக்கணம் (dataset) லாங்மென் அட்வான்ஸ்டு பைலிங்குவல் ஃபிரேம்வொர்க்கை
(Longman Advanced Bilingual Framework - LABF) பயன்படுத்துவதற்கான அனுமதியை பெறவும்
ஆலோசனை சேவைகளைப் பெறவும் டோர்லிங் கின்ட்டெர்ஸ்லி பிரைவேட் லிமிடெட் –உடன் என்டிஎம்-சிஐஐஎல்
ஒரு ஒப்பந்தம் செய்துள்ளது. A-இலிருந்து Z-வரையிலான எழுத்துகளுக்கான LABF தரவுக்கணம்
லாங்மென் யு.கே. –வினால் ஐடிஎம் சேவையகத்தில் (IDM server) என்டிஎம்மிற்காக பதிவேற்றம்
செய்யப்பட்டிருக்கிறது. லாங்மென்னால் முதலில் உருவாக்கப்பட்டதும் பின்பு பிரான்சில்
உள்ள ஐடிஎம்மால் சந்தைப்படுத்தப்பட்டதுமான டிக்ஷனரி புரடக்ஷன் சிஸ்டம் (Dictionary
Production System - DPS) வழியாக இந்த LABF தரவுக்கணம் பயன்படுத்தப்படும். என்டிஎம்மின்
இருமொழி மின் அகராதிகள் பின்வருவனவற்றை அடிப்படையாகக் கொண்டு தயாரிக்கப்படுகிறது.
|
|
»
|
லாங்மென் டிக்ஷனரி ஆஃப் கான்டெம்பொரரி இங்கிலீஷ்
|
|
»
|
லாங்மென் அட்வான்ஸ்டு அமெரிக்கன் டிக்ஷனரி
|
|
»
|
லாங்மென் டிக்ஷனரி ஆஃப் இங்கிலீஷ் அண்டு கல்ச்சர்
|
|
»
|
லாங்மென் பிசினஸ் டிக்ஷனரி
|
|
»
|
லாங்மென் டிக்ஷனரி ஆஃப் இங்கிலீஷ் லாங்வேஜ்
|
|
»
|
லாங்மென் கார்ப்பஸ் நெட்வொர்க்கிலிருந்து பெறப்படும் தகவல்கள்
|
மேலும் தேவையான பல அடிப்படை விஷயங்களை முடிவுசெய்வதற்காக பியர்சன் எஜூகேஷனுடன் என்டிஎம்
தொடர்ந்து தொடர்பில் இருக்கிறது.
|
|
|
|