கணினியில் தமிழ் மொழி தெரிவது எப்படி?


கணினியில் ஆங்கிலம் மட்டுமே இயங்கும் அல்லது கணினி ஆங்கிலத்தை மட்டுமே புரிந்து கொள்ளும். கணினி தமிழைப் புரிந்து கொள்ளுமா, சற்றுப் பொறுங்கள். கணினி தமிழ் மட்டுமல்ல எந்த மனித மொழியையும் புரிந்து கொள்ளாது.

அதற்குப் புரியக் கூடிய ஒரே மொழி இலக்க மொழி (Machine Language) தான். இந்த மொழியில் இரண்டே இரண்டு குறியீடுகள் தான். அவை ஒன்று மற்றும் சுழி (பூஜ்யம்).

ஆனால் நாங்கள் ஆங்கிலத்தில் தானே கணினித் திரையில் பார்க்கிறோம். கட்டளைகள் எல்லாம் ஆங்கிலத்தில் தானே இருக்கின்றன என்று தோன்றுகிறதா? அவை உங்களுக்கு ஆங்கிலத்தில் இருக்கின்றன ஆனால் கணினி அந்த ஒவ்வொரு கட்டளையையும் அது புரிந்துகொள்ளக் கூடிய இலக்க மொழியில் மாற்றப்பட்டு கணினியின் மூளையான செயலகம் (Processor) நிறைவேற்றுகிறது.

கணினி எவ்வாறு செயல்படுகிறது எவ்வாறு இயங்குதளம் தரவுதளம் இயங்குகின்றன என்கிற நுணுக்கங்களுக்குச் செல்லாமல் திரையில் ஒரு குறிப்பிட்ட மொழியில் எழுத்துருவில் தெரிவது எப்படி என்று மட்டும் பார்ப்போம்.

கணினியை நாம் அச்சுத்துறைக்குப் பயன்படுத்தும் பொழுது நாம் விரும்பும்படி தான் ஆங்கில மொழியின் எழுத்துக்களைக் கூட பயன்படுத்திச் சேமிக்க வேண்டும். அதனால் ஒரு கணினி புரிந்து கொள்ளும் படி நாம் ஒவ்வொரு எழுத்தையும் ஒவ்வொரு எண்ணாக மாற்றித்தான் சேமிக்கவேண்டும்.

சரி ஆங்கிலம் தெரிவதே இப்படி இடியாப்பச் சிக்கல் என்றால் வேறு சில மொழிகள் இப்போது நீங்கள் படித்துக் கொண்டிருக்கும் தமிழ் தெரிவது எப்படி?

ஒரு மொழியை நாம் கணிப்பொறியில் பயன்படுத்த வேண்டுமென்றால் அந்த மொழியின் ஒவ்வொரு எழுத்துக்கும் ஒவ்வொரு எண்ணை நிர்ணயிக்க வேண்டும். இவ்வாறு நிர்ணயிக்கும் முறையை நாம் குறியீட்டு முறை (Character Encoding) என்று அழைக்கிறோம். இதற்காகத் தான் இவ்வளவு மெனக்கிட வேண்டி இருக்கிறது.

நாம் இந்த குறியீட்டு முறையை பயன்படுத்தி ஒரு புத்தகத்தின் பக்கங்களை கணிணிக்குள் சேமித்துவிடுகிறோம் என்று வைத்துக்கொள்வோம். பிறகு அதை நாம் கணினி திரையில் பார்க்க விரும்பும் பொழுது, சேமித்த எண்களையெல்லம் கூட்டி, கழித்து எழுத்துக்களாக மாற்றும் வேலையை யாராவது செய்ய வேண்டுமில்லையா? கவலையை விடுங்கள், கணிப்பொறி எழுத்துரு (Fontஎன்ற கோப்புச்செயலியைப் பயன்படுத்தி, ஒவ்வொரு எண்ணுக்கும் என்ன எழுத்து வடிவம் என்பதை தேர்ந்தெடுத்து பிரதியிட்டுவிடும்.

ஆங்கில மொழிக்கு, தகவல் பரிமாற்றத்துக்கான அமெரிக்க நியமக் குறியீட்டு முறை சுருக்கமாக ஆஸ்கி – ASCII (American Standard Code For Information Interchange) அல்லது அதன் அடிப்படையில் உருவாக்கப்பட்ட விண்டோஸ் அமெரிக்க தேசியத் தரநிர்ணயக் கழக முறை சுருக்கமாக ஆன்ஸி – Windows ANSI (American National Standards Institute) என்ற குறியீட்டு முறையை பயன்படுத்துகிறார்கள்.

தமிழில் ஒவ்வொரு மென்பொருள் எழுத்துருவும் பற்பல தன்னார்வலர்களின் படைப்புகளாகும். ஆளாளுக்கு ஒவ்வொரு குறியீட்டு முறையைப் பயன்படுத்தி எழுதி வந்தார்கள்.

இதனால் இவர் எழுதுவது அவருக்கும் அவர் எழுதுவது இவருக்கும் புரியாத நிலை ஏற்பட்டது. விளைவு? தமிழில் ஒருவர் எழுதியது இன்னொருவருக்கு கிரேக்கம் இலத்தீன் போலத் தெரிந்தன.

இதனைச் சீர்செய்யும் முயற்சியில், புனேயில் உள்ள சி-டாக் – C-DAC (Centre for Development of Advanced Computing) என்ற இந்திய அரசு நிறுவனம் பல்வேறு கணினி நிபுணர்கள், விற்பன்னர்களின் துணையுடன் இந்திய மொழிகள் அனைத்திற்கும் பொதுவாக இந்திய நியமக் குறியீட்டு முறை சுருக்கமாக ‘இஸ்கி’ – ISCII (Indian Standard Code for Information Interchange) என்ற குறியீட்டு முறையை அறிமுகப்படுத்தியது.

இக்குறியீடு இந்திய மத்திய அரசு நிறுவனங்கள் மற்றும் மாவட்ட ஆட்சி மையங்களில் புகழ்பெற்ற அளவுக்கு பொதுமக்களிடம் போதுமான வரவேற்பைப் பெறாததால் தோல்வியடைந்தது.

பெரும்பாலான இந்திய மொழிகளைத் தன்னுள் அடக்க வல்ல எளிதான ஒரு குறியீட்டு முறையை உருவாக்குவதில் ‘இஸ்கி’ ஓரளவுக்கு வெற்றி கண்டாலும் மக்கள் ‘அஸ்கு புஸ்கு’ என்று அதனை ஒதுக்கிவிட்டார்கள்.

பிறகு, ஆங்கிலம் போல் தமிழிலும் எல்லோரும் ஒரே குறியீட்டு முறையை பயன்படுத்த வேண்டும் என்ற எண்ணத்தில், சென்னையில் 1999-ஆம் ஆண்டு பிப்ரவரி 7-8 தேதிகளில் நடைபெற்ற உலகத்தமிழ் இணைய மாநாட்டில் தமிழக அரசு இதற்கு தேவையான முயற்சிகளை மேற்கொண்டு சர்வதேச அங்கீகாரம் பெற்ற பொதுவான தமிழ் நியமக் குறியீட்டு முறை அல்லது ‘திஸ்கி’ (TSCII – Tamil Standard Code for Information Interchange) குறியீட்டு முறையை அறிவித்தது.

பதிவுகளை மின்னஞ்சலில் பெற

"Visits from 182 countries registered"