15 March, 2007

ਯੂਨੀਕੋਡ ਸਟੈਂਡਰਡ - ਫਾਇਦੇ ਅਤੇ ਨੁਕਸਾਨ

ਯੂਨੀਕੋਡ (Unicode) - ਮੇਰੀ ਇਸ ਪੰਜਾਬੀ ਲਿਖਣ ਦਾ ਅਧਾਰ,
ਅੱਜ ਕੱਲ੍ਹ ਸਭ ਓਪਰੇਟਿੰਗ ਸਿਸਟਮ ਵਿੱਚ ਭਾਸ਼ਾਵਾਂ ਲਿਖਣ ਲਈ ਵੀ ਮੁੱਢਲਾ ਅਧਾਰ ਹੈ।
ਅੱਜਕੱਲ੍ਹ ਯੂਨੀਕੋਡ UTF-8 ਸਭ ਤੋਂ ਹਰਮਨ ਪਿਆਰਾ ਹੈ।


ਯੂਨੀਕੋਡ
ਯੂਨੀਕੋਡ ਇੱਕ ਚਾਰਟ ਵਾਂਗ ਹੈ, ਜਿਸ ਵਿੱਚ ਦੁਨਿਆਂ ਦੀਆਂ ਸਾਰੀਆਂ ਨਹੀਂ ਤਾਂ ਬਹੁਤੀਆਂ ਭਾਸ਼ਾਵਾਂ
ਲਈ ਹਰੇਕ ਅੱਖਰ ਵਾਸਤੇ ਇੱਕ ਪੱਕਾ ਖਾਨਾ ਦਿੱਤਾ ਹੋਇਆ ਹੈ। ਜਿਵੇਂ ਉੜੇ (ੳ) ਲਈ ਵੱਖਰਾ
ਕੱਕੇ (ਕ) ਲਈ ਵੱਖਰਾ, ਇੰਝ ਹਰੇਕ ਭਾਸ਼ਾ ਲਈ ਵੱਖਰਾ ਥਾਂ ਨਿਸ਼ਚਿਤ ਕੀਤਾ ਗਿਆ ਹੈ ਅਤੇ
ਇਹ ਯਕੀਨੀ ਬਣਾਇਆ ਗਿਆ ਹੈ ਕਿ ਹਰੇਕ ਭਾਸ਼ਾ ਵਿੱਚ ਕੁਝ ਖਾਲੀ ਥਾਂ ਵੀ ਹੋਣ।

ਹੁਣ ਬਹੁਤ ਓਪਰੇਟਿੰਗ ਸਿਸਟਮ, ਜਿੰਨ੍ਹਾਂ ਵਿੱਚ ਵਿੰਡੋ ਐਕਸ ਪੀ, ਵਿਸਟਾ, ਲਿਨਕਸ
ਦੀਆਂ ਸਾਰੀਆਂ ਡਿਸਟਰੀਬਿਊਸ਼ਨਾਂ ਸ਼ਾਮਲ ਹਨ, ਯੂਨੀਕੋਡ ਲਈ ਤਿਆਰ ਹਨ,
ਇਸ ਦਾ ਮਤਲਬ ਇਹ ਹੈ ਕਿ ਤੁਸੀਂ ਮੇਰੇ ਇਹ ਲਿਨਕਸ ਰਾਹੀਂ ਲਿਖੀ ਪੰਜਾਬੀ
ਨੂੰ ਵਿੰਡੋ ਉੱਤੇ ਵੀ ਪੜ੍ਹ ਸਕਦੇ ਹੋ, ਉਹ ਵੀ ਬਿਨ੍ਹਾਂ ਵੱਖਰੇ ਫੋਂਟ ਇੰਸਟਾਲ ਕੀਤੇ, ਬਿਨਾਂ
ਇੰਕੋਡਿੰਗ ਬਦਲੇ, (ਜਿਵੇਂ ਕਿ ਹਾਲੀਂ ਕੁਝ ਪੰਜਾਬ ਅਖ਼ਬਾਰਾਂ ਦੀਆਂ ਸਾਇਟਾਂ
ਲਈ ਕਰਨਾ ਪੈਂਦਾ ਹੈ)।
ਬੱਸ ਪੰਜਾਬੀ ਦੇ ਯੂਨੀਕੋਡ ਫੋਂਟ ਹੋਣ ਅਤੇ ਸਭ ਕੁਝ ਪੰਜਾਬੀ 'ਚ ਵੇਖੋ:
0 ਵੈੱਬਸਾਇਟਾਂ
0 ਈ-ਮੇਲਾਂ
0 ਚੈਟਿੰਗ (ਗੱਲਾਬਾਤਾਂ)
0 ਸਾਫਟਵੇਅਰ
0 ਅਤੇ ਹੋਰ ਦਸਤਾਵੇਜ਼

ਮੇਰਾ ਸਾਰਾ ਕੰਮ ਲੱਗਭਗ ਯੂਨੀਕੋਡ ਉੱਤੇ ਹੀ ਨਿਰਭਰ ਹੈ, ਅਤੇ ਮੇਰੀ
ਕੰਪਨੀ ਵੀ ਆਪਣੇ ਉਤਪਾਦਾਂ ਨੂੰ ਯੂਨੀਕੋਡ ਦੇ ਅਧਾਰ ਉੱਤੇ ਹੀ
ਤਿਆਰ ਕਰਦੀ ਹੈ।

ਕਮੀਆਂ
0 ਹਾਲੇ ਤੱਕ ਕ੍ਰਮਬੱਧ (sorting) ਦਾ ਕੰਮ ਠੀਕ ਨਹੀਂ ਹੈ
0 ਪ੍ਹੈਰਾ 'ਚ ਪਾਉਣ ਵਾਲੇ ਅੱਖਰ ਵੀ ਮੌਜੂਦ ਨਹੀਂ ਹਨ, ਇਸਕਰਕੇ
ਵਰਤਣ ਵਾਸਤੇ ਸਮੱਸਿਆ ਆਉਦੀ ਹੈ

ਲੋਕਾਂ ਤੱਕ ਯੂਨੀਕੋਡ ਬਾਰੇ ਚੰਗੀ ਜਾਣਕਾਰੀ ਨਾ ਹੋਣ ਕਰਕੇ, ਸਾਇਟਾਂ
ਅਤੇ ਦਸਤਾਵੇਜ਼ਾਂ 'ਚ ਯੂਨੀਕੋਡ ਦੀ ਨਿਕੰਮੀ ਵਰਤੋਂ ਹੋ ਰਹੀ ਹੈ,
ਪਰ ਫੇਰ ਵੀ ਹੁਣ ਬਹੁਤ ਸਾਰੀਆਂ ਸਾਇਟਾਂ ਨੇ ਤੇਜ਼ੀ ਨਾਲ ਬਦਾਲਅ
ਸ਼ੁਰੂ ਕੀਤੇ ਹਨ ਅਤੇ ਛੇਤੀ ਹੀ ਨਵੇਂ ਰੂਪ 'ਚ ਸਾਹਮਣੇ ਆਉਣ ਲਈ
ਜਤਨਸ਼ੀਲ ਹਨ।

ਇੱਕ ਹੋਰ ਗੱਲ਼, ਜਿਸ ਨੂੰ ਲੈ ਕੇ ਆਮ ਲੋਕ ਉਲਝ ਜਾਂਦੇ ਹਨ,
ਕੀ-ਬੋਰਡ ਖਾਕੇ (ਲੇਆਉਟ) ਅਤੇ ਪੰਜਾਬੀ ਫੋਂਟ, ਇਹ ਭੰਬਲਭੂਸਾ ਪਾਇਆ
ਹੈ ASCII ਅਧਾਰਿਤ ਫੋਂਟਾਂ ਨੇ। ਉਹ ਅੰਗਰੇਜ਼ੀ ਦੇ ਅੱਖਰਾਂ ਉੱਤੇ ਪੰਜਾਬੀ ਦੇ
ਪਾਏ ਹੋਏ ਸਨ, ਇਸਤਰ੍ਹਾਂ ਯੂਨੀਕੋਡ ਮੁਤਾਬਕ ਉਹ ਥਾਂ ਤਾਂ ਅੰਗਰੇਜ਼ੀ ਅੱਖਰ ਦੀ
ਹੈ, ਪਰ ਉੱਤੇ ਦਿਸਦੇ ਪੰਜਾਬੀ ਦੇ ਹਨ।

ਪਹਿਲਾਂ -> ASCII - a ->ਅ (ਪੰਜਾਬੀ ਦੀ ਸ਼ਕਲ)

ਹੁਣ->
ਯੂਨੀਕੋਡ (0061) - a
ਯੂਨੀਕੋਡ (00A5) -ਅ

ਸੋ ਕੰਪਿਊਟਰ ਇਨ੍ਹਾਂ ਨੂੰ ਅੱਡ ਅੱਡ ਪਛਾਣ ਸਕਦਾ ਹੈ, ਇਸਕਰਕੇ ਹੁਣ
ਸਾਨੂੰ ਕੀ-ਬੋਰਡ ਲੇਆਉਟ ਅਤੇ ਫੋਂਟ ਨੂੰ ਅੱਡ ਅੱਡ ਸਮਝਣ ਦੀ ਲੋੜ ਹੈ

ਕੀ-ਬੋਰਡ ਲੇ-ਆਉਟ: ਕੰਪਿਊਟਰ ਮਾਨੀਟਰ ਉੱਤੇ ਦਿੱਸਣ ਲਈ
ਅੱਖਰ ਕੋਡ (0061/00A5) ਸੰਕੇਤ ਆਦਿ ਭੇਜਦਾ ਹੈ, ਜਿਸ ਨੂੰ
ਕੰਪਿਊਟਰ ਕਾਰਵਾਈ ਕਰਨ ਦੇ ਬਾਅਦ ਉਸ ਲਈ ਢੁੱਕਵੇਂ ਫੋਂਟ ਲੱਭ
ਕੇ ਮਾਨੀਟਰ ਦੀ ਸਕਰੀਨ ਉੱਤੇ ਵੇਖਾਉਦਾ ਹੈ

ਫੋਂਟ - ਇੱਕ ਕਿਸਮ ਦੀ ਤਸਵੀਰ ਹੈ, ਜੋਂ ਇੱਕ ਖਾਸ ਕੋਡ ਬਿੰਦੂ ਲਈ
ਕੰਪਿਊਟਰ ਵਿੱਚ ਸੰਭਾਲੀ ਹੁੰਦੀ ਹੈ, ਜੋ ਕੀ-ਬੋਰਡ ਵਲੋਂ ਭੇਜੇ ਕੋਡ
ਸੰਕੇਤ ਮੁਤਾਬਕ ਸਕਰੀਨ ਉੱਤੇ ਵੇਖਾਈ ਜਾਂਦੀ ਹੈ,
ਇੱਥੇ ਆਕੇ ਯੂਨੀਕੋਡ ਅਤੇ ASCII ਵਿੱਚ ਭਾਰੀ ਅੰਤਰ ਆ ਜਾਂਦਾ ਹੈ,
ਯੂਨੀਕੋਡ ਵਿੱਚ ਹਰੇਕ ਭਾਸ਼ਾ ਲਈ ਅੱਡ ਅੱਡ ਅੱਖਰ-ਕੋਡ ਹੋਣ ਕਰਕੇ,
ਵੱਖਰੇ ਵੱਖਰੇ ਫੋਂਟ ਹਨ, ਪਰ ascii ਵਿੱਚ ਉਸੇ ਕੋਡ ਉੱਤੇ ਵੱਖ ਵੱਖ
ਭਾਸ਼ਾਵਾਂ ਦੇ ਕੋਡ ਹਨ।

ਯੂਨੀਕੋਡ ਮੁਤਾਬਕ
A-Z ->0041-005A
a-z-> 0061 -007A

ੳ -> 0a73
ੲ -> 0a72
ਅ -> 0a05


ਕੀ-ਬੋਰਡ ਅਸਲ ਵਿੱਚ ਯੂਨੀਕੋਡ ਲਿਖਦਾ ਹੈ, ਜਦੋਂ ਤੁਸੀਂ a ਲਿਖਦੇ ਹੋ
ਤਾਂ ਅਸਲ ਵਿੱਚ ਉਹ (0061) ਅੱਖਰ ਦਾ ਸੰਕੇਤ ਕੰਪਿਊਟਰ ਨੂੰ ਭੇਜਦਾ ਹੈ,
ਜਦੋਂ ਸਕਰੀਨ ਉੱਤੇ ਦੇ ਵੇਖਾਉਣ ਦਾ ਦੌਰਾਨ ਫੋਂਟ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ,
ਜੇ ਤੁਸੀਂ ਫੋਂਟ ਯੂਨੀਕੋਡ ਅਧਾਰਿਤ ਚੁਣਿਆ ਹੈ ਤਾਂ ਉਹ 0061 ਉੱਤੇ ਮੌਜੂਦ
ਫੋਟੋ (ਜੋ ਫੋਂਟ ਤੋਂ ਆਉਦੀ ਹੈ) ਵੇਖਾਏਗਾ, ਉਹ ਚਾਹੇ ASCII ਆਧਾਰਿਤ
a ਹੋਵੇ, ਪੰਜਾਬੀ ਦਾ 'ਅ' ਹੋਵੇ ਭਾਵੇਂ ਊਰਦੂ ਦਾ 'ਪ',

ਜਦੋਂ ਪੰਜਾਬੀ ਲਿਖਣੀ ਹੋਵੇ ਤਾਂ ਤੁਹਾਨੂੰ ਕੀ-ਬੋਰਡ ਲੇਆਉਟ ਬਦਲਣਾ ਪਵੇਗਾ
ਭਾਵ ਕਿ ਕੀ-ਬੋਰਡ ਜੇਹੜੇ ਸੰਕੇਤ ਭੇਜੇਗਾ, ਉਹ ਹੁਣ 0061 ਦੀ ਬਜਾਏ
00A5 (ਪੰਜਾਬੀ ਲਈ 00A0 ਤੋਂ 00AF ਤੱਕ) ਭੇਜੇਗਾ, ਸੋ
ਕੰਪਿਊਟਰ ਮਾਨੀਟਰ ਉੱਤੇ ਵੇਖਾਉਣ ਦੌਰਾਨ ਪੰਜਾਬੀ ਦੇ ਫੋਂਟ ਹੀ ਵੇਖਾਏਗਾ,
ਭਾਵੇ ਕਿ ਤੁਸੀਂ ਕੋਈ ਫੋਂਟ ਨਾ ਚੁਣੇ ਹੋਣ (ਅਜੇਹਾ ASCII ਅਧਾਰਿਤ ਫੋਂਟਾਂ
ਲਈ ਕਰਨਾ ਪੈਂਦਾ ਸੀ)


ਫੁਟਕਲ:
ਨਾ-ਯੂਨੀਕੋਡ ਸਾਇਟਾਂ ਨੂੰ ਯੂਨੀਕੋਡ 'ਚ ਬਦਲਣ ਲਈ ਇੱਕ ਸਾਫਟਵੇਅਰ
ਮੇਰੇ ਹੱਥ ਆਇਆਂ ਸੀ, ਅਤੇ ਪੰਜਾਬੀ ਉਸ ਵਿੱਚ ਜੋੜ ਦਿੱਤੀ ਹੈ:
ਪਦਮਾ (padma)
ਤੁਸੀਂ ਇਹ ਪੈਕੇਜ ਨੂੰ ਸਿਰਫ਼ ਫਾਇਰਫਾਕਸ ਉੱਤੇ ਹੀ ਵਰਤ ਸਕਦੇ ਹੋ, ਪਰ
ਇਹ ਕਾਫ਼ੀ ਠੀਕ ਕੰਮ ਕਰਦਾ ਹੈ ਡਾਊਨਲੋਡ ਕਰੋ

ਬਾਕੀ ਪੰਜਾਬੀ ਵੈੱਬਸਾਇਟ ਬਾਰੇ ਫੇਰ ਕਦੇ ਲਿਖਾਗਾਂ

2 comments:

ਇੰਦਰ ਪੁੰਜ਼ said...

Wah.. Bie AAlam seah.....

Mainu tere te mann hain. Punjabi Boli De sewa Ese Tara Karde Rahoo.

Tim Teemaunde Tareeaa, dkha Deea mariya.
Saade wangoo Tu vi hain Udas.......:-P

ਇੰਦਰ ਪੁੰਜ਼ said...

Punjabeea Jubanee Ne rakaanee Mere Desh Diyeee...