http://weblog.netkadeh.net  , info at netkadeh dot org 

  

.: بسم‌الله  

اختراعی به نام يونی‌کد

.: چکیده مقاله یونی کد چیست؟ (unicode.org)

يونی‌کد به همه‌ی نويسه‌ها اعداد يکتايی اختصاص می‌دهد؛
مستقل از محيط، مستقل از برنامه، مستقل از زبان.
اصولاً، کامپيوترها فقط با اعداد سروکار دارند. آن‌ها حروف و نويسه‌های ديگر را با تخصيص يک عدد به هر يک، نگه‌داری می‌کنند. تا قبل از اختراع! يونی‌کد، صدها سيستم کُدگذاری مختلف برای تخصيص اين اعداد وجود داشت. نويسه‌های هيچ کُدگذاری‌ای به‌تنهايی کافی نبود: مثلاً اتحاديه‌ی اروپا به چندين کُدگذاری مختلف برای پوشاندن همه‌ی زبان‌هايش نياز داشت. حتی برای زبانی مثل انگليسی نيز هيچ کُدگذاری‌ای به‌تنهايی برای همه‌ی حروف، علائم نقطه‌گذاری، و نمادهای فنی متداول کافی نبود.
اين سيستم‌ها با هم تعارض نيز داشتند. يعنی، دو کُدگذاری ممکن بود از اعداد يکسان برای دو نويسه‌ی مختلف، يا از اعداد مختلف برای نويسه‌های يکسان استفاده کنند. کامپيوترها (بالاخص خادم‌های شبکه) از کُدگذاری‌های مختلف و متعددی پشتيبانی می‌کردند؛ با وجود اين، هرگاه داده‌ها از کُدگذاری‌ها يا محيط‌های مختلف عبور می‌کردند، در معرض خطر تحريف قرار می‌گرفتند.
:: يونی‌کد اين شرايط را تغيير می‌دهد!
يونی‌کد به همه‌ی نويسه‌ها اعداد يکتايی اختصاص می‌دهد، مستقل از محيط، مستقل از برنامه، و مستقل از زبان. استاندارد يونی‌کد را پيشتازان صنعت کامپيوتر، شرکت‌هايی چون آرکل، آی‌بی‌ام، اَپل، جاست‌سيستم، سان، سای‌بيْس، مايکروسافت، هيولت پاکارد، يونی‌سيس، SAP و بسياری ديگر، پذيرفته‌اند. استانداردهايی چون XML، جاوا، اکماسْکريپت (جاواسْکريپت)، LDAP‏،‏ CORBA 3.0‏،‏ WML‏،‏ و غيره، يونی‌کد را ملزم می‌دانند، و روش رسمی پياده‌سازی استاندارد ISO/IEC 10646 نيز يونی‌کد است. يونی‌کد در بسياری از سيستم‌عامل‌ها، همه‌ی مرورگرهای اخير، و بسياری از محصولات ديگر پشتيبانی می‌شود. پيدايش استاندارد يونی‌کد، و در دسترس بودن ابزارهايی که از آن پشتيبانی می‌کنند، از چشمگيرترين روندها در فن‌آوری‌های اخير جهانی‌سازی نرم‌افزارها بوده است.
گنجاندن يونی‌کد در سکّوهای وب و برنامه‌های کاربردی خادم‌ـمخدومی يا چندلايه‌ای، می‌تواند در مقايسه با استفاده از مجموعه‌نويسه‌های قديمی، باعث کاهش قابل ملاحظه‌ی هزينه‌ها شود. يونی‌کد اين امکان را فراهم می‌کند که محصولات نرم‌افزاری يا سکوهای وب منفرد بتوانند بدون نياز به طراحی مجدد، در محيط‌ها، زبان‌ها، و کشورهای متعدد کار کنند. يونی‌کد به داده‌ها امکان می‌دهد که بدون تحريف از سيستم‌های مختلف عبور داده شوند.


.: چکیده مقاله اميررضا قويدل (ايران دولوپرز)

به زبان ساده مي‌توان گفت كه يوني‌كد روشي براي تبديل متون به رشته‌هاي عددي قابل ذخيره در كامپيوتر است. روش‌هاي گوناگوني براي اين كار وجود دارند، ولي مزيت يوني‌كد نسبت به آنها، اين است كه يك روش كامل جهاني است؛ به اين معني كه حروف همه زبان‌هاي دنيا و تمامي علائم مورد استفاده همه مردم جهان در آن آمده‌اند و همچنين در همه‌جا قابل نمايش است و نياز به امكانات خاصي ندارد.
به بيان ديگر، «استاندارد يوني‌كد» استاندارد جهاني كدگذاري كاركترهاست كه براي پردازش كامپيوتري متون به كار مي‌رود.
اين استاندارد، تقريباً توسط تمامي شركت‌هاي بين‌المللي كامپيوتري، مانند آي.بي.ام، مايكروسافت، و سان، و نيز موسسات ملي استاندارد در كشورهاي مختلف جهان براي تبادل اطلاعات چندزبانه٬ مورد توافق قرار گرفته است و سرعت رشد بسيار زيادي نيز در ميان كاربران دارد.
اين استاندارد از كدگذاري 16بيتي استفاده مي‌كند كه براي بيش از65000 (دقیقا ۶۵۵۳۶) نويسه (كاراكتر) جا فراهم مي‌كند. اگر چه 65000 نويسه براي كدگذاري اكثر نويسه‌هايي كه در زبان‌هاي مهم دنيا استفاده مي‌شود كافي است، با اين حال يوني‌كد شيوه‌گسترشي به‌نام UTF-16 فراهم كرده است كه امكان اضافه‌كردن حدود يك ميليون نويسه ديگر را نيز مي‌دهد. اين دامنه براي كليه نويسه‌هاي عالم، از جمله پوشش كامل همه خط‌هاي باستاني! (همچون خط ميخي) نيز كافي است.
يوني‌كد براي كليه نويسه‌هاي مورد استفاده در زبان‌هاي عمده دنيا كد تعيين كرده‌است. به‌علت گسترده‌بودن فضاي تخصيص نويسه، اين استاندارد بسياري از نمادهاي لازم براي حروف‌چيني را نيز در بر گرفته‌است. از خط‌هاي مورد پشتيباني اين استاندارد مي‌توان به لاتين (دربرگيرنده اكثر زبان‌هاي اروپايي)، سيريليك(روسي، صربي)، يوناني، عربي (شامل عربي، فارسي، اردو، كردي)، عبري، هندي، ارمني، آسوري، چيني، كاتاكانا و هيراگانا(ژاپني)، و هانگول (كره‌اي) اشاره‌كرد. به‌علاوه، تعداد زيادي نماد رياضي و فني علائم نقطه‌گذاري، پيكان، و علامت‌هاي متفرقه‌در اين استاندارد وجود دارد. اين استاندارد براي علامت‌هاي ‌تركيب‌شونده‌ يا اعراب‌ها نيز كدهايي در نظر گرفته‌است.
در استاندارد يوني‌كد، نويسه‌هاي فارسي در بلوك مربوط به‌خط‌ عربي‌ قرار دارند. اين بلوك‌براي دربرگرفتن نويسه‌هاي زبان‌هايي كه‌از خط عربي‌استفاده‌مي‌كنند، مثل فارسي، اردو، پشتو، سندي و كردي گسترش يافته است. اين بلوك نشانه‌هاي قرآني از قبيل نشانه‌هاي سجده و پايان آيه، و علائم وقف را نيز در بردارد.
در يوني‌كد با وجود يكي‌سازي كدهاي حروف مشترك، براي حروف فارسي كه بار معنايي يا نمايشي متفاوت با حروف عربي دارند، نويسه‌هاي جداگانه درنظر گرفته‌شده‌است. يعني كليه حروف خاص فارسي (پ، چ، ژ، گ) و نيز «ك» و «ي» فارسي كه‌با حرف مشابه‌در عربي‌تفاوت نمايشي دارند، مكان‌جداگانه‌اي به‌خود اختصاص داده‌اند. كليه اعراب‌هاي متداول حضور دارند و ميان شكل‌فارسي/اردو و عربي ارقام نيز به‌علت شكل و رفتار متفاوت، تفاوت‌هايي منظور گشته‌است.
از طرف ديگر، علائم نقطه‌گذاري چون نقطه و فاصله كه‌شكلي كساني‌در خط‌هاي لاتين و عربي دارند، كد يكسان‌ دارند. علائمي‌چون پرانتز نيز، بسته به جهت متن، آينه‌اي مي‌شوند، به طور مثال، نويسه 0028 نماينده «پرانتز باز» است، و نه«پرانتز سمت‌چپ». يوني‌كد اتصال‌مجازي و فاصله مجازي را نيز تحت‌نام‌هاي «اتصال با عرض‌صفر» و «بي‌اتصالي با عرض‌صفر» به‌رسميت مي‌شناسد.

:: از مهم‌ترين مزايايي كه يوني‌كد براي زبان فارسي دارد (مثل بسياري زبان‌هاي ديگر) مي‌توان موارد زير را نام برد:
1. در نسخه استاندارد هر نرم‌افزاري كه از اين استاندارد پشتيباني كند، مي‌توان فارسي نوشت يا متون فارسي را خواند. بدين ترتيب ديگر نيازي به تأمين نسخه‌هاي خاص فارسي يا عربي نيست.

2. براي خواندن متون فارسي كه توسط شركت خاصي نوشته شده‌اند، نيازي به داشتن فونت خاص آن شركت نداريم و هر متن فارسي كه با استاندارد يوني‌كد، كدگذاري شده باشد، با هر فونت يوني‌كدي قابل مشاهده است.

3. امكان استفاده هم‌زمان از زبان‌هاي فارسي و انگليسي را تأمين مي‌كند.

4. بدون استفاده از فونت‌هاي خاص امكان استفاده از علائم خاص را فراهم مي‌كند.

بدن ترتيب ملاحظه مي‌شود كه براي حل مشكلات موجود، و نيز رفتن به سوي يك استاندارد مقبول و همه‌جانبه، استاندارد يوني‌كد، روشي مناسب به نظر مي‌رسد.

... توضيح اينکه؛ اين روش کدگذاری بين سال های ۱۹۸۸ و ۱۹۹۱ ابداع گرديد.

ياعلی؛

 

باحال ترين وبلاگ كامپيوتري 

دور دنيا در چند کليک! 

PHP در سه سوت! 




پخش زنده از نتكده: 

هيچ پيغامي بي‌جواب نخواهد ماند. 

  


نتکده در سالی که گذشت:
دي 81، بهمن 81، اسفند 81،
فروردين 82، ارديبهشت 82، خرداد 82،
تير 82، مرداد 82، شهريور 82،
مهر 82، آبان 82، آذر 82، دي 82

.: بر روي پرشين بلاگ


 

: نمايندگي فعال! شويد

Netkadeh Weblog

 

با تشكر از پشتياني:

پرشين بلاگ

 

:: تاسيس: 11 ديماه 1381

 

 

 

؛