در ضمیمه شماره ۹ استاندارد یونیکد که در آن الگوریتم دو جهته (مخصوص متون راست به چپ) معرفی شده ۷ نویسه مخصوص کار با متون راستنویس مثل فارسی و عربی معرفی شده است. این نویسهها نقش بسیار مهمی در نمایش صحیح متون راست به چپ دارند. در واقع بدون وجود آنها نمیتوان متون راست به چپ را به طور کاملاً صحیح نمایش داد. متون و نویسهها در استاندارد یونیکد بر اساس ترتیب معنایی (منطقی) ذخیره میشوند. ترتیب منطقی یعنی همان ترتیبی که حروف از ذهن خواننده یا نویسنده متن میگذرد. حال هر گاه بخواهیم متون ذخیره شده را در صفحه نمایش یا چاپگر نمایش دهیم باید ترتیب منطقی را با یک روش مناسب به ترتیب دیداری تبدیل کنیم. این روش همان چیزی است که در الگوریتم دوجهته یونیکد یعنی الگوریتم دوجهته توضیح داده شده است.
در بعضی شرایط خاص نمیتوان ترتیب دیداری درستی از ترتیب منطقی (معنایی) به دست آورد. به همین علت الگوریتم دوجهته از تعدادی نویسه ویژه یونیکد برای رفع این مشکل استفاده میکند. این نویسهها فقط در تصحیح شیوه نمایش کلمات استفاده میشوند و هیچ تاثیری روی مرتبسازی، جستجو یا دیگر پردازشهای متنی نباید داشته باشد. در واقع پیوست الف استاندارد ماتصا ۶۲۱۹ که با توجه به الگوریتم دوجهته ضمیمه شماره ۹ نوشته شده تاکید میکند که کاربردها باید این نویسهها را در هر پردازشی غیر از استخراج نحوه صحیح نمایش در نظر نگرفته و به آن توجهی نکنند. ضمیمه شماره ۹ و این نویسهها رسماً بخشی از استاندارد ملی ایران یعنی ماتصا ۶۲۱۹ (ISIRI 6219) را تشکیل میدهند. علاوه بر این استاندارد ماتصا ۹۱۴۷ (ISIRI 9147) هم ۷ کلید را به تحریر این نویسهها اختصاص داده که همگی با ترکیب کلید ALT راست تحریر میشوند. دقت شود که کاربرد اصلی این نویسهها و الگوریتم دو جهته در متون راست به چپ مثل فارسی و عربی و متون ترکیبی فارسی-انگلیسی است به خصوص در مواردی که پای اعداد و علائم هم به وسط میآید. این نویسهها در متون صرفاً چپ به راست مثل انگلیسی هیچ کاربردی ندارند.
جالب است بدانید طراح اصلی این الگوریتم شخصی است به نام مارک دیویس (Mark Davis) که هم اکنون در گوگل کار میکند. این شخص نه فارسی بلد است، نه عربی، نه عبری و نه هیچ زبان راست به چپ دیگری! قصه طراحی الگوریتم دوجهته ضمیمه شماره ۹ توسط مارک دیویس مرا به یاد داستان تصحیح مثنوی معنوی توسط رینولد نیکلسون و تصحیح شاهنامه فردوسی در مسکو (و علی القاعده توسط روسها) میاندازد!
و اما خود نویسهها:
نام به کار رفته در ماتصا ۶۲۱۹ | نام مخفف استفاده شده در الگوریتم دوجهته | کد یونیکد |
زیرمتن چپ به راست | LRE | U+202A |
زیرمتن راست به چپ | RLE | U+202B |
پایان زیر متن | U+202C | |
زیرمتن اکیداً چپ به راست | LRO | U+202D |
زیرمتن اکیداً راست به چپ | RLO | U+202E |
نشانهی چپ به راست | LRM | U+200E |
نشانهی راست به چپ | RLM | U+200F |
مطالعه بیشتر:
الگوریتم دوجهته (ضمیمه شماره ۹ استاندارد یونیکد)
استاندارد ماتصا ۶۲۱۹
استاندارد ماتصا ۹۱۴۷
نوشته حاجلو راجع به به هم ریختگی متون فارسی-انگلیسی
پ. ن.: در این نوشته از اصطلاحات و واژگان استاندارد ماتصا ۶۲۱۹ استفاده شده است.