آرشیو تگ ها: Unicode

فردیس

«فردیس» یک پروژه‌ی Open Source خیلی کوچک است که برای کار با یونیکد ایجاد شده است. «فردیس» در یک دوره‌ی زمانی که به شدت نیاز به این داشتیم که بفهمیم فلان کلید صفحه کلید یا فلان کاراکتر دقیقاً کدام نویسه‌ی یونیکد است، کد آن چیست، نام رسمی آن در یونیکد چیست و در فونت‌های مختلف …

‫استفاده از کدام Encoding برای ذخیره فایل‌ها بهتر است؟

خیلی قدیم‌ها فایل‌های متنی صرفا در قالب اسکی (ANSI) ذخیره می‌شدند. در این قالب به ازای هر نویسه یا کاراکتر دقیقاً یک بایت وجود داشت. علاوه بر این از هیچ (مجموعه) کاراکتری در ابتدای فایل به عنوان header استفاده نمی‌شد. اما حالا با وجود code pageها و یونیکد اوضاع فرق کرده است. حالا باید برای …

آدم‌ها و سازمان‌های مرتبط با پروژه‌های فارسی سازی

مدت‌ها پیش که علاقه‌ام به مسائل فارسی‌سازی خیلی زیاد شد شروع به جمع‌آوری منابعی برای یادگیری بیشتر کردم. حال آنها را به صورت کاملاً خام و دسته‌بندی نشده در اینجا قرار می‌دهم بلکه برای دیگران هم استفاده‌ای داشته باشد. ۱- شرکت فارسی وب شریف: شرکت فارسی‌وب شریف، سهامی خاص در سال ۱۳۸۲ بر پایه گروهی …

مشکل اعداد فارسی و استانداردهای ۶۲۱۹ و ۹۱۴۷

یکی از مشکلات پیش روی استانداردهای ماتصا ۶۲۱۹ و ماتصا ۹۱۴۷ عدم پشتیبانی تعداد زیادی از نرم‌افزارهای موجود از اعداد فارسی است. این دسته از نرم‌افزارها به خصوص آنها که قرار است روی این اعداد پردازشی انجام دهند، یا به طور کلی از پذیرش اعداد فارسی سر باز زده یا دچار خطا شده و رفتارهای …

سندرم شماره نامه به هم ریخته

همه کسانی که در نوشتن نرم‌افزارهای دبیرخانه دخیل بوده‌اند با مشکلی به اسم به هم ریختگی شماره نامه آشنا هستند. شماره نامه معمولاً ترکیبی از اعداد، علائم، حروف فارسی و گاهاً انگلیسی هستند. از آنجا که ما در یک محیط دو جهته زندگی می‌کنیم هنوز در نحوه چینش صحیح این حروف در کنار یکدیگر ابهاماتی …

موضوعات نرم‌افزاری که وقت نکردم روی آنها کار کنم

این‌ها فهرستی از موضوعاتی هستند که روزی می‌خواستم درباره آنها بنویسم یا این که درباره‌شان مطالعه کنم. اما چون ممکن است هیچ وقت فرصت این کار را پیدا نکنم آنها را در اینجا می‌گذارم تا هم خودم یادم نرود روی چه چیزی می‌خواستم کار کنم و هم شاید بقیه علاقه‌مند به آنها شدند و چیزی …

آشنایی با نویسه‌های ویژه یونی‌کد برای متون راست به چپ

در ضمیمه شماره ۹ استاندارد یونی‌کد که در آن الگوریتم دو جهته (مخصوص متون راست به چپ) معرفی شده ۷ نویسه مخصوص کار با متون راست‌نویس مثل فارسی و عربی معرفی شده است. این نویسه‌ها نقش بسیار مهمی در نمایش صحیح متون راست به چپ دارند. در واقع بدون وجود آنها نمی‌توان متون راست به …

ماتصا ۹۱۴۷ استانداردی برای صفحه کلید

ماتصا ۹۱۴۷ یا همان ISIRI 9147 جدیدترین استانداردی است که موسسه استاندارد و تحقیقات صنعتی ایران برای چیدمان حروف و علائم خط فارسی بر روی صفحه کلید کامپیوتر منتشر کرده است. این استاندارد در سال ۱۳۸۶ انتشار یافته است. و در حال حاضر (مرداد ۱۳۸۸) آخرین و جدیدترین استاندارد در این زمینه محسوب می‌شود. ماتصا …

‫‫استاندارد ماتصا ۶۲۱۹ (ISIRI 6219)

این استاندارد توسط موسسه استاندارد و تحقیقات صنعتی ایران (ماتصا) برای تعریف و یکسان‌سازی استفاده از حروف و الفبای فارسی در محیط کامپیوتر در اردیبهشت ۱۳۸۱ تدوین شده است. این استاندارد در حال حاضر (تیر ۱۳۸۸) جدیدترین استاندارد در این زمینه و جایگزین کلیه استانداردهای قدیمی‌تر ماتصا ۳۳۴۲، ماتصا ۲۹۰۰ و استانداردهای غیر رسمی ویندوز …