دسترسی نامحدود
برای کاربرانی که ثبت نام کرده اند
برای ارتباط با ما می توانید از طریق شماره موبایل زیر از طریق تماس و پیامک با ما در ارتباط باشید
در صورت عدم پاسخ گویی از طریق پیامک با پشتیبان در ارتباط باشید
برای کاربرانی که ثبت نام کرده اند
درصورت عدم همخوانی توضیحات با کتاب
از ساعت 7 صبح تا 10 شب
ویرایش: نویسندگان: Steven Moran, Michael Cysouw سری: ناشر: سال نشر: 2020 تعداد صفحات: [119] زبان: English فرمت فایل : PDF (درصورت درخواست کاربر به PDF، EPUB یا AZW3 تبدیل می شود) حجم فایل: 628 Kb
در صورت تبدیل فایل کتاب The Unicode Cookbook for Linguists: Managing writing systems using orthography profiles به فرمت های PDF، EPUB، AZW3، MOBI و یا DJVU می توانید به پشتیبان اطلاع دهید تا فایل مورد نظر را تبدیل نمایند.
توجه داشته باشید کتاب کتاب آشپزی یونیکد برای زبان شناسان: مدیریت سیستم های نوشتاری با استفاده از نمایه های املایی نسخه زبان اصلی می باشد و کتاب ترجمه شده به فارسی نمی باشد. وبسایت اینترنشنال لایبرری ارائه دهنده کتاب های زبان اصلی می باشد و هیچ گونه کتاب ترجمه شده یا نوشته شده به فارسی را ارائه نمی دهد.
این متن به عنوان یک راهنمای عملی برای زبان شناسان و برنامه نویسانی است که با داده ها در محیط های محاسباتی چند زبانه کار می کنند. ما مفاهیم اساسی مورد نیاز برای درک نحوه عملکرد سیستم های نوشتاری و رمزگذاری کاراکترها و نحوه کار آنها با یکدیگر را معرفی می کنیم. تلاقی استاندارد یونیکد و الفبای آوایی بین المللی اغلب بدون ناامیدی توسط کاربران برآورده نمی شود. با این وجود، این دو استاندارد، یک معماری محاسباتی سازگار برای پردازش، انتشار و تجزیه و تحلیل دادهها از بسیاری از زبانهای مختلف را در اختیار محققان زبان قرار داده است. ما مشکلات رایج، اما نه همیشه شفافی را که محققان هنگام کار با Unicode و IPA با آن مواجه میشوند، آشکار میکنیم. تحقیق ما از روشهای کمی برای مقایسه زبانها و کشف و روشن کردن روابط فیلوژنتیکی آنها استفاده میکند. با این حال، اکثر دادههای واژگانی موجود از زبانهای جهان به صورت املایی خاص نویسنده یا سند است. پس از شناسایی و غلبه بر مشکلات مربوط به ایجاد سیستمهای نوشتاری و رمزگذاری کاراکترها از نظر نحوی و معنایی (تا حدی که میتوانند)، ما مجموعهای از ابزارهای منبع باز Python و R را برای کار با زبانها با استفاده از پروفایلهایی ایجاد کردیم که به اندازه کافی زبانها را توصیف میکنند. قراردادهای املایی استفاده از نمایه های املایی و این ابزارها به کاربران امکان می دهد متن را بخش بندی کنند، آن را تجزیه و تحلیل کنند، خطاها را شناسایی کنند و آن را به اشکال نوشتاری مختلف تبدیل کنند.
This text is meant as a practical guide for linguists, and programmers, who work with data in multilingual computational environments. We introduce the basic concepts needed to understand how writing systems and character encodings function, and how they work together. The intersection of the Unicode Standard and the International Phonetic Al- phabet is often not met without frustration by users. Nevertheless, the two standards have provided language researchers with a consistent computational architecture needed to process, publish and analyze data from many different languages. We bring to light common, but not always transparent, pitfalls that researchers face when working with Unicode and IPA. Our research uses quantitative methods to compare languages and uncover and clarify their phylogenetic relations. However, the majority of lexical data available from the world’s languages is in author- or document-specific orthogra- phies. Having identified and overcome the pitfalls involved in making writing systems and character encodings syntactically and semantically interoperable (to the extent that they can be), we created a suite of open-source Python and R tools to work with languages using profiles that adequately describe their orthographic conventions. Using orthography profiles and these tools allows users to segment text, analyze it, identify errors, and to transform it into different written forms.