دسترسی نامحدود
برای کاربرانی که ثبت نام کرده اند
برای ارتباط با ما می توانید از طریق شماره موبایل زیر از طریق تماس و پیامک با ما در ارتباط باشید
در صورت عدم پاسخ گویی از طریق پیامک با پشتیبان در ارتباط باشید
برای کاربرانی که ثبت نام کرده اند
درصورت عدم همخوانی توضیحات با کتاب
از ساعت 7 صبح تا 10 شب
ویرایش: 1
نویسندگان: Fort. Karòn
سری: Focus Series
ISBN (شابک) : 1848219040, 9781848219045
ناشر: Wiley-ISTE
سال نشر: 2016
تعداد صفحات: 196
زبان: English
فرمت فایل : PDF (درصورت درخواست کاربر به PDF، EPUB یا AZW3 تبدیل می شود)
حجم فایل: 4 مگابایت
در صورت تبدیل فایل کتاب Collaborative Annotation for Reliable Natural Language Processing: Technica به فرمت های PDF، EPUB، AZW3، MOBI و یا DJVU می توانید به پشتیبان اطلاع دهید تا فایل مورد نظر را تبدیل نمایند.
توجه داشته باشید کتاب حاشیه نویسی مشترک برای پردازش قابل اعتماد زبان طبیعی: تکنیکا نسخه زبان اصلی می باشد و کتاب ترجمه شده به فارسی نمی باشد. وبسایت اینترنشنال لایبرری ارائه دهنده کتاب های زبان اصلی می باشد و هیچ گونه کتاب ترجمه شده یا نوشته شده به فارسی را ارائه نمی دهد.
این کتاب فرصتی منحصر به فرد برای ایجاد یک تصویر ثابت از حاشیه نویسی دستی مشترک برای پردازش زبان طبیعی (NLP) ارائه می دهد. NLP در 25 سال گذشته شاهد دو تحول بزرگ بوده است: اول، موفقیت خارقالعاده یادگیری ماشینی، که اکنون، خوب یا بد، غالباً در این زمینه غالب است، و دوم، افزایش کمپینهای ارزیابی یا وظایف مشترک. هر دو شامل پیکرههایی با حاشیهنویسی دستی برای آموزش و ارزیابی سیستمها میشوند.
این مجموعهها به تدریج به ستونهای پنهان دامنه ما تبدیل شدهاند، و غذا برای الگوریتمهای یادگیری ماشین گرسنه ما و مرجعی برای ارزیابی فراهم میکنند. حاشیه نویسی اکنون مکانی است که زبان شناسی در NLP پنهان می شود. با این حال، حاشیه نویسی دستی تا حد زیادی برای مدتی نادیده گرفته شده است، و حتی مدتی طول کشیده است تا دستورالعمل های حاشیه نویسی ضروری شناخته شوند.
اگرچه اخیراً تلاش هایی برای پرداختن به برخی از مسائل ارائه شده توسط انجام شده است. حاشیه نویسی دستی، هنوز تحقیقات کمی در مورد این موضوع انجام شده است. هدف این کتاب ارائه برخی از بینش های مفید در مورد موضوع است.
حاشیه نویسی دستی پیکره اکنون در قلب NLP قرار دارد و هنوز تا حد زیادی ناشناخته است. نیاز به مهندسی حاشیه نویسی دستی (به معنای یک فرآیند کاملاً رسمی) وجود دارد، و این کتاب با هدف ارائه اولین گام به سمت یک روش شناسی کل نگر با دیدگاهی جهانی در مورد حاشیه نویسی است.
This book presents a unique opportunity for constructing a consistent image of collaborative manual annotation for Natural Language Processing (NLP). NLP has witnessed two major evolutions in the past 25 years: firstly, the extraordinary success of machine learning, which is now, for better or for worse, overwhelmingly dominant in the field, and secondly, the multiplication of evaluation campaigns or shared tasks. Both involve manually annotated corpora, for the training and evaluation of the systems.
These corpora have progressively become the hidden pillars of our domain, providing food for our hungry machine learning algorithms and reference for evaluation. Annotation is now the place where linguistics hides in NLP. However, manual annotation has largely been ignored for some time, and it has taken a while even for annotation guidelines to be recognized as essential.
Although some efforts have been made lately to address some of the issues presented by manual annotation, there has still been little research done on the subject. This book aims to provide some useful insights into the subject.
Manual corpus annotation is now at the heart of NLP, and is still largely unexplored. There is a need for manual annotation engineering (in the sense of a precisely formalized process), and this book aims to provide a first step towards a holistic methodology, with a global view on annotation.
Content: Preface ix List of Acronyms xi Introduction xiii Chapter 1. Annotating Collaboratively 1 1.1. The annotation process (re)visited 1 1.1.1. Building consensus 1 1.1.2. Existing methodologies 3 1.1.3. Preparatory work 7 1.1.4. Pre-campaign 13 1.1.5. Annotation 17 1.1.6. Finalization 21 1.2. Annotation complexity 24 1.2.1. Example overview 25 1.2.2. What to annotate? 28 1.2.3. How to annotate? 30 1.2.4. The weight of the context 36 1.2.5. Visualization 38 1.2.6. Elementary annotation tasks 40 1.3. Annotation tools 43 1.3.1. To be or not to be an annotation tool 43 1.3.2. Much more than prototypes 46 1.3.3. Addressing the new annotation challenges 49 1.3.4. The impossible dream tool 54 1.4. Evaluating the annotation quality 55 1.4.1. What is annotation quality? 55 1.4.2. Understanding the basics 56 1.4.3. Beyond kappas 63 1.4.4. Giving meaning to the metrics 67 1.5. Conclusion 75 Chapter 2. Crowdsourcing Annotation 77 2.1. What is crowdsourcing and why should we be interested in it? 77 2.1.1. A moving target 77 2.1.2. A massive success 80 2.2. Deconstructing the myths 81 2.2.1. Crowdsourcing is a recent phenomenon 81 2.2.2. Crowdsourcing involves a crowd (of non-experts) 83 2.2.3. Crowdsourcing involves (a crowd of) non-experts 87 2.3. Playing with a purpose 93 2.3.1. Using the players innate capabilities and world knowledge 94 2.3.2. Using the players school knowledge 96 2.3.3. Using the players learning capacities 97 2.4. Acknowledging crowdsourcing specifics 101 2.4.1. Motivating the participants 101 2.4.2. Producing quality data 107 2.5. Ethical issues 109 2.5.1. Game ethics 109 2.5.2. What s wrong with Amazon Mechanical Turk? 111 2.5.3. A charter to rule them all 113 Conclusion 115 Appendix 117 Glossary 141 Bibliography 143 Index 163