دسترسی نامحدود
برای کاربرانی که ثبت نام کرده اند
برای ارتباط با ما می توانید از طریق شماره موبایل زیر از طریق تماس و پیامک با ما در ارتباط باشید
در صورت عدم پاسخ گویی از طریق پیامک با پشتیبان در ارتباط باشید
برای کاربرانی که ثبت نام کرده اند
درصورت عدم همخوانی توضیحات با کتاب
از ساعت 7 صبح تا 10 شب
ویرایش:
نویسندگان: Mark Kaunisto (editor). Marco Schilk (editor)
سری: Studies in Corpus Linguistics, 118
ISBN (شابک) : 902721588X, 9789027215888
ناشر: John Benjamins
سال نشر: 2024
تعداد صفحات: 182
زبان: English
فرمت فایل : PDF (درصورت درخواست کاربر به PDF، EPUB یا AZW3 تبدیل می شود)
حجم فایل: 7 مگابایت
در صورت تبدیل فایل کتاب Challenges in Corpus Linguistics: Rethinking Corpus Compilation and Analysis به فرمت های PDF، EPUB، AZW3، MOBI و یا DJVU می توانید به پشتیبان اطلاع دهید تا فایل مورد نظر را تبدیل نمایند.
توجه داشته باشید کتاب چالش در زبانشناسی Corpus: تجدید نظر در تدوین و تجزیه و تحلیل Corpus نسخه زبان اصلی می باشد و کتاب ترجمه شده به فارسی نمی باشد. وبسایت اینترنشنال لایبرری ارائه دهنده کتاب های زبان اصلی می باشد و هیچ گونه کتاب ترجمه شده یا نوشته شده به فارسی را ارائه نمی دهد.
Table of contents Acknowledgements From fallacies and pitfalls to solutions and future directions References Engaging with bad (meta)data in historical corpus linguistics 1. Introduction 2. POS annotation in diachronic datasets 2.1 Accounting for category change 2.2 Theoretical choices in the design of the annotation scheme 2.3 Annotation tailored to specific research questions 3. Large corpora 3.1 Inaccuracies in text sampling 3.2 Changes in the balance of subgenres 4. Historical databases 4.1 Issues with balance and metadata 4.2 OCR errors 4.2.1 Hapax legomena 4.2.2 Historical lexis 5. Discussion and conclusion Funding Acknowledgements References Named entities as potentially problematic items in corpora 1. Introduction 2. Background 2.1 The concepts of proper nouns and proper names 2.2 Annotation of named entities 3. Case studies 3.1 Common nouns used as (parts of) proper nouns 3.2 Near-synonymous adjectives in named entities 4. Discussion and conclusion References Challenges in the compilation, annotation, and analysis of learner corpus data 1. Introduction and general remarks 2. Challenges and how to respond to them 2.1 Multilingual practices and metalinguistic language use Response 2.2 Task effects Response 2.3 “Discourse of deficit” and learner corpus annotation Response 3. Summary and conclusion References Early newspapers as data for corpus linguistics (and Digital Humanities) 1. Introduction 2. Digital text analysis in the humanities 2.1 Digital Humanities 2.2 Corpus linguistics 2.3 Towards a useful synergy 3. Historical newspaper prose and the British Library Newspapers database 3.1 Problems with available search tools 3.2 Sampling, balance, and representativeness 3.3 Registers and subregisters 3.4 Optical Character Recognition (OCR) 4. Discussion References Open Corpus Linguistics – or How to overcome common problems in dealing with corpus data by adopting open research practices 1. Introduction 2. Revisiting Rissanen’s problems 3. Open Corpus Linguistics 4. Conclusion Acknowledgements References Text length and short texts 1. Introduction 2. Background 2.1 Text length, corpora, and social media 2.2 The importance of text length 3. Solutions and workarounds 3.1 Manipulation of the data 3.1.1 Exclusion 3.1.2 Combining 3.1.3 Chunking 3.2 Computational and statistical approaches 3.2.1 Lengthwise analysis 3.2.2 Multiple Correspondence Analysis 3.2.3 Resampling methods 3.3 A related problem 4. Conclusion References Corpus genre categories 1. Introduction 2. Looking up from the pit 3. Text genre categorization in literature 4. Text genre categorization in linguistics 5. The genre category pitfall 6. Conclusion References Modeling fine-grained sociolinguistic variation 1. Introduction 2. Theoretical and methodological background 2.1 Semantic shifts in Quebec English 2.2 Twitter-based corpora for language variation 2.3 Vector space models for lexical semantic variation 3. Data and method 3.1 A corpus of tweets 3.2 A set of semantic shifts in Quebec English 3.3 Neural word embeddings 3.4 Clustering and annotating the uses of a lexical item 4. Results 4.1 An overview of regionally specific clusters 4.2 Types of variation captured by the analysis 4.2.1 True positives A clear-cut distinction A subtler distinction 4.2.2 False positives Cultural effects Proper names French homographs in codeswitched tweets Structural patterns affecting model performance 4.3 Deploying coarsely annotated data for linguistic description 5. Discussion and conclusion Funding References Subject index