دسترسی نامحدود
برای کاربرانی که ثبت نام کرده اند
برای ارتباط با ما می توانید از طریق شماره موبایل زیر از طریق تماس و پیامک با ما در ارتباط باشید
در صورت عدم پاسخ گویی از طریق پیامک با پشتیبان در ارتباط باشید
برای کاربرانی که ثبت نام کرده اند
درصورت عدم همخوانی توضیحات با کتاب
از ساعت 7 صبح تا 10 شب
دسته بندی: شبکه سازی: اینترنت ویرایش: 1 نویسندگان: Soumen Chakrabarti سری: ISBN (شابک) : 9781558607545, 1558607544 ناشر: Morgan Kaufmann سال نشر: 2002 تعداد صفحات: 364 زبان: English فرمت فایل : PDF (درصورت درخواست کاربر به PDF، EPUB یا AZW3 تبدیل می شود) حجم فایل: 2 مگابایت
در صورت تبدیل فایل کتاب Mining the Web: Discovering Knowledge from Hypertext Data به فرمت های PDF، EPUB، AZW3، MOBI و یا DJVU می توانید به پشتیبان اطلاع دهید تا فایل مورد نظر را تبدیل نمایند.
توجه داشته باشید کتاب معدن وب: کشف دانش از داده های اطلاعات بیش از حد نسخه زبان اصلی می باشد و کتاب ترجمه شده به فارسی نمی باشد. وبسایت اینترنشنال لایبرری ارائه دهنده کتاب های زبان اصلی می باشد و هیچ گونه کتاب ترجمه شده یا نوشته شده به فارسی را ارائه نمی دهد.
من هنوز به آن 5 ستاره دادم، اگرچه شماره صفحه موثر 326 است. عمدتاً 3 بخش در کتاب وجود دارد --- بخش اول 79 صفحه است که شما در ساختار اصلی یک موتور جستجوی وب قدم می زنید، بخش دوم در مورد یادگیری صحبت می کند. فرآیند (خوشه بندی، طبقه بندی و غیره)، بله، می دانم که این موارد مربوط به هوش مصنوعی است، اما این کتاب معادله زیادی ندارد و کاملاً خواندنی است. از صفحه 203 بخش سوم برنامه --- است که شامل رتبه بندی صفحات و موضوعات جالب دیگر است.
I still gave it 5 stars though the effective page number is 326. There are mainly 3 sections in the book --- the first section is 79 pages walks you thru the basic structure of a web search engine, the 2nd one talks about the learning process (clustering, classification and so on), yes, I know it is AI related stuffs, but this book does not have too much equation and is quite readable. From page 203 is the 3rd section --- application which includes page ranking and other interesting topics.
Cover......Page 1
FOREWORD......Page 7
Contents......Page 8
PREFACE......Page 16
1 - Introduction......Page 20
1.1 Crawling and Indexing......Page 25
1.2 Topic Directories......Page 26
1.3 Clustering and Classification......Page 27
1.4 Hyperlink Analysis......Page 28
1.6 Structured vs. Unstructured Data Mining......Page 30
1.7 Bibliographic Notes......Page 32
Part I - Infrastructure......Page 34
2 - Crawling the Web......Page 36
2.1 HTML and HTTP Basics......Page 37
2.2 Crawling Basics......Page 38
2.3 Engineering Large- Scale Crawlers......Page 40
2.4 Putting Together a Crawler......Page 54
2.5 Bibliographic Notes......Page 59
3.1 Boolean Queries and the Inverted Index......Page 64
3.2 Relevance Ranking......Page 72
3.3 Similarity Search......Page 86
3.4 Bibliographic Notes......Page 94
Part II - Learning......Page 96
4 - Similarity and Clustering......Page 98
4.1 Formulations and Approaches......Page 100
4.2 Bottom- Up and Top- Down Partitioning Paradigms......Page 103
4.3 Clustering and Visualization via Embeddings......Page 108
4.4 Probabilistic Approaches to Clustering......Page 118
4.5 Collaborative Filtering......Page 134
4.6 Bibliographic Notes......Page 140
5 - Supervised Learning......Page 144
5.1 The Supervised Learning Scenario......Page 145
5.2 Overview of Classification Strategies......Page 147
5.3 Evaluating Text Classifiers......Page 148
5.4 Nearest Neighbor Learners......Page 152
5.5 Feature Selection......Page 155
5.6 Bayesian Learners......Page 166
5.7 Exploiting Hierarchy among Topics......Page 174
5.8 Maximum Entropy Learners......Page 179
5.9 Discriminative Classification......Page 182
5.10 Hypertext Classification......Page 188
5.11 Bibliographic Notes......Page 192
6 - Semisupervised Learning......Page 196
6.1 Expectation Maximization......Page 197
6.2 Labeling Hypertext Graphs......Page 203
6.3 Co- training......Page 214
6.4 Bibliographic Notes......Page 217
Part III - Applications......Page 220
7 - Social Network Analysis......Page 222
7.1 Social Sciences and Bibliometry......Page 224
7.2 PageRank and HITS......Page 228
7.3 Shortcomings of the Coarse- Grained Graph Model......Page 238
7.4 Enhanced Models and Techniques......Page 244
7.5 Evaluation of Topic Distillation......Page 254
7.6 Measuring and Modeling the Web......Page 262
7.7 Bibliographic Notes......Page 273
8 - Resource Discovery......Page 274
8.1 Collecting Important Pages Preferentially......Page 276
8.2 Similarity Search Using Link Topology......Page 283
8.3 Topical Locality and Focused Crawling......Page 287
8.4 Discovering Communities......Page 303
8.5 Bibliographic Notes......Page 307
9 - The Future of Web Mining......Page 308
9.1 Information Extraction......Page 309
9.2 Natural Language Processing......Page 314
9.3 Question Answering......Page 321
9.4 Profiles, Personalization, and Collaboration......Page 324
REFERENCES......Page 326
INDEX......Page 346