دسترسی نامحدود
برای کاربرانی که ثبت نام کرده اند
برای ارتباط با ما می توانید از طریق شماره موبایل زیر از طریق تماس و پیامک با ما در ارتباط باشید
در صورت عدم پاسخ گویی از طریق پیامک با پشتیبان در ارتباط باشید
برای کاربرانی که ثبت نام کرده اند
درصورت عدم همخوانی توضیحات با کتاب
از ساعت 7 صبح تا 10 شب
ویرایش:
نویسندگان: D. D. Janke
سری: Studies on the Semantic Web
ISBN (شابک) : 1643680684, 9781643680682
ناشر: IOS Press
سال نشر: 2020
تعداد صفحات: 310
[312]
زبان: English
فرمت فایل : PDF (درصورت درخواست کاربر به PDF، EPUB یا AZW3 تبدیل می شود)
حجم فایل: 4 Mb
در صورت تبدیل فایل کتاب Study on Data Placement Strategies in Distributed RDF Stores به فرمت های PDF، EPUB، AZW3، MOBI و یا DJVU می توانید به پشتیبان اطلاع دهید تا فایل مورد نظر را تبدیل نمایند.
توجه داشته باشید کتاب مطالعه استراتژی های قرار دادن داده ها در فروشگاه های RDF توزیع شده نسخه زبان اصلی می باشد و کتاب ترجمه شده به فارسی نمی باشد. وبسایت اینترنشنال لایبرری ارائه دهنده کتاب های زبان اصلی می باشد و هیچ گونه کتاب ترجمه شده یا نوشته شده به فارسی را ارائه نمی دهد.
تنظیمات توزیع شده ذخیرههای RDF در ابر چالشهای زیادی را به همراه دارد، از جمله نحوه بهینهسازی قرار دادن دادهها در گرههای محاسباتی برای بهبود عملکرد پرس و جو. در این کتاب، یک روش معیار جدید برای استراتژی های قرار دادن داده ها توسعه داده شده است. یکی که با استفاده از یک ذخیرهسازی RDF توزیعشده مستقل از مکانیابی دادهها-استراتژی برای تجزیه و تحلیل تأثیر استراتژیهای قرار دادن دادهها بر عملکرد پرس و جو، بر این محدودیتها غلبه میکند. استراتژیهای قرار دادن دادهها که اغلب استفاده میشوند، ارزیابی شدهاند، و این ارزیابی این باور رایج را که استراتژیهای قرار دادن دادهها که بر محاسبات محلی تأکید دارند، منجر به اجرای سریعتر پرسوجو میشوند، به چالش میکشد. در واقع، نتایج نشان میدهد که پرسوجوهایی با حجم کاری بالا میتوانند در استراتژیهای قرار دادن داده مبتنی بر هش سریعتر از مثلاً پوششهای حداقل لبه برش اجرا شوند. تجزیه و تحلیل اندازهگیریهای اضافی نشان میدهد که موازیسازی عمودی (یعنی یک بار کاری به خوبی توزیع شده) ممکن است برای پردازش کارآمد پرس و جو از مهار افقی (یعنی حداقل انتقال داده) مهمتر باشد. دو چنین استراتژی قرار دادن داده پیشنهاد شده است: اولی، که در ادبیات یافت می شود، تحت عنوان پوشش حداقل لبه برش بیش از حد تقسیم شده، و دوم پوشش هش مولکول جدید توسعه یافته است. ارزیابی یک حجم کار پرس و جو متعادل و یک محدودیت افقی بالا را نشان داد که منجر به موازی سازی عمودی بالا می شود. در نتیجه، این استراتژیها عملکرد پرس و جو بهتری را نسبت به سایر استراتژیهای قرار دادن دادههای پرکاربرد نشان دادند. این کتاب همچنین این فرضیه را آزمایش میکند که قرار دادن مجموعههای سهگانه کوچک متصل در یک گره محاسباتی در حالی که متعادل کردن مقدار سهگانههای ذخیرهشده در گرههای محاسباتی مختلف منجر به موازیسازی عمودی بالایی میشود.
The distributed setting of RDF stores in the cloud poses many challenges, including how to optimize data placement on the compute nodes to improve query performance. In this book, a novel benchmarking methodology is developed for data placement strategies; one that overcomes these limitations by using a data-placement-strategy-independent distributed RDF store to analyze the effect of the data placement strategies on query performance. Frequently used data placement strategies have been evaluated, and this evaluation challenges the commonly held belief that data placement strategies which emphasize local computation lead to faster query executions. Indeed, results indicate that queries with a high workload can be executed faster on hash-based data placement strategies than on, for example, minimal edge-cut covers. The analysis of additional measurements indicates that vertical parallelization (i.e., a well-distributed workload) may be more important than horizontal containment (i.e., minimal data transport) for efficient query processing. Two such data placement strategies are proposed: the first, found in the literature, is entitled overpartitioned minimal edge-cut cover, and the second is the newly developed molecule hash cover. Evaluation revealed a balanced query workload and a high horizontal containment, which lead to a high vertical parallelization. As a result, these strategies demonstrated better query performance than other frequently used data placement strategies. The book also tests the hypothesis that collocating small connected triple sets on the same compute node while balancing the amount of triples stored on the different compute nodes leads to a high vertical parallelization.
Title Page Contents Introduction Research Questions Research Contributions Foundations Formalization of Graph Cover Strategies and SPARQL Architectures Indices Distributed Query Processing Strategies Fault Tolerance Further Challenges Related Work Graph Cover Strategies Evaluation Methodologies Methodology for Benchmarking Graph Cover Strategies Evaluation Measures Data Set and Queries Query Execution Strategies Distributed RDF Store for Arbitrary Graph Covers Evaluation of Common Graph Cover Strategies Experimental Setup Results Lessons Learned Discussion Combining the Benefits of Graph Clustering and Hash Partitioning Proposed Graph Cover Strategies Experimental Setup Results Lessons Learned Discussion Conclusion Distributed Query Execution Examples Example of Query Execution without Replication Example of Query Execution with Replication Proof of Semantic Correctness and Completeness of Koral's Distributed Query Execution Strategy Proof of Semantic Correctness and Completeness for the Distributed Query Execution Strategy Ignoring Triple Replication Proof of Knows Lemma Proof of Semantic Correctness and Completeness for the Distributed Query Execution Strategy With Triple Replication Proof of Unique Knows Theorem Proof of Similarity of the Replication-Aware Extension Additional Evaluation Details Characteristics of the Used Data Sets Generated Queries Query Execution Times Bibliography