ورود به حساب

نام کاربری گذرواژه

گذرواژه را فراموش کردید؟ کلیک کنید

حساب کاربری ندارید؟ ساخت حساب

ساخت حساب کاربری

نام نام کاربری ایمیل شماره موبایل گذرواژه

برای ارتباط با ما می توانید از طریق شماره موبایل زیر از طریق تماس و پیامک با ما در ارتباط باشید


09117307688
09117179751

در صورت عدم پاسخ گویی از طریق پیامک با پشتیبان در ارتباط باشید

دسترسی نامحدود

برای کاربرانی که ثبت نام کرده اند

ضمانت بازگشت وجه

درصورت عدم همخوانی توضیحات با کتاب

پشتیبانی

از ساعت 7 صبح تا 10 شب

دانلود کتاب Pentaho 3.2 Data Integration: Beginners Guide

دانلود کتاب پنتاهو 3.2 یکپارچه سازی داده ها: راهنمای مبتدیان

Pentaho 3.2 Data Integration: Beginners Guide

مشخصات کتاب

Pentaho 3.2 Data Integration: Beginners Guide

ویرایش:  
نویسندگان:   
سری:  
ISBN (شابک) : 1847199542 
ناشر: Packt Publishing 
سال نشر: 2010 
تعداد صفحات: 493 
زبان: English 
فرمت فایل : PDF (درصورت درخواست کاربر به PDF، EPUB یا AZW3 تبدیل می شود) 
حجم فایل: 14 مگابایت 

قیمت کتاب (تومان) : 50,000



ثبت امتیاز به این کتاب

میانگین امتیاز به این کتاب :
       تعداد امتیاز دهندگان : 9


در صورت تبدیل فایل کتاب Pentaho 3.2 Data Integration: Beginners Guide به فرمت های PDF، EPUB، AZW3، MOBI و یا DJVU می توانید به پشتیبان اطلاع دهید تا فایل مورد نظر را تبدیل نمایند.

توجه داشته باشید کتاب پنتاهو 3.2 یکپارچه سازی داده ها: راهنمای مبتدیان نسخه زبان اصلی می باشد و کتاب ترجمه شده به فارسی نمی باشد. وبسایت اینترنشنال لایبرری ارائه دهنده کتاب های زبان اصلی می باشد و هیچ گونه کتاب ترجمه شده یا نوشته شده به فارسی را ارائه نمی دهد.


توضیحاتی در مورد کتاب پنتاهو 3.2 یکپارچه سازی داده ها: راهنمای مبتدیان

یکپارچه سازی داده پنتاهو (با نام مستعار کتری) یک راه حل ETL (Extract, Transform, and Load) منبع باز با امکانات کامل است. اگرچه PDI یک ابزار غنی از ویژگی است، اما به طور موثر ضبط، دستکاری، پاکسازی، انتقال و بارگذاری داده ها می تواند پیچیده شود. این کتاب پر از مثال های عملی است که به شما کمک می کند تا از مزایای گرافیکی، کشیدن و رها کردن Pentaho Data Integration استفاده کنید. محیط طراحی با پیروی از راهنمای گام به گام این کتاب، به سرعت با Pentaho Data Integration شروع خواهید کرد. نکات مفید این کتاب شما را تشویق می کند تا از ویژگی های قدرتمند Pentaho Data Integration استفاده کنید و عملیات ETL را به راحتی انجام دهید. با شروع نصب نرم افزار PDI، این کتاب تمام مفاهیم کلیدی PDI را به شما آموزش می دهد. هر فصل ویژگی‌های جدیدی را معرفی می‌کند که به شما امکان می‌دهد به تدریج با ابزار درگیر شوید. ابتدا کار با فایل های ساده و انجام انواع دستکاری داده ها را یاد خواهید گرفت. سپس، این کتاب به شما یک پرایمر در مورد پایگاه داده می دهد و به شما یاد می دهد که چگونه با پایگاه های داده داخل PDI کار کنید. نه تنها این، به شما مقدمه ای با مفاهیم انبار داده داده می شود و یاد خواهید گرفت که داده ها را در یک انبار داده بارگیری کنید. پس از آن، شما یاد خواهید گرفت که فرآیندهای ساده و پیچیده را پیاده سازی کنید. هنگامی که تمام اصول اولیه را یاد گرفتید، یک datamart ساده می سازید که برای تقویت تمام مفاهیم آموخته شده از طریق کتاب مفید است. داده ها را با سهولت با Pentaho Data Integration از ابتدا شروع کنید. عملیات تبدیل داده های خود را با جاسازی کد جاوا و j#097;vascript در تبدیل PDI غنی کنید. یک پروژه Datamart ساده اما کامل ایجاد کنید که تمام ویژگی های کلیدی PDI را پوشش می دهد. بخشی از Packt's Beginner's سری راهنما: هر کار به تدریج از کار قبلی با یک توالی سازمان یافته از دستورالعمل ها همراه با توضیحات مرتبط و مجموعه ای از وظایف چالش برانگیز ایجاد می شود که خواننده قادر به انجام آنها خواهد بود. آنچه از این کتاب یاد خواهید گرفت Penataho Data Integration را نصب کنید و با آن آشنا شوید. طراح گرافیک-SpoonWork با فایل‌ها برای دریافت داده‌ها از منابع ورودی ساده، پیش‌نمایش و ارسال مجدد آن در هر یک از فرمت‌های خروجی رایج انجام عملیات تبدیل اولیه بر روی داده‌ها مانند انجام محاسبات، افزودن ثابت‌ها، شمارش، فیلتر کردن، مرتب‌سازی، و جستجوی داده‌Solve مشکلات دنیای واقعی با دستکاری جریان داده با ترکیب یا تقسیم آن حل مشکلات پیچیده مانند عادی سازی داده ها از جداول محوری با سهولت گزینه های مختلف PDI را برای اعتبارسنجی داده ها و رسیدگی به خطاها کاوش کنید. برای دریافت و ذخیره اطلاعات دریافتی به موتور پایگاه داده انتخابی خود متصل شوید از هر منبعی انجام عملیات پیشرفته با پایگاه‌های داده مانند بارگیری ابعاد انبارهای داده ایجاد فرآیندهای پیشرفته مانند کارهای تودرتو، تکرار در مشاغل و تبدیل‌ها و ایجاد تغییرات فرعی اجرای فرآیندهای تجاری با زمان‌بندی کارها، بررسی شرایط، سازمان‌دهی فایل‌ها و پوشه‌ها، ارسال ایمیل با هشدار و درمان خطاها به گونه ای که نیازهای شما را برآورده کند


توضیحاتی درمورد کتاب به خارجی

Pentaho Data Integration (a.k.a. Kettle) is a full-featured open source ETL (Extract, Transform, and Load) solution. Although PDI is a feature-rich tool, effectively capturing, manipulating, cleansing, transferring, and loading data can get complicated.This book is full of practical examples that will help you to take advantage of Pentaho Data Integration’s graphical, drag-and-drop design environment. You will quickly get started with Pentaho Data Integration by following the step-by-step guidance in this book. The useful tips in this book will encourage you to exploit powerful features of Pentaho Data Integration and perform ETL operations with ease.Starting with the installation of the PDI software, this book will teach you all the key PDI concepts. Each chapter introduces new features, allowing you to gradually get involved with the tool. First, you will learn to work with plain files, and to do all kinds of data manipulation. Then, the book gives you a primer on databases and teaches you how to work with databases inside PDI. Not only that, you’ll be given an introduction to data warehouse concepts and you will learn to load data in a data warehouse. After that, you will learn to implement simple and complex processes.Once you’ve learned all the basics, you will build a simple datamart that will serve to reinforce all the concepts learned through the book.Explore, transform, validate, and integrate your data with easeGet started with Pentaho Data Integration from scratch.Enrich your data transformation operations by embedding Java and j#097;vascript code in PDI transformations.Create a simple but complete Datamart Project that will cover all key features of PDI.Part of Packt’s Beginner’s Guide series: Each task gradually develops from the previous task with an organized sequence of instructions accompanied with relevant explanation and a set of challenging tasks that the reader will be able to accomplish.What you will learn from this bookInstall Penataho Data Integration and get familiar with the graphical designer–SpoonWork with files to get data from simple input sources, preview, and send it back in any of the common output formatsPerform basic transformation operations on data such as performing calculations, adding constants, counting, filtering, ordering, and searching dataSolve real-world problems by manipulating the flow of data by combining or splitting itSolve sophisticated problems such as normalizing data from pivoted tables with easeExplore the various PDI options to validate data and to handle errorsConnect to a database engine of your choice to get and store information coming from any sourcePerform advanced operations with databases such as loading data warehouses dimensionsCreate advanced processes such as nesting jobs, iterating on jobs and transformations, and creating subtransformationsImplement business processes by scheduling tasks, checking conditions, organizing files and folders, sending emails with alerts, and treating errors in a way that meets your requirements



فهرست مطالب

Cover......Page 1
Copyright......Page 3
Credits......Page 4
Foreword......Page 5
The Kettle Project......Page 7
About the Author......Page 10
About the Reviewers......Page 11
Table of Contents......Page 14
Preface......Page 24
Pentaho Data Integration and Pentaho BI Suite......Page 30
Pentaho Data Integration......Page 32
Loading data warehouses or data marts......Page 34
Data cleansing......Page 35
Integrating PDI using Pentaho BI......Page 36
Time for action – installing PDI......Page 37
Time for action – starting and customizing Spoon......Page 38
Setting preferences in the Options window......Page 41
Storing transformations and jobs in a repository......Page 42
Time for action – creating a hello world transformation......Page 43
Directing the Kettle engine with transformations......Page 48
Exploring the Spoon interface......Page 49
transformation......Page 50
Time for action – installing MySQL on Windows......Page 52
Time for action – installing MySQL on Ubuntu......Page 55
Summary......Page 57
Reading data from files......Page 58
Time for action – reading results of football matches from files......Page 59
Input steps......Page 64
Text file input step......Page 65
Text file input step and regular expressions......Page 66
Regular expressions......Page 67
Grids......Page 69
Time for action – sending the results of matches to a plain file......Page 70
Output files......Page 72
Rowset......Page 73
Streams......Page 74
Getting system information......Page 75
Time for action – updating a file with news about examinations......Page 76
Getting information by using Get System Info step......Page 80
Date fields......Page 81
Numeric fields......Page 82
a terminal window......Page 83
about countries......Page 85
What is XML......Page 90
XPath......Page 91
Configuring the Get data from XML step......Page 92
How and when you can use variables......Page 93
Summary......Page 95
Basic calculations......Page 96
Calculator step......Page 97
Adding or modifying fields by using different PDI steps......Page 105
The Calculator step......Page 106
Formula step......Page 107
Calculations on groups of rows......Page 111
grouping data......Page 112
Group by step......Page 117
Time for action – counting frequent words by filtering......Page 120
Filtering rows using the Filter rows step......Page 126
Time for action – finding out which language people speak......Page 128
The Stream lookup step......Page 132
Summary......Page 135
Splitting streams......Page 136
a dataset......Page 137
Copying rows......Page 142
Distributing rows......Page 143
Time for action – assigning tasks by distributing......Page 144
Splitting the stream based on conditions......Page 148
Filter rows step......Page 149
PDI steps for splitting the stream based on conditions......Page 151
Switch/ Case step......Page 152
Merging streams......Page 154
Time for action – gathering progress and merging all together......Page 155
PDI options for merging streams......Page 157
Append Stream......Page 160
Summary......Page 162
Doing simple tasks with the JavaScript step......Page 164
Time for action – calculating scores with JavaScript......Page 165
Using the JavaScript language in PDI......Page 170
Inserting JavaScript code using the Modified Java Script Value step......Page 171
Modifying fields......Page 173
Testing your code......Page 174
Time for action – testing the calculation of averages......Page 175
Testing the script using the Test script button......Page 176
Time for action – calculating flexible scores by using variables......Page 177
Using named parameters......Page 181
Using transformation predefined constants......Page 182
JavaScript......Page 185
Looking at previous rows......Page 187
Avoiding coding by using purpose-built steps......Page 188
Summary......Page 190
Converting rows to columns......Page 192
rows to columns......Page 193
Converting row data to column data by using the Row denormalizer step......Page 196
Aggregating data with a Row denormalizer step......Page 199
by country......Page 200
Using Row denormalizer for aggregating data......Page 201
the dataset......Page 203
Modifying the dataset with a Row Normalizer step......Page 205
Summarizing the PDI steps that operate on sets of rows......Page 207
Generating a custom time dimension dataset by using Kettle variables......Page 209
Time for action – creating the time dimension dataset......Page 210
Getting variables......Page 214
starting date......Page 215
Using the Get Variables step......Page 216
Summary......Page 217
Capturing errors......Page 218
of a film......Page 219
Using PDI error handling functionality......Page 223
Aborting a transformation......Page 224
Time for action – aborting when there are too many errors......Page 225
Time for action – treating errors that may appear......Page 226
Treating rows coming to the error stream......Page 228
Time for action – validating genres with a Regex Evaluation step......Page 229
Validating data......Page 231
Time for action – checking films file with the Data Validator......Page 232
Defining simple validation rules using the Data Validator......Page 234
Cleansing data......Page 236
Summary......Page 238
Introducing the Steel Wheels sample database......Page 240
database......Page 242
Connecting with Relational Database Management Systems......Page 245
Exploring the Steel Wheels database......Page 246
Time for action – exploring the sample database......Page 247
A brief word about SQL......Page 248
Exploring any configured database with the PDI Database explorer......Page 251
Time for action – getting data about shipped orders......Page 252
Getting data from the database with the Table input step......Page 254
Using the SELECT statement for generating a new dataset......Page 255
parameters......Page 257
Making flexible queries by using Kettle variables......Page 259
variables......Page 260
Time for action – loading a table with a list of manufacturers......Page 262
Inserting new data into a database table with the Table output step......Page 268
existent ones......Page 269
Time for action – testing the update of existing products......Page 272
Inserting or updating data with the Insert/Update step......Page 274
Time for action – deleting data about discontinued items......Page 279
Deleting records of a database table with the Delete step......Page 282
Summary......Page 283
Time for action – populating the Jigsaw database......Page 284
Exploring the Jigsaw database model......Page 287
of products to buy......Page 289
Looking up values in a database with the Database lookup step......Page 291
suggested products to buy......Page 293
Joining data from the database to the stream data by using a Database join step......Page 295
Introducing dimensional modeling......Page 298
Combination lookup/update step......Page 299
region dimension......Page 302
Describing data with dimensions......Page 304
Loading Type I SCD with a Combination lookup/update step......Page 305
Dimension lookup/update step......Page 309
of product changes......Page 311
Keeping an entire history of data with a Type II slowly changing dimension......Page 312
Loading Type II SCDs with the Dimension lookup/update step......Page 314
Summary......Page 319
Introducing PDI jobs......Page 320
Time for action – creating a simple hello world job......Page 321
Executing processes with PDI jobs......Page 328
Using Spoon to design and run jobs......Page 329
Using the transformation job entry......Page 330
arguments and parameters......Page 332
Running jobs from a terminal window......Page 335
window......Page 336
Using named parameters and command-line arguments in transformations......Page 337
fixed arguments and parameters......Page 338
Deciding between the use of a command-line argument and a named parameter......Page 340
administrator if something is wrong......Page 341
Changing the flow of execution on the basis of conditions......Page 347
Creating and using a file results list......Page 349
Summary......Page 350
Enhancing your processes with the use of variables......Page 352
by setting a variable with the name of the file......Page 353
Setting variables inside a transformation......Page 358
Time for action – generating files with top scores......Page 360
subtransformation......Page 364
Creating and using subtransformations......Page 368
copying and getting rows......Page 371
Transferring data between transformations by using the copy /get rows mechanism......Page 375
nesting jobs......Page 377
Running a job inside another job with a job entry......Page 378
Understanding the scope of variables......Page 379
Iterating jobs and transformations......Page 380
transformation for every input row......Page 381
Executing for each row......Page 384
Summary......Page 389
Exploring the sales datamart......Page 390
Loading the dimensions......Page 393
Time for action – loading dimensions for the sales datamart......Page 394
Extending the sales datamart model......Page 399
dimensions......Page 401
Getting the information from the source with SQL queries......Page 407
Obtaining the surrogate key for a Type I SCD......Page 411
Obtaining the surrogate key for a Type II SCD......Page 412
Obtaining the surrogate key for the Time dimension......Page 414
obtained from the command line......Page 417
Time for action – loading the sales star......Page 419
Time for action – automating the loading of the sales datamart......Page 422
Summary......Page 426
PDI best practices......Page 428
Extending Kettle with plugins......Page 431
Overcoming real world risks with some remote execution......Page 433
Scaling out to overcome bigger risks......Page 434
PDI as a process action......Page 435
PDI as a datasource......Page 436
More about the Pentaho suite......Page 437
PDI Enterprise Edition and Kettle Developer Support......Page 438
Summary......Page 439
Appendix A: Working with Repositories......Page 440
Time for action – creating a PDI repository......Page 441
Creating repositories to store your transformations and jobs......Page 443
Time for action – logging into a repository......Page 444
Defining repository user accounts......Page 445
Creating transformations and jobs in repository folders......Page 446
Examining and modifying the contents of a repository with the Repository explorer......Page 447
Migrating from a file-based system to a repository-based system and vice-versa......Page 449
Summary......Page 450
Running transformations and jobs stored in files......Page 452
Running transformations and jobs from a repository......Page 453
Specifying command line options......Page 454
Providing options when running Pan and Kitchen......Page 455
Variables......Page 456
Appendix C: Quick Reference: Steps and Job Entries......Page 458
Transformation steps......Page 459
Job entries......Page 463
General shortcuts......Page 466
Designing transformations and jobs......Page 467
Repositories......Page 468
Experiencing the mouse-over assistance......Page 470
Using the mouse-over assistance toolbar......Page 471
Experiencing the job drill-down feature......Page 472
Summary......Page 473
PDI basics......Page 474
splitting a stream......Page 475
PDI error handling......Page 476
loading slowly changing dimensions......Page 477
deciding the scope of variables......Page 478
remote execution and clustering......Page 479
Index......Page 480




نظرات کاربران