در صورت تبدیل فایل کتاب New Fundamental Technologies in Data Mining به فرمت های PDF، EPUB، AZW3، MOBI و یا DJVU می توانید به پشتیبان اطلاع دهید تا فایل مورد نظر را تبدیل نمایند.
توجه داشته باشید کتاب فن آوری های جدید بنیادی در داده کاوی نسخه زبان اصلی می باشد و کتاب ترجمه شده به فارسی نمی باشد. وبسایت اینترنشنال لایبرری ارائه دهنده کتاب های زبان اصلی می باشد و هیچ گونه کتاب ترجمه شده یا نوشته شده به فارسی را ارائه نمی دهد.
Издательство InTech, 2011, -596 pp.
داده کاوی، شاخه ای از
علوم کامپیوتر و هوش مصنوعی، فرآیند استخراج الگوها از داده ها
است. داده کاوی به عنوان یک ابزار مهم فزاینده برای تبدیل حجم
عظیمی از داده ها به یک فرم دانش و مزیت اطلاعاتی در نظر گرفته می
شود. با انعکاس این مفهوم سازی، مردم داده کاوی را تنها یک مرحله
از یک فرآیند بزرگتر به نام کشف دانش در پایگاه های داده (KDD) می
دانند. داده کاوی در حال حاضر در طیف گسترده ای از شیوه ها از کسب
و کار تا کشف علمی استفاده می شود. پیشرفت فناوری داده کاوی و
محبوبیت زیاد عمومی نیاز به یک متن جامع در مورد این موضوع را
ایجاد می کند. مجموعه کتابهای تحت عنوان «داده کاوی» با ارائه
توضیحاتی عمیق در مورد الگوریتمهای جدید کاوی و بسیاری از
کاربردهای مفید، به این نیاز میپردازد.
کتاب اول (تکنولوژیهای بنیادی جدید در دادهکاوی) در دو بخش
تنظیم شده است. بخش اول سیستم های مدیریت پایگاه داده (DBMS) را
ارائه می کند. قبل از اینکه بتوان از الگوریتم های داده کاوی
استفاده کرد، یک مجموعه داده هدف باید مونتاژ شود. از آنجایی که
داده کاوی فقط می تواند الگوهای موجود در داده ها را کشف کند،
مجموعه داده هدف باید به اندازه کافی بزرگ باشد که این الگوها را
در خود جای دهد. برای این منظور، برخی از DBMS های منحصر به فرد
در دهه های گذشته توسعه یافته اند. آنها متشکل از نرم افزارهایی
هستند که پایگاه های داده را اجرا می کند، ذخیره سازی، دسترسی،
امنیت، پشتیبان گیری و سایر امکانات را فراهم می کند. DBMS را می
توان بر اساس مدل پایگاه داده ای که پشتیبانی می کند، مانند رابطه
ای یا XML، انواع رایانه هایی که پشتیبانی می کنند، مانند خوشه
سرور یا تلفن همراه، زبان های جستجویی که به پایگاه داده دسترسی
دارند، مانند SQL یا XQuery، دسته بندی کرد. معاوضه عملکرد، مانند
حداکثر مقیاس یا حداکثر سرعت یا موارد دیگر.
بخش دوم مبتنی بر توضیح تکنیکهای جدید تجزیه و تحلیل دادهها
است. داده کاوی شامل استفاده از تکنیک های پیچیده تجزیه و تحلیل
داده ها برای کشف روابط در مجموعه داده های بزرگ است. به طور کلی،
آنها معمولاً شامل چهار دسته از وظایف هستند: (1) خوشهبندی وظیفه
کشف گروهها و ساختارهایی در دادهها است که به نوعی مشابه هستند
بدون استفاده از ساختارهای شناخته شده در دادهها. ابزارهای تجسم
داده ها پس از انجام عملیات خوشه بندی دنبال می شوند. (2) طبقه
بندی وظیفه تعمیم ساختار شناخته شده برای اعمال به داده های جدید
است. (3) رگرسیون تلاش می کند تابعی را پیدا کند که داده ها را با
کمترین خطا مدل می کند. (4) قوانین انجمن روابط بین متغیرها را
جستجو می کند.
کتاب دوم (کاربردهای دانش محور در داده کاوی) بر اساس معرفی چندین
کاربرد علمی با استفاده از داده کاوی است. داده کاوی برای اهداف
مختلفی در بخش خصوصی و عمومی استفاده می شود. صنایعی مانند
بانکداری، بیمه، پزشکی و خرده فروشی از داده کاوی برای کاهش هزینه
ها، افزایش تحقیقات و افزایش فروش استفاده می کنند. به عنوان
مثال، شرکت های داروسازی از داده کاوی ترکیبات شیمیایی و مواد
ژنتیکی برای کمک به تحقیقات در مورد درمان های جدید برای بیماری
ها استفاده می کنند. در بخش عمومی، برنامه های کاربردی داده کاوی
در ابتدا به عنوان ابزاری برای شناسایی تقلب و ضایعات مورد
استفاده قرار می گرفتند، اما برای اهدافی مانند اندازه گیری و
بهبود عملکرد برنامه نیز استفاده می شوند. گزارش شده است که داده
کاوی به دولت فدرال کمک کرده است تا میلیون ها دلار از پرداخت های
متقلبانه Medicare را بازیابی کند.
در داده کاوی، مسائل اجرایی و نظارتی وجود دارد که می تواند بر
موفقیت یک برنامه تأثیر بگذارد. یک موضوع کیفیت داده است که به
صحت و کامل بودن داده ها اشاره دارد. موضوع دوم، قابلیت همکاری
تکنیک های داده کاوی و پایگاه های داده است که توسط افراد مختلف
استفاده می شود. موضوع سوم، خزش ماموریت یا استفاده از داده ها
برای مقاصدی غیر از آن است که داده ها در ابتدا برای آن جمع آوری
شده اند. مسئله چهارم حریم خصوصی است. سؤالاتی که ممکن است در نظر
گرفته شوند عبارتند از درجه ای که سازمان های دولتی باید از داده
های تجاری استفاده کرده و آنها را با داده های دولتی ترکیب کنند،
اینکه آیا منابع داده برای مقاصدی غیر از مواردی که در ابتدا برای
آنها طراحی شده اند استفاده می شود.
علاوه بر درک هر بخش. عمیقاً، این دو کتاب نکات و راهکارهای مفیدی
را برای حل مسائل در فصلهای بعدی ارائه میکنند. نویسندگان
مشارکتکننده، بسیاری از جهتهای تحقیقاتی آینده را برجسته
کردهاند که همکاریهای چند رشتهای را تقویت میکنند و از این رو
منجر به توسعه قابل توجهی در زمینه دادهکاوی میشوند.
Издательство InTech, 2011, -596 pp.
Data mining, a branch of computer
science and artificial intelligence, is the process of
extracting patterns from data. Data mining is seen as an
increasingly important tool to transform a huge amount of data
into a knowledge form giving an informational advantage.
Reflecting this conceptualization, people consider data mining
to be just one step in a larger process known as knowledge
discovery in databases (KDD). Data mining is currently used in
a wide range of practices from business to scientific
discovery. The progress of data mining technology and large
public popularity establish a need for a comprehensive text on
the subject. The series of books entitled by ‘Data Mining’
address the need by presenting in-depth description of novel
mining algorithms and many useful applications.
The first book (New Fundamental Technologies in Data Mining) is
organized into two parts. The first part presents database
management systems (DBMS). Before data mining algorithms can be
used, a target data set must be assembled. As data mining can
only uncover patterns already present in the data, the target
dataset must be large enough to contain these patterns. For
this purpose, some unique DBMS have been developed over past
decades. They consist of software that operates databases,
providing storage, access, security, backup and other
facilities. DBMS can be categorized according to the database
model that they support, such as relational or XML, the types
of computer they support, such as a server cluster or a mobile
phone, the query languages that access the database, such as
SQL or XQuery, performance trade-off s, such as maximum scale
or maximum speed or others.
The second part is based on explaining new data analysis
techniques. Data mining involves the use of sophisticated data
analysis techniques to discover relationships in large data
sets. In general, they commonly involve four classes of tasks:
(1) Clustering is the task of discovering groups and structures
in the data that are in some way or another similar without
using known structures in the data. Data visualization tools
are followed after making clustering operations. (2)
Classification is the task of generalizing known structure to
apply to new data. (3) Regression attempts to find a function
which models the data with the least error. (4) Association
rule searches for relationships between variables.
The second book (Knowledge-Oriented Applications in Data
Mining) is based on introducing several scientific applications
using data mining. Data mining is used for a variety of
purposes in both private and public sectors. Industries such as
banking, insurance, medicine, and retailing use data mining to
reduce costs, enhance research, and increase sales. For
example, pharmaceutical companies use data mining of chemical
compounds and genetic material to help guide research on new
treatments for diseases. In the public sector, data mining
applications were initially used as a means to detect fraud and
waste, but they have grown also to be used for purposes such as
measuring and improving program performance. It has been
reported that data mining has helped the federal government
recover millions of dollars in fraudulent Medicare
payments.
In data mining, there are implementation and oversight issues
that can influence the success of an application. One issue is
data quality, which refers to the accuracy and completeness of
the data. The second issue is the interoperability of the data
mining techniques and databases being used by different people.
The third issue is mission creep, or the use of data for
purposes other than for which the data were originally
collected. The fourth issue is privacy. Questions that may be
considered include the degree to which government agencies
should use and mix commercial data with government data,
whether data sources are being used for purposes other than
those for which they were originally designed.
In addition to understanding each part deeply, the two books
present useful hints and strategies to solving problems in the
following chapters. The contributing authors have highlighted
many future research directions that will foster
multi-disciplinary collaborations and hence will lead to
significant development in the field of data mining.