مشخصات کتاب
Intelligent Text Categorization and Clustering
دسته بندی: سایبرنتیک: هوش مصنوعی
ویرایش:
نویسندگان: Nedjah N., Macedo Mourelle L., Kacprzyk J., Franёca F.M.G., Souza A.F. (eds.)
سری:
ناشر:
سال نشر:
تعداد صفحات: 127
زبان: English
فرمت فایل : PDF (درصورت درخواست کاربر به PDF، EPUB یا AZW3 تبدیل می شود)
حجم فایل: 1 مگابایت
قیمت کتاب (تومان) : 52,000
کلمات کلیدی مربوط به کتاب دسته بندی و خوشه بندی هوشمند متن: علوم و مهندسی کامپیوتر، هوش مصنوعی، زبانشناسی محاسباتی
میانگین امتیاز به این کتاب :
تعداد امتیاز دهندگان : 14
در صورت تبدیل فایل کتاب Intelligent Text Categorization and Clustering به فرمت های PDF، EPUB، AZW3، MOBI و یا DJVU می توانید به پشتیبان اطلاع دهید تا فایل مورد نظر را تبدیل نمایند.
توجه داشته باشید کتاب دسته بندی و خوشه بندی هوشمند متن نسخه زبان اصلی می باشد و کتاب ترجمه شده به فارسی نمی باشد. وبسایت اینترنشنال لایبرری ارائه دهنده کتاب های زبان اصلی می باشد و هیچ گونه کتاب ترجمه شده یا نوشته شده به فارسی را ارائه نمی دهد.
توضیحاتی در مورد کتاب دسته بندی و خوشه بندی هوشمند متن
Издательство Springer, 2009, -127 pp.
دسته بندی و خوشه بندی
خودکار متن با افزایش حجم متن در قالب الکترونیک و دسترسی به آن
اهمیت بیشتری پیدا می کند. ضروری تر و گسترده تر می شود. برنامه
های شناخته شده فیلتر هرزنامه و جستجوی وب هستند، اما تعداد زیادی
از کاربردهای روزمره (جستجوی هوشمند وب، داده کاوی، اجرای قانون و
غیره) وجود دارد. ماشینها و شبکههای عصبی به استنتاج بیزی و
روشهای جبری، مانند نمایهسازی معنایی پنهان.
این جلد طیف وسیعی از کارهای تحقیقاتی را ارائه میدهد که برای
دستهبندی و خوشهبندی هوشمند متن توسعه یافتهاند. در ادامه، به
معرفی مختصری از فصول موجود در این کتاب میپردازیم.
در فصل 1، نویسندگان استفاده از تکنیکهای انتخاب ویژگی را برای
تعریف زیرمجموعهای از ژنهای مرتبط با ویژگیهای خاص مانند ایجاد
سرطان ارائه میکنند. . از طریق ترکیب روشهای جستجو و روشهای
ارزیابی، نویسندگان نشان میدهند که الگوریتم دادهکاوی سرعت
میگیرد، عملکرد استخراج مانند دقت پیشبینی بهبود مییابد و درک
نتایج در اکثر ترکیبها آسانتر میشود. نویسندگان بهترین نتایج
را با رویکردهای بسته بندی و جستجوی متوالی به دست آوردند.
در فصل 2، نویسندگان یک تکنیک پیش پردازش جدید برای دست خط آنلاین
پیشنهاد می کنند. روش این است که ابتدا قلابهای ضربهها را با
استفاده از آستانه زاویه تغییر یافته با آستانه طول حذف کنید، سپس
با استفاده از تکنیک صافسازی، که ترکیبی از روشهای مکعبی و
روشهای درونیابی برابر است، نویز را فیلتر کنید. سپس، دستنویس
عادی میشود.
در فصل 3، نویسندگان مجموعهای از اسناد بدون ساختار را بررسی
میکنند. آنها یک روش ساده را بررسی می کنند که نه تنها ابعاد
فضای ویژگی و در نتیجه زمان پردازش را به میزان قابل توجهی کاهش
می دهد، بلکه عملکرد خوشه بندی را در صورت مواجهه با مجموعه کامل
اصطلاحات قابل مقایسه یا حتی بهتر می کند.
در فصل 4، نویسندگان کاربرد تکنیک گسترش پرس و جو را برای بهبود
بازیابی اطلاعات بین زبانی به زبان انگلیسی و تایلندی و همچنین
پتانسیل استفاده از این تکنیک در سایر سیستم های هوشمند مانند
سیستم های تدریس خصوصی را بررسی کنید. به عنوان روشی برای ارزیابی
بسط پرس و جو، آنها تلاش می کنند تا دریابند که آیا عبارت های
توسعه یافته برای جستجو مفید هستند یا خیر.
در فصل 5، نویسندگان یک پارتیشن فازی و یک نمونه اولیه برای هر
خوشه با بهینه سازی یک معیار وابسته به تابع عدم تشابه انتخاب شده
است. آنها شامل آزمایشهایی میشوند که شامل مجموعههای دادههای
معیار است و به منظور مقایسه دقت هر تابع انجام میشود. به منظور
تجزیه و تحلیل نتایج، آنها از یک معیار خارجی استفاده می کنند که
پارتیشن های مختلف یک مجموعه داده را با هم مقایسه می کند.
در فصل 6، نویسندگان سیستمی را برای تجزیه و تحلیل خوشه ای اسناد
فرامتن بر اساس الگوریتم های ژنتیک توصیف می کنند. اثربخشی سیستم
در دریافت گروههایی با اسناد مشابه توسط نتایج تجربی اثبات
میشود.
انتخاب ژن از دادههای
ریزآرایه
تکنیکهای پیشپردازش برای تشخیص آنلاین دستنویس
یک روش ساده و سریع انتخاب برای خوشه بندی متن
موتور جستجوی دوزبانه و سیستم آموزشی تکمیل شده با بسط پرس و
جو
مقایسه خوشه بندی بر روی داده های نمادین
کاوش در الگوریتم ژنتیک برای خوشه بندی اسناد فرامتن
توضیحاتی درمورد کتاب به خارجی
Издательство Springer, 2009, -127 pp.
Automatic Text Categorization and
Clustering are becoming more and more important as the amount
of text in electronic format grows and the access to it becomes
more necessary and widespread. Well known applications are spam
filtering and web search, but a large number of everyday uses
exist (intelligent web search, data mining, law enforcement,
etc.) Currently, researchers are employing many intelligent
techniques for text categorization and clustering, ranging from
support vector machines and neural networks to Bayesian
inference and algebraic methods, such as Latent Semantic
Indexing.
This volume offers a wide spectrum of research work developed
for intelligent text categorization and clustering. In the
following, we give a brief introduction of the chapters that
are included in this book.
In Chapter 1, the authors present the use of attribute
selection techniques to define a subset of genes related to
specific characteristics such as cancer arising. Through
combination of search methods and evaluation procedures, the
authors show that the data mining algorithm speeds up, mining
performance such as predictive accuracy is improved and the
comprehensibility of the results becomes easier in most of the
combinations. The authors obtained best results with wrapper
approaches and sequential search.
In Chapter 2, the authors propose a new preprocessing technique
for online handwriting. The approach is to first remove the
hooks of the strokes by using changed-angle threshold with
length threshold, then filter the noise by using a smoothing
technique, which is the combination of the Cubic Spline and the
equal-interpolation methods. Then, the handwriting is
normalised.
In Chapter 3, the authors explore clustering of unstructured
document collection. They explore a simple procedure that not
only considerably reduces the dimension of the feature space
and hence the processing time, but also produces clustering
performance comparable or even better when confronted with the
full set of terms.
In Chapter 4, the authors investigate the application of query
expansion technique to improve cross-language information
retrieval in English and Thai as well as the potential to apply
the technique to other intelligent systems such as tutoring
systems. As a method of evaluation of query expansion, they
attempt to find out whether the expanded terms are useful for
the search.
In Chapter 5, the authors provide a fuzzy partition and a
prototype for each cluster by optimizing a criterion dependent
on the dissimilarity function chosen. They include experiments
involving benchmark data sets and carried out in order to
compare the accuracy of each function. In order to analyse the
results, they apply an external criterion that compares
different partitions of a same data set.
In Chapter 6, the authors describe a system for cluster
analysis of hypertext documents based on genetic algorithms.
The system’s effectiveness in getting groups with similar
documents is evidenced by the experimental results.
Gene Selection from Microarray
Data
Preprocessing Techniques for Online Handwriting
Recognition
A Simple and Fast Term Selection Procedure for Text
Clustering
Bilingual Search Engine and Tutoring System Augmented with
Query Expansion
Comparing Clustering on Symbolic Data
Exploring a Genetic Algorithm for Hypertext Documents
Clustering
نظرات کاربران