A new information theory based algorithm for clustering categorical data
Tác giả: Do Si Truong, Lam Thanh Hien, Nguyen Thanh TungTóm tắt:
In this paper, we review two baseline algorithms for use with categorical data, namely Min-Min Roughness (MMR) and Mean Gain Ratio (MGR), and propose a new algorithm, called Minimum Mean Normalized Variation of Information (MMNVI). MMNVI algorithm uses the Mean Normalized Variation of Information of one attribute concerning another for finding the best clustering attribute, and the entropy of equivalence classes generated by the selected clustering attribute for binary splitting the clustering dataset. Experimental results on real datasets from UCI indicate that the MMNVI algorithm can be used successfully in clustering categorical data. It produces better or equivalent clustering results than the baseline algorithms.
- Nghiên cứu ứng dụng hỗn hợp xỉ than, tro bay có gia cố xi măng làm lớp đáy móng trong kết cấu nền - mặt đường ô tô bằng phương pháp thí nghiệm
- Thiết kế chiếu sáng trong công trình kết cấu gỗ truyền thống : tôn vinh vẻ đẹp văn hóa và di sản
- Vẽ phác thảo - hình ảnh phản chiếu tư duy - quan điểm nhà thiết kế
- Đặc điểm kiến trúc hội quán của người Hoa tại khu phố cổ Hà Nội
- Nghiên cứu phát triển vật liệu không nung không cần xi măng - gạch lát vỉa hè từ vật liệu geopolymer