A new information theory based algorithm for clustering categorical data
Tác giả: Do Si Truong, Lam Thanh Hien, Nguyen Thanh TungTóm tắt:
In this paper, we review two baseline algorithms for use with categorical data, namely Min-Min Roughness (MMR) and Mean Gain Ratio (MGR), and propose a new algorithm, called Minimum Mean Normalized Variation of Information (MMNVI). MMNVI algorithm uses the Mean Normalized Variation of Information of one attribute concerning another for finding the best clustering attribute, and the entropy of equivalence classes generated by the selected clustering attribute for binary splitting the clustering dataset. Experimental results on real datasets from UCI indicate that the MMNVI algorithm can be used successfully in clustering categorical data. It produces better or equivalent clustering results than the baseline algorithms.
- Ca bệnh hiếm gặp annulaire elastolytic giant cell granuloma : phát hiện mới trên lâm sàng và cơ chế bệnh sinh
- Kết quả điều trị nám má bằng Laser Picosecond YAG 1064 nm tại Bệnh viện Da Liễu Hà Nộ
- Đánh giá kết quả phẫu thuật cholesteatoma bẩm sinh tai giữa giai đoạn potsic III
- Đặc điểm lâm sàng, cận lâm sàng và kết quả sớm phẫu thuật u mô đệm dạ dày tại Bệnh viện Hữu Nghị Việt Đức
- Kết quả tạo hình thân đốt sống bằng bơm cement sinh học có bóng qua cuống ở bệnh nhân xẹp đốt sống do loãng xương tại Bệnh viện Hữu Nghị





